Amazon Rekognition Custom Labels でモデル精度を向上するための Tips

この記事は Tips to improve your Amazon Rekognition Custom Labels model (記事公開日: 2022 年 9 月 9 日) を翻訳したものです。

この記事は、Amazon Rekognition Custom Labels を使用してコンピュータビジョンモデルの精度を向上するためのベストプラクティスを説明します。Rekognition Custom Labels は、画像分類や物体検出などをユースケースとして、カスタムコンピュータービジョンモデルを構築するフルマネージドサービスです。Rekognition Custom Labels は、Amazon Rekognition に搭載されている、多くのカテゴリにまたがった数千万枚の画像で事前にトレーニングされたモデルを基に構築されています。何千枚もの画像を用意する代わりに、数百枚以下のユースケースに特化した少ないトレーニング画像を使って、利用を開始できます。Rekognition Custom Labels は、モデルの構築に伴う複雑さを軽減できます。例えば、学習データの検査、適切な ML アルゴリズムの選択、インスタンスタイプの選択、様々なハイパーパラメータの学習、そして最適な学習済みモデルの自動的なデプロイなど行う機能があります。また、画像のラベル付け、モデルのトレーニング、モデルのデプロイ、テスト結果の可視化など、ML ワークフロー全体を管理するための使いやすいインターフェースを AWS Management Console で提供します。

Rekognition Custom Labels を利用するにあたって、モデルの精度をより向上したいシチュエーションがあります。モデルの精度に影響を与える重要なポイントを、次に挙げます。

画像のアングル
画像の解像度
画像のアスペクト比
光の当たり具合
背景の明瞭さ・鮮やかさ
カラーコントラスト
サンプルデータのサイズ

この記事ではモデルのパフォーマンスを向上させるために、次に挙げているステップのうち、「ステップ2 : 関連するデータの収集」と「ステップ3 : トレーニングメトリクスの評価」に関するベストプラクティスに焦点を当てます。
次のリストは、本番品質に向けて Rekognition Custom Labels をトレーニングするための一般的なステップです。

分類のレビュー : 画像で分類を行いたい属性や商品などの一覧を定義します。
関連するデータの収集 : これは最も重要なステップで、実際に本番で利用する画像に合わせた形で、事前学習データを収集する必要があります。背景や照明、カメラアングルを変えて、実物の画像を撮影することもあります。そして、収集した画像を分割して、トレーニングデータセットとテストデータセットを作成します。テスト用データセットには、実際に現実世界で撮影した画像を含めた方が良く、人工的に合成して生成された画像は含めない方がよいでしょう。収集したデータのアノテーションは、モデルの性能を左右する重要なものです。バウンディングボックスがオブジェクトの周りに適切に設定され、ラベルが正確であることを確認します。適切なデータセットを構築する際に考慮すべきいくつかのヒントについては、この記事の後半で説明します。
トレーニングメトリクスの評価 : 先ほどのデータセットを使ってモデルを学習し、F1 スコア、精度、リコールなどの学習メトリクスを確認します。トレーニングメトリクスの分析方法については、この記事の後半で詳しく説明します。
モデルの評価 : モデルの精度を評価するために、トレーニングに使用されていない画像セットを利用します。トレーニング用の画像セットは、事前に正解ラベルがわかっているため、モデルの推論結果と比較することでモデルの評価ができます。このステップは、本番環境でモデルが期待通りに動作することを確認するために、常に実行する必要があります。
再トレーニング (Option) : 一般的には、機械学習モデルは、望ましい結果となるように繰り返し学習が行われますが、コンピュータビジョンのモデルも同様です。ステップ 4 の結果を見て、さらに画像を追加する必要があるかどうかを確認し、上記のステップ 3 ～ 5 を繰り返します。

トレーニングメトリクスの評価

F1 スコア、精度、リコール、想定しきい値は、Rekognition Custom Labels を使用したモデルトレーニングの際に自動出力されるメトリクスです。モデルは、提供されたテストデータセットに基づいて、最高の F1 スコアとなるように最適化されます。想定しきい値もまた、テストデータセットに基づいて生成されます。この閾値は、精度やリコールといったビジネス要件に基づいて調整することができます。
想定しきい値は、テスト用データセットに基づいて設定されるため、適切なテスト用データセットは実際の本番ユースケースに合わせる必要があります。テストデータセットが本番ユースケースと乖離がある場合、人為的に高い F1 スコアが出てしまうことや、本番環境でモデル精度が低くなってしまうことがあります。
これらの自動出力されるメトリクスは、モデルを初期評価する際に有用です。一方、モデルの精度について、本番品質を目指す場合は、実際の現実世界に合わせた外部データセット（500～1,000枚の未利用画像）を活用して精度の評価を行うことがお勧めです。実際の画像を利用して評価することで、本番品質で利用できるモデル精度か確認できます。また、テストを通じて欠落したパターンを発見できた場合はモデルを再トレーニングすることで、さらなる改善が出来ます。F1 スコアと外部データセットの間にミスマッチが見られる場合、テストデータが現実世界のユースケースを反映しているかどうかを検証することをお勧めします。

まとめ

この投稿では、Rekognition Custom Labels モデルを改善するためのベストプラクティスを紹介しました。ぜひ、Rekognition Custom Labels の詳細を学び、画像を用意して試してみてください。

筆者
Amit Gupta
Yogesh Chaturvedi
Hao Yang
Pashmeen Mistry

翻訳はソリューションアーキテクトの杉山卓が担当しました。原文はこちらです。

Amazon Web Services ブログ

Amazon Rekognition Custom Labels でモデル精度を向上するための Tips

関連するデータの収集

画像の数

データセット間のバランス

画像の種類を変える

様々な背景

様々な照明条件

様々なアングル

ネガティブラベルを追加する

ラベル混在の対応

データ拡張

トレーニングメトリクスの評価

まとめ

お役立ちリンク

フォローお願いいたします

学ぶ

リソース

デベロッパー

ヘルプ