Amazon SageMaker Ground Truth は、機械学習のためのトレーニングデータセットを構築するのに役立ちます。Ground Truth は、ワークフローと呼ばれるプロセスで、ラベル付けを行う人間の作業者をステップごとに誘導することによって、コンテンツ (画像、音声、テキストなど) にラベルを付けます。次の 3 つのグループの作業者が、こうしたワークフローを使用してラベル付けを行うことができます。Amazon Mechanical Turk からの作業者、自社の従業員、サードパーティのベンダー。また、Ground Truth は、これらのラベルから学習し、対象物に自動的にラベルを付けることもできます。 

Ground Truth によって自動的にラベル付けされるか、人間の作業者によってラベル付けされるかにかかわらず、それぞれのラベル付き対象物 (画像、音声録音、テキストのセクションなど) に対して支払うことになります。ベンダーまたは Mechanical Turk を利用してラベル付けを行う場合は、ラベル付き対象物ごとに追加費用を支払う必要があります。ラベル付けに自社の従業員を使用する場合、ラベル付き対象物ごとの追加費用はかかりません。 

料金詳細

Amazon Mechanical Turk でラベル付けを行うための組み込みワークフローの料金

ベンダーを使用する場合、ラベルごとのコストがベンダーごとに設定されます。各ベンダーの料金の詳細は、AWS Marketplace で確認できます。ラベル付けに Amazon Mechanical Turk を使用する場合、ラベル付け作業者ごとに対象物ごとに課金されます。ラベルの精度を向上させるには、対象物ごとに複数のラベル付け作業者を使用することをお勧めします。 

無料利用枠

AWS 無料利用枠の一環として、Amazon SageMaker Ground Truth の使用を無料で開始できます。Amazon SageMaker を初めて使用してから最初の 2 ヶ月間、毎月最初の 500 の対象物は無料です (ラベル付けのベンダーまたは Amazon Mechanical Turk を使用した場合の追加費用を除く)。

料金の例

人間によるラベル付けに自社の従業員を使用

製造企業は、機械学習を使用して自社製品の画像を分類します。モデルをトレーニングするために、製品名で 40,000 枚の画像にラベルを付けます。画像分類向けに組み込まれたワークフローを使用して、従業員が 40,000 枚の画像のすべてにラベルを付けます。

同社では社内従業員を使用していたため、人間がラベルを付けた 40,000 枚の画像の費用は、1 画像あたり同じ 0.08 USD です。

合計コスト = 40,000 人間がラベルを付けた画像 x 0.08 USD/1 画像 = 3,200 USD

カスタムワークフローでの人間によるラベル付けのための Mechanical Turk の使用

広告会社は機械学習を使用して、ソーシャルメディア投稿の感情とコンテンツの両方を判断しています。同社のモデルをトレーニングするために、同社は 85,000 件の投稿にラベルを付ける必要があると判断しています。カスタムワークフローを構築してアップロードし、0.36 USD の支払いを設定することを決めました。また、ラベルの精度を上げるために、各投稿に 3 回ラベルを付けることにしました。SageMaker Ground Truth を使用して、人間が 85,000 件の投稿にラベルを付けます。

同社では Mechanical Turk を使用していたため、カスタムワークフローには、作業者に支払うために人間がラベルを付けた投稿ごとに 0.36 USD の追加料金が含まれていました。

合計コスト = (50,000 x 0.08 USD/1 記事) + (35,000 件の投稿 x 0.04 USD/1 投稿) + (85,000 件の人間がラベルを付けた投稿 x 0.012 USD/1 投稿 x 3 人の作業者/1 対象物) = 8,460 USD

組み込みのワークフローによる人間によるラベル付けのための Mechanical Turk の使用

出版会社は、機械学習を使って自然言語処理アプリケーションを構築し、新聞記事を分類します。モデルをトレーニングするために、200,000 件の記事にラベルを付けます。同社は、組み込みのテキスト分類ワークフローを選択し、ラベルの精度を向上させるために各記事を 3 回ラベル付けすることに決めました。SageMaker Ground Truth を使用して、人間が 40,000 件の記事をラベル付けし、160,000 件は自動的にラベルを付けます。

同社は Mechanical Turk を使用していたため、テキスト分類のワークフローには、作業者がラベルを付けた記事ごとに 0.012 USD の追加料金が含まれていました。

合計コスト = (50,000 x 0.08 USD/1 記事) + (150,000 記事 x 0.04 USD/1 記事) + (40,000 件の作業者がラベルを付けた記事 x 0.012 USD/1 記事 x 3 人の作業者/1 対象物) + Amazon SageMaker のトレーニングと推論コスト** = 11,440 USD + Amazon SageMaker のトレーニングと推論コスト**

**これらのコストはさまざまな要因によって異なります。そうした要因には、使用するデータセットのタイプ、ラベル付けタスクのタイプ、データセットの画像の解像度などがあります。

料金に関するその他のリソース

TCO 計算ツール

総所有コスト (TCO) を計算

簡易見積りツール

AWS の月額料金を簡単に計算

エコノミクスリソースセンター

AWS に切り替えるための追加のリソース

Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon SageMaker Ground Truth のドキュメントを参照してください。

Amazon SageMaker Ground Truth は精度の高い高品質なトレーニングデータセットの構築に役立ち、データのラベル付けコストを最大で 70% 削減できます。

ドキュメントを読む 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Product-Page_Standard-Icons_03_Start-Building_SqInk
コンソールで構築を開始する

AWS マネジメントコンソールから Amazon SageMaker Ground Truth を使った構築を開始しましょう。

サインイン