Amazon SageMaker Ground Truth

Machine Learning を使用して高精度なトレーニングデータセットを構築し、最大で 70% データのラベル付けコストを削減する

Amazon SageMaker Ground Truth により迅速な Machine Learning につながる高精度なトレーニングデータセットを構築するSageMaker Ground Truth では、パブリックおよびプライベートのラベル作成者に簡単にアクセスが可能で、一般的なラベル付けタスク用の組み込みワークフローとインタフェースを提供しています。さらに、SageMaker Ground Truth の自動ラベル付け機能を活用すれば、ラベル付けコストを最大で 70% 削減できます。この機能では、人間が作成したラベル付けデータを使い Ground Truth をトレーニングして、独立してデータをラベル付けすることを学習させます。

Machine Learning モデル構築の成功は、大量の高品質なトレーニングデータにかかっています。しかし、そのようなモデル構築に必要なトレーニングデータを作成するプロセスは、高価で複雑になり、時間がかかることがあります。現存するモデルの大部分では、Machine Learning モデルが正しい判断を行う方法を学習するために、人間が手動でデータにラベルを付ける必要があります。たとえば、十分な信頼性をもって信号機、停止標識、歩行者などの物体を識別できるコンピュータビジョンシステムを構築するには、数億のビデオフレームからなる数千時間のビデオ録画が必要です。その各フレームには、開発したいモデルで作業を開始する前に、道路、他の車、標識などのすべての重要な要素を人間がラベル付けする必要があります。

Amazon SageMaker Ground Truth を使うと、トレーニング用データセットの作成に必要な時間と労力を大幅に減らすことができるので、コストを削減できます。これは、Machine Learning を使ってデータを自動的にラベル付けすることにより達成できます。このモデルは、人間のラベル作成者が作成したラベルからの学習を継続することによって、時間の経過とともに徐々に改善させていくことができます。

学習内容に基づき、ラベル付けモデルの判断に高い信頼性がある場合は、ラベルは生データに自動的に適用されます。ラベル付けモデルの判断に対する信頼性が低い場合は、そのデータは人間に返されてラベル付けされます。この人間が作成したラベルは、ラベル作成モデルに返して学習と改善のため活用されます。SageMaker Ground Truth は、時間の経過とともにより大量のデータに自動的にラベルを付け、トレーニングデータセットの作成を大幅に高速化させることができます。 

メリット

データのラベル付けコストを最大で 70% 削減する

SageMaker Ground Truth は、Machine Learning モデルを使用して生データに自動的にラベルを付け、手動でラベルを付ける場合の数分の 1 のコストで、迅速に高品質なトレーニングデータセットを作成します。アクティブな学習モデルのラベル付けによる信頼性が低い場合にのみ、データは人間にルーティングされます。この人間がラベル付けしたデータは、学習モデルの機能改善に活用されます。次回のラベルリングでは人間が作業するデータは減少するため、コストが削減されます。 

パブリックおよびプライベートのラベル作成者と連携する

ラベル作成者チームを活用して、ラベル作成リクエストを作成者に直接送ることができます。また、スケールアップの必要がある場合は、Amazon SageMaker の Ground Truth コンソールにオプションが用意されているので、組織外のラベル作成者と連携できます。Amazon Mechanical Turk との統合を介して、50 万人以上のパブリックなラベル作成者にアクセスが可能です。また、データに機密性や特別なスキルがもとめられる場合は、Amazon が事前に審査したプロフェッショナルのラベリング業者を利用することもできます。

正確な結果を迅速に得る

Amazon SageMaker Ground Truth を使い高品質で正確なトレーニングデータセットを構築する機械で生成されたラベリングデータには各ラベルに信頼性スコアが付いた一貫した結果となっているため、このサービスによりラベルの正確性がどのように保たれているかを簡単に確認できます。人間によるラベル付けデータは設定条件に基づいて自動的に採点され、その結果多くのデータが高品質なラベル作成者に送信されて、低品質なラベル作成者の優先度が下がるようになります。

仕組み

Product-Page-Diagram_SamurAI_How-it-works-2
Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon SageMaker Ground Truth の特徴を確認する

Amazon SageMaker Ground Truth が精度の高い高品質なトレーニングデータセットを構築し、データのラベル付けコストを最大で 70% 削減する方法については、ドキュメントを参照してください。

Product-Page_Standard-Icons_02_Sign-Up_SqInk
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Product-Page_Standard-Icons_03_Start-Building_SqInk
AWS コンソールで構築を開始する

AWS マネジメントコンソールから、Amazon SageMaker Ground Truth で構築を開始しましょう。

サインイン