Amazon SageMaker Data Labeling
機械学習モデルのトレーニング向けの高品質データセットを作成
データラベリングワークフォースの選択
データラベリング作業の可視化の向上
高品質なラベル付きデータを迅速に取得
Amazon SageMaker により、画像、テキストファイル、動画などの生データを識別し、有益なラベルを追加し、ラベル付き合成データを生成して、機械学習 (ML) モデル用の高品質のトレーニングデータセットを作成できます。SageMaker には、Amazon SageMaker Ground Truth Plus と Amazon SageMaker Ground Truth の 2 つのオプションがあり、エキスパートによるデータラベリングワークフローの作成および管理の代行や、お客様自身によるデータラベリングワークフローの管理を柔軟に選択することが可能です。
Amazon SageMaker Ground Truth Plus
SageMaker Ground Truth Plus を使用して、ラベリングアプリケーションを構築したり、ラベル付けのための労働力を自ら管理したりすることなく、質の高いトレーニングデータセットを作成することができます。SageMaker Ground Truth Plusを使用して、データラべリングコストを最大 40% 削減。SageMaker Ground Truth Plus は、機械学習タスクのトレーニングを受けたエキスパートワークフォースを提供し、データセキュリティ、プライバシー、コンプライアンスの要件を満たすことができます。データをアップロードするだけで、SageMaker Ground Truth Plus がお客様に代わってデータラベリングワークフローとワークフォースを作成および管理します。Amazon SageMaker Ground Truth
自社のデータラベリングワークフローやワークフォースを柔軟に構築および管理したい場合は、SageMaker Ground Truth を使用できます。SageMaker Ground Truth は、データのラベル付けを簡単に行うことができるデータラベリングサービスで、Amazon Mechanical Turk、サードパーティーベンダー、または独自のプライベートワークフォースを介して人間のアノテーターを使用するオプションを提供します。
また、実世界のデータを手動で収集、ラベル付けすることなく、ラベル付き合成データを生成することができます。SageMaker Ground Truth は、お客様に代わって何十万もの自動ラベル付けされた合成画像を生成することができます。
仕組み
-
SageMaker Ground Truth Plus でデータをラベル付け
-
SageMaker Ground Truth でデータをラベル付け
-
ラベル付けされた合成データの生成
-
特徴の比較
-
SageMaker Ground Truth Plus でデータをラベル付け
-
Amazon SageMaker Ground Truth Plus は、ラベリングアプリケーションを構築したり、ラベル付けのためのワークフォースを管理したりすることなく、質の高いトレーニングデータセットを作成することができます。
-
SageMaker Ground Truth でデータをラベル付け
-
Amazon SageMaker Ground Truth では、お客様独自のデータラベリングワークフローとデータラベリングワークフォースの構築および管理が可能です。
-
ラベル付けされた合成データの生成
-
Amazon SageMaker Ground Truth は、ラベル付けされた合成データの生成に役立ちます。
-
特徴の比較
-
カテゴリ Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus データラベリングワークフロー テキスト、画像、ビデオ、3D 点群を対象とした、カスタムまたは 30 以上の組み込みワークフローを用意しています。データラベリングワークフローとデータラベリングの品質をお客様が管理 テキスト、画像、ビデオ、3D 点群を対象とした、カスタムまたは 30 以上の組み込みワークフローを用意しています。データラベリングワークフローとデータラベリングの品質をお客様が管理 ユーザー データサイエンティストと機械学習エンジニア データサイエンティスト、機械学習エンジニア、データオペレーションマネージャー、プログラムマネージャー 労働力 サードパーティーベンダー、Amazon Mechanical Turk、またはお客様自身のプライベートワークフォースの中からお選びいただけます。 お客様のデータセキュリティ、プライバシー、コンプライアンスの要件を満たすことができるエキスパートワークフォースです。 機械学習ラベリング技術 アクティブ学習 アクティブ学習、事前ラベリング、および機械検証 合成データの生成 サポート対象 サポート対象
利点
トレーニングデータセットの品質向上
Amazon SageMaker のデータラベリング製品は、合成データ生成などの手動によるエラーの発生が少なく、トレーニングデータセットの品質向上に役立つ機械学習ラベリング技術を提供します。Amazon SageMaker Ground Truth Plus は、事前ラベリングのための機械学習モデル、エラーや低品質ラベルを検出するための人間のラベリングの機械検証、および補助的なラベリング機能 (3D 直方体スナップ、ビデオラベリングでの次の予測、および自動セグメント化ツールなど) を含むマルチステップのラベリングワークフローを備えています。独自のデータラベリングワークフローを管理している場合、SageMaker Ground Truth は、オートセグメント、自動 3D 直方体スナッピング、2D ビデオフレームとのセンサーフュージョンなどの自動ラベリング機能を提供します。また、SageMaker Ground Truth は、アクティブ学習を使用して、モデルが自信を持ってラベル付けできない場合に、ラベル付けされたデータのみを人間にルーティングする自動データラベリングを提供します。
データラベリングワークフォースの選択
Amazon SageMaker のデータラベリングサービスでは、データにラベル付けするためのオプションが 2 つ用意されています。まず、SageMaker Ground Truth Plus では、機械学習タスクのトレーニングを受けたエキスパートワークフォースが、お客様の品質やターンアラウンドタイムの要求に応じてデータにラベル付けをします。2 つ目は、SageMaker Ground Truth を使用して、データラベリングワークフローを構築し管理することです。社内外のラベル付け作業者と連携するためのオプションを利用可能です。例えば、自社のラベル付け担当者にラベル付けジョブを送ることができます。また、Amazon Mechanical Turk を介して既に機械学習関連の作業を行っている 50 万人以上の独立した請負業者の人的リソースにアクセスすることもできます。また、データの機密性や特殊なスキルが必要な場合は、AWS が品質やセキュリティの手順を事前にスクリーニングしたベンダーを活用することもできます。機械学習モデルのトレーニング用トレーニングデータセットをより完全なものにするために合成データへのアクセスが必要な場合、AWS のデジタルアーティストがお客様から提供されたアセットや画像を使用して合成データを生成し、お客様に代わって自動的にラベリングを行います。
データラベリング作業の可視化の向上
Amazon SageMaker のデータラベリングサービスでは、データラベリング作業や品質管理の透明性を確保できるため、品質要件が満たされていることが確認できます。SageMaker Ground Truth Plus は、インタラクティブなダッシュボードとユーザーインターフェイスを提供しており、複数のプロジェクトにおけるトレーニングデータセットの進捗状況のモニタリング、日々のスループットなどのプロジェクトメトリクスの追跡、ラベルの品質検査、ラベル付きデータのフィードバックなどを行うことができます。
高品質なラベル付きデータを迅速に取得
Amazon SageMaker のデータラベリング製品を使用すると、高品質なラベル付きデータを迅速に受け取ることができます。SageMaker Ground Truth Plus では、お客様のデータを Amazon S3 にアップロードして、セキュリティ、プライバシー、コンプライアンスの要件を満たすことができます。その後、AWS のエキスパートがデータラベリングワークフローを設定し、エキスパートワークフォースがお客様のラベリングのタスクを完了します。合成データへのアクセスが必要な場合、画像要件を指定するか、3D アセットとベースライン画像を提供すると、SageMaker Ground Truth は機械学習モデルトレーニング用に高精度のラベル付き合成データを生成することができます。