Amazon SageMaker Data Labeling

機械学習モデルのトレーニング向けの高品質データセットを作成

Amazon SageMaker は、Amazon SageMaker Ground Truth Plus と Amazon SageMaker Ground Truth の 2 つのデータラベリングサービスを提供します。どちらのオプションでも、画像、テキストファイル、動画などの生データを識別し、有益なラベルを追加して、機械学習モデル用の高品質のトレーニングデータセットを作成できます。

Amazon SageMaker Ground Truth Plus

SageMaker Ground Truth Plus を使用して、ラベリングアプリケーションを構築したり、ラベル付けのための労働力を自ら管理したりすることなく、質の高いトレーニングデータセットを簡単に作成することができます。Amazon SageMaker Ground Truth Plusを使用して、データラべリングコストを最大 40% 削減。Amazon SageMaker Ground Truth Plus は、機械学習タスクのトレーニングを受けたエキスパートワークフォースを提供し、データセキュリティ、プライバシー、コンプライアンスの要件を満たすことができます。データをアップロードするだけで、Amazon SageMaker Ground Truth Plus がデータラベリングのワークフローを作成し、ワークフローの管理を代行します。

Amazon SageMaker Ground Truth

データラベリングワークフローを柔軟に構築および管理し、独自のデータラベリングワークフォースを管理したい場合は、Amazon SageMaker Ground Truthを使用できます。SageMaker Ground Truth は、データのラベル付けを簡単に行うことができるデータラベリングサービスで、Amazon Mechanical Turk、サードパーティーベンダー、または独自のプライベートワークフォースを介して人間のアノテーターを使用するオプションを提供します。

仕組み

  • SageMaker Ground Truth Plus でデータをラベル付け
  • SageMaker Ground Truth でデータをラベル付け
  • 特徴の比較
  • SageMaker Ground Truth Plus でデータをラベル付け
  • Amazon SageMaker Ground Truth Plus は、ラベリングアプリケーションを構築したり、ラベル付けのためのワークフォースを管理したりすることなく、質の高いトレーニングデータセットを作成することができます。

    Amazon SageMaker Ground Truth Plus の仕組み
  • SageMaker Ground Truth でデータをラベル付け
  • Amazon SageMaker Ground Truth では、お客様独自のデータラベリングワークフローとデータラベリングワークフォースの構築および管理が可能です。

    Amazon SageMaker Ground Truth の仕組み
  • 特徴の比較
  • カテゴリ Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    データラベリングワークフロー テキスト、画像、ビデオ、3D 点群を対象とした、カスタムまたは 30 以上の組み込みワークフローを用意しています。データラベリングワークフローとデータラベリングの品質をお客様が管理 AWS エキスパートがお客様に代わってワークフローを設定し、お客様の品質やターンアラウンドタイムの要求に応じて管理します。
    ユーザー データサイエンティストと機械学習エンジニア データサイエンティスト、機械学習エンジニア、データオペレーションマネージャー、プログラムマネージャー
    労働力 サードパーティーベンダー、Amazon Mechanical Turk、またはお客様自身のプライベートワークフォースの中からお選びいただけます。 お客様のデータセキュリティ、プライバシー、コンプライアンスの要件を満たすことができるエキスパートワークフォースです。 
    機械学習ラベリング技術  アクティブ学習  アクティブ学習、事前ラベリング、および機械検証 

利点

トレーニングデータセットの品質向上

Amazon SageMaker のデータラベリング製品は、手動によるエラーの発生が少なく、トレーニングデータセットの品質向上に役立つ機械学習ラベリング技術を提供します。Amazon SageMaker Ground Truth Plus は、事前ラベリングのための機械学習モデル、エラーや低品質ラベルを検出するための人間のラベリングの機械検証、および補助的なラベリング機能 (3D 直方体スナップ、ビデオラベリングでの次の予測、および自動セグメント化ツールなど) を含むマルチステップのラベリングワークフローを備えています。独自のデータラベリングワークフローを管理している場合、SageMaker Ground Truth は、オートセグメント、自動 3D 直方体スナッピング、2D ビデオフレームとのセンサーフュージョンなどの自動ラベリング機能を提供します。  また、SageMaker Ground Truth は、アクティブ学習を使用して、モデルが自信を持ってラベル付けできない場合に、ラベル付けされたデータのみを人間にルーティングする自動データラベリングを提供します。

データラベリングワークフォースの選択

Amazon SageMaker のデータラベリング製品では、データラベリングワークフォースを選択することができます。SageMaker Ground Truth Plus では、機械学習タスクのトレーニングを受けたエキスパートワークフォースが、お客様の品質やターンアラウンドタイムの要求に応じてデータにラベル付けをします。SageMaker Ground Truth では、社内外のラベル付け作業者と連携するためのオプションを利用可能です。自社のラベル付け担当者にラベル付けジョブを簡単に送ることができます。また、Amazon Mechanical Turk を介して既に機械学習関連の作業を行っている 50 万人以上の独立した請負業者の人的リソースにアクセスすることもできます。また、データの機密性や特殊なスキルが必要な場合は、AWS が品質やセキュリティの手順を事前にスクリーニングしたベンダーを活用することもできます。

データラベリング作業の可視化の向上

Amazon SageMaker のデータラベリングサービスでは、データラベリング作業や品質管理の透明性を確保できるため、品質要件が満たされていることが確認できます。SageMaker Ground Truth Plus は、インタラクティブなダッシュボードとユーザーインターフェイスを提供しており、複数のプロジェクトにおけるトレーニングデータセットの進捗状況のモニタリング、日々のスループットなどのプロジェクトメトリクスの追跡、ラベルの品質検査、ラベル付きデータのフィードバックなどを行うことができます。

高品質なラベル付きデータを迅速に取得

Amazon SageMaker のデータラベリング製品を使用すると、高品質なラベル付きデータを迅速に受け取ることができます。SageMaker Ground Truth Plus では、お客様のデータを Amazon S3 にアップロードするだけで、セキュリティ、プライバシー、コンプライアンスの要件を満たすことができます。その後、AWS のエキスパートがデータラベリングワークフローを設定し、エキスパートワークフォースがお客様のラベリングのタスクを完了します。

Amazon SageMaker Ground Truth Plus の使用を開始する