Amazon SageMaker Ground Truth

機械学習のための大規模なトレーニングデータに簡単にラベル付けをする

Amazon SageMaker Ground Truth はフルマネージド型のデータラベル付けサービスです。機械学習のための高精度なトレーニングデータセットを簡単に構築することができます。カスタム、または組み込み済みのデータラベル付けワークフローを使用して、SageMaker Ground Truth コンソールから数分でデータのラベル付けを開始することができます。これらのワークフローは、3D 点群、動画、画像、およびテキストなど、さまざまなユースケースをサポートしています。ラベル付け担当者は、ワークフローの一部である、自動 3D キューボイドスナップ、2D 画像のゆがみ除去、自動セグメントツールなどのラベル付け支援機能を利用して、データセットのラベル付けの作業時間を短縮できます。さらに、Ground Truth では、機械学習モデルを使用してデータにラベル付けを行う自動データラベル付け機能が利用可能です。

メリット

データラベルの精度の向上

SageMaker Ground Truth は、注釈の統合と監査ワークフローを通じて、ラベルの品質向上を支援します。注釈の統合とは、2 名以上のデータラベル付け担当者からラベル入力を収集し、それらを組み合わせて機械学習モデル用の 1 つのデータラベルを作成するプロセスです。監査とレビューのワークフローが組み込まれているため、作業者はラベルの検証を行い、精度を向上させるための調整を行うことができます。

使いやすい

SageMaker Ground Truth では、直感的なユーザーインターフェイスを備えた「自動セグメンテーション」、「自動 3D キューボイドスナップ」、「2D ビデオフレームとのセンサーフュージョン」などの自動ラベル付け機能が利用可能です。これにより、データのラベル付け作業にかかる時間を短縮すると同時に品質を向上させることができます。 セマンティックセグメンテーションでは、作業者は画像の中のオブジェクトにラベルを付ける必要があります。自動セグメンテーション機能を使用することで、作業者は本来数百回のクリックが必要なオブジェクトのキャプチャ作業をわずか 4 回のクリックで完了することができます。

コストを最大 70% 削減

SageMaker Ground Truth では、データの自動ラベル付け機能が利用可能です。データは、アクティブな学習モデルを使用してラベル付けされ、モデルによって確実なラベル付けができない場合にのみ、担当者に転送されます。担当者がラベル付けしたデータは、機械学習モデルの精度を向上させるためのトレーニングに使用されます。これにより、次回のラベル付け作業時に担当者に送られるデータが減り、データのラベル付けコストが最大 70% 削減されます。

人的リソースの選択

SageMaker Ground Truth では、社内外のラベル付け作業者と連携するためのオプションを利用可能です。SageMaker Ground Truth を使用することで、自社のラベル付け担当者にラベル付けジョブを簡単に送ることができます。また、Amazon Mechanical Turk を介して既に機械学習関連の作業を行っている 50 万人以上の独立した請負業者の人的リソースにアクセスすることもできます。 データの機密性や特殊なスキルが必要な場合は、iVision、CapeStart Inc.、Cogito、iMerit など、AWS が品質とセキュリティの手順を事前にスクリーニングしたベンダーを利用することができます。

この機能の説明

Amazon SageMaker Ground Truth の仕組み
Amazon SageMaker Ground Truth のチュートリアル
チュートリアルを始めましょう。

Amazon SageMaker Ground Truth を使用して、画像分類ユースケース用の高精度なトレーニングデータセットを構築する方法を学びます。

無料の AWS アカウントにサインアップ
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

コンソールで構築を開始する
コンソールで構築を開始する

AWS マネジメントコンソールから Amazon SageMaker Ground Truth を使った構築を開始しましょう。