全般

Q: Amazon SageMaker Ground Truth とは何ですか?

A: Amazon SageMaker Ground Truth は、機械学習システムのトレーニングに必要なデータセットの効率的で高精度なラベル付けをお客様が簡単に行えるようにします。SageMaker Ground Truth は、人間の作業者が手作業で付けたラベルに基づいて、データセットの一部に自動的にラベルを付けることができます。手作業が必要であれば、クラウドソーシングの Amazon Mechanical Turk に登録されている 50 万人以上のラベル付け作業者の労働力、自社の従業員、AWS Marketplace に登録されている Amazon 推奨のサードパーティーデータラベリングサービスプロバイダーの中から選択できます。SageMaker Ground Truth は革新的なアルゴリズムとユーザーエクスペリエンス (UX) 技術を使用して、人間によるラベル付けの精度を向上させます。時間が経つにつれて、モデルは人間が作成したラベルから継続的に学習することで改良され、自動ラベル付けが向上します。

Q: データのラベル付けの自動化とは何ですか?

A:  データのラベル付けの自動化とは、機械学習を使用するデータのラベル付けです。Amazon SageMaker Ground Truth では、まずデータのランダムなサンプルが選択され、人がラベルを付けることができるよう送信されます。人によるラベル付けの結果は、ラベル付けモデルのトレーニングの際に、未加工データの新しいサンプルに自動的にラベルを付けるために使用されます。モデルによるデータへのラベル付けの品質が設定したしきい値以上になる場合、そのラベルが確定されます。信頼性スコアがしきい値を下回る場合、データは人に送信され、人がラベルを付けます。人がラベルを付けたデータの一部は、ラベル付けモデルの新しいトレーニングデータセットの生成のために使用され、モデルは精度を向上させるために自動的に再トレーニングされます。未加工データの各サンプルにラベルを付けるために、このプロセスが繰り返されます。繰り返されるたびに、そのラベル付けモデルでは、未加工データに自動的にラベルを付ける性能が向上し、人に転送されるデータが減少します。

Amazon SageMaker Ground Truth の使用

Q: Amazon SageMaker Ground Truth を使用する利点は何ですか?

A: 機械学習モデルを構築、トレーニング、デプロイする前に、まずデータが必要です。成功するモデルは高品質のトレーニングデータを基にして構築されており、トレーニングデータセットの収集とラベル付けには多くの時間と労力が必要です。トレーニングデータセットを構築するには、まず人手によるラベル付けで多数の画像または他のデータタイプを評価し、各データタイプの特定の対象物を識別してラベル付けする必要があります。こうしたラベル付けの作業は、多くの人手に分散され、多大なオーバーヘッドとコストが追加されます。しかも、間違ったラベルがあると、システムは不正な情報から学習することになり、不正確な予測を行います。

Amazon SageMaker Ground Truth は、自動化されたデータのラベル付けと人手によるラベル付けの組み合わせを利用して、Amazon S3 に保存されているデータを使用して、高精度で効率的なデータラベル付けを簡単に実行できるようにすることで、この問題を解決します。

Q: Amazon SageMaker Ground Truth の使用を開始するにはどのようにすればよいですか?

A: Amazon SageMaker Ground Truth は、数ステップのみでデータのラベル付けジョブ全体を設定できるマネージドサービスです。Amazon SageMaker Ground Truth の使用を開始するには、AWS マネジメントコンソールにサインインして、SageMaker コンソールを開きます。そこで、[Ground Truth] の下にある [Labeling jobs] を選択します。これで、ラベル付けジョブを作成できます。まず、ラベル付けジョブ作成フローの一部として、ラベルを付けるデータセットを含む S3 バケットへのポインタを指定します。Ground Truth には、一般的なラベル付け作業のためのテンプレートが用意されており、いくつかの選択肢をクリックするだけで、データをラベル付けするための最短のステップを提供します。独自のカスタムテンプレートを作成することもできます。ラベル付けジョブを作成する最後のステップとして、人手による作業について 3 つのオプションから選択します。(1) クラウドソーシングの労働力を利用する、(2) 推奨されるサードパーティーデータラベリングサービスプロバイダーを利用する、(3) 自社従業員が作業する。また、データの自動ラベル付けを有効にするオプションもあります。

Q:  トレーニングデータセットは Amazon SageMaker Ground Truth を使用してどのように管理されますか?

A: Amazon SageMaker Ground Truth は、メタデータ、関連するラベル、ラベルとデータセットのタクソノミーを管理します。SageMaker ノートブックまたは SageMaker コンソール内の Ground Truth コンソールから AWS SDK を使用して、データセットやラベルを簡単に照会して管理することができます。詳細については、Amazon SageMaker Ground Truth のドキュメントを参照してください。

Q:  Amazon SageMaker Ground Truth は、どのようにしてトレーニングデータセットの精度を向上させますか?

A: Amazon SageMaker Ground Truth には、人間がデータのラベル付けを正確に行うために役立つ以下の機能があります。

(a) 注釈の統合: この機能は、各データオブジェクトを複数の作業者に送信し、その応答 (「注釈」と呼ばれる) を単一のラベルに統合することによって、個々の作業者の間違い/偏見に対処します。その後、注釈を取得し、注釈統合アルゴリズムを使用して注釈を比較します。このアルゴリズムは、まず無視される異常な注釈を検出します。次に、注釈の加重統合を実行し、より信頼できる注釈に高い重みを割り当てます。出力は、それぞれの対象物ごとに 1 つのラベルです。

(b) 注釈インターフェイスのベストプラクティス: これらは、作業者がより正確に作業を実行できるようにする注釈インターフェイスの機能です。人間の作業者は間違ったり、偏見を持ちやすいので、よく設計されたインターフェイスは作業者の正確性を向上させます。ベストプラクティスの 1 つは、固定側パネルに良いラベルと悪いラベルの例とともに短い指示を表示することです。もう 1 つのベストプラクティスは、作業者が画像上に境界ボックスを描いているときに、ボックス境界の外側の領域を暗くすることです。

Q:  Amazon SageMaker Ground Truth では、データが保護され安全であることが保証されますか?

A: デフォルトで、Amazon SageMaker Ground Truth はデータを保存時および転送中に暗号化します。さらに、データへのアクセスは AWS Identity and Access Management (IAM) を使用してコントロールできます。Ground Truth は、データを AWS 環境外に保存したりコピーしたりすることはないので、データは常にコントロール下にあります。さらに、Ground Truth は一般データ保護規則 (GDPR) などのコンプライアンス基準をサポートしており、Amazon CloudWatch および Amazon CloudTrail を使用して総合的なログ記録および監査機能を提供します。詳細については、Amazon SageMaker Ground Truth のドキュメントを参照してください。

Q: Amazon SageMaker Ground Truth を使用して人間の労働力にアクセスするにはどうすればよいですか?

A:  From SageMaker Ground Truth から、次の 3 つの労働力オプションのいずれかを選択できます。(1) Amazon Mechanical Turk に登録されているクラウドソーシングの労働力、(2) AWS Marketplace から利用できるサードパーティーのデータラベリングサービスプロバイダー、(3) 自社の従業員。詳細については、Amazon SageMaker Ground Truth のドキュメントを参照してください。 

Q:   Amazon SageMaker Ground Truth のデータラベリングサービスプロバイダーは機密データを処理できますか?

A: はい、Amazon SageMaker Ground Truth のデータラベリングサービスプロバイダーは、機密データを処理できます。AWS のお客様とサードパーティーのデータラベリングサービスプロバイダーとの間の標準サービスアグリーメントには、お客様の機密情報に対する基本的な保護が含まれています。機密情報をサービスプロバイダーと共有する前に、これらの規約を確認してください。これらの規約は、AWS Marketplace サービスプロバイダーのカタログページに記載されています。

Q: Amazon SageMaker Ground Truth のデータラベリングサービスプロバイダーは、どのセキュリティ基準を満たす必要がありますか?

A: データラベリングサービスプロバイダーは、毎年 SOC 2 コンプライアンスと認定を完了する必要があります。SOC 2 レポートは、米国公認会計士協会 (AICPA) の信頼サービス基準 (セキュリティ、可用性、処理の完全性、機密性、プライバシー) に基づくサービスプロバイダの統制環境を説明するものです。

SOC 2 以外にも、サービスプロバイダはこのような追加のセキュリティ統制を維持し、顧客データを安全に保つ必要があります。

テクノロジー管理:
サービスプロバイダーは、適切なソフトウェアを利用して、システムからファイル/データをダウンロードまたはコピーしようとする試みをブロックし、システムへの不正アクセスを防止する必要があります。サービスプロバイダーはまた、従業員が顧客のタスク関連データを保存またはコピーすることを禁止することも求められています。

ネットワークセキュリティ管理:
サービスプロバイダーのネットワークは、顧客のタスク関連データへのリモートアクセスを防ぐように設計されている必要があります。さらに、ピアツーピアのファイル共有ソフトウェアはプロバイダーのネットワークでブロックされているため、高可用性を提供するようにファイアウォールを設計する必要があります。

従業員管理:
サービスプロバイダーは、従業員と秘密保持契約 (NDA) を締結していることを確認する必要があります。サービスプロバイダーは、情報の漏洩を防ぎ、従業員がいかなる手段 (紙、USB、携帯電話、その他の媒体) で情報を送信することを防ぐために、厳格なポリシーを採用する必要があります。

物理的アクセス管理:
サービスプロバイダーは、本番サイトへの不正アクセスを防ぐために物理的なアクセス管理対策を維持する必要があります。これらには、バイオメトリック認証、従業員バッジ識別などを備えた回転ドアが含まれます。

Q: AWS は、サービスプロバイダーがこれらのセキュリティ基準を確実に満たす場合に、どのように役立ちますか?

A: AWSは、サービスプロバイダーがマーケットプレイスにリストされる前に SOC 2 認定レポートを提供するよう要求し、次のことを確認しています。

信頼性 (サービスプロバイダーの監査人が AICPA によって認定されている場合)

報告期間 (SOC 2 認定の有効日)

本番サイト (サービスプロバイダーの従業員が Amazon SageMaker Ground Truth のラベリングタスクに取り組む物理的なサイト)。

Q: サービスプロバイダーのセキュリティ基準は、どのくらいの頻度でレビューを行っていますか?

A:  すべてのサービスプロバイダーのセキュリティ基準は、必須要件を満たしていることを確認するために毎年見直されます。

Q: AWS のレビューに例外はありますか?

A: いいえ。サービスプロバイダーがセキュリティ基準を満たしていない場合、AWS Marketplace のカタログから削除されます。削除は 24 時間以内に完了し、アクティブなお客様全員に E メールで通知されます。

Q: サービスプロバイダーが複数の本番サイトを通じてデータラベリングサービスを提供している場合、すべてのサイトがレビュープロセスを通過する必要がありますか?

A: はい、すべてのサイトにおいて必要なセキュリティ基準を満たす必要があります。

Q: サービスプロバイダーの本番サイトにデータ侵害があるとどうなりますか?

A: サービスプロバイダーは、実際の不正アクセスまたは疑わしい不正アクセス、収集、取得、使用、送信、開示、破損、または顧客情報の損失が検出されてから 24 時間以内に、AWS および影響を受けるお客様に通知を送信する必要があります。サービスプロバイダーは各セキュリティのインシデントをすみやかに解決し、AWS とその影響を受けるお客様に、内部調査に関する詳細を書面で提供します。

サードパーティーのデータラベリングサービスプロバイダーを利用する

Q:   Amazon SageMaker Ground Truth のデータラベリングサービスプロバイダーは機密データを処理できますか?

A: はい、Amazon SageMaker Ground Truth のデータラベリングサービスプロバイダーは、機密データを処理できます。AWS のお客様とサードパーティーのデータラベリングサービスプロバイダーとの間の標準サービスアグリーメントには、お客様の機密情報に対する基本的な保護が含まれています。機密情報をサービスプロバイダーと共有する前に、これらの規約を確認してください。これらの規約は、AWS Marketplace サービスプロバイダーのカタログページに記載されています。

Q: Amazon SageMaker Ground Truth のデータラベリングサービスプロバイダーは、どのセキュリティ基準を満たす必要がありますか?

A: データラベリングサービスプロバイダーは、毎年 SOC 2 コンプライアンスと認定を完了する必要があります。SOC 2 レポートは、米国公認会計士協会 (AICPA) の信頼サービス基準 (セキュリティ、可用性、処理の完全性、機密性、プライバシー) に基づくサービスプロバイダの統制環境を説明するものです。

SOC 2 以外にも、サービスプロバイダはこのような追加のセキュリティ統制を維持し、顧客データを安全に保つ必要があります。

テクノロジー管理:
サービスプロバイダーは、適切なソフトウェアを利用して、システムからファイル/データをダウンロードまたはコピーしようとする試みをブロックし、システムへの不正アクセスを防止する必要があります。サービスプロバイダーはまた、従業員が顧客のタスク関連データを保存またはコピーすることを禁止することも求められています。

ネットワークセキュリティ管理:
サービスプロバイダーのネットワークは、顧客のタスク関連データへのリモートアクセスを防ぐように設計されている必要があります。さらに、ピアツーピアのファイル共有ソフトウェアはプロバイダーのネットワークでブロックされているため、高可用性を提供するようにファイアウォールを設計する必要があります。

従業員管理:
サービスプロバイダーは、従業員と秘密保持契約 (NDA) を締結していることを確認する必要があります。サービスプロバイダーは、情報の漏洩を防ぎ、従業員がいかなる手段 (紙、USB、携帯電話、その他の媒体) で情報を送信することを防ぐために、厳格なポリシーを採用する必要があります。

物理的アクセス管理:
サービスプロバイダーは、本番サイトへの不正アクセスを防ぐために物理的なアクセス管理対策を維持する必要があります。これらには、バイオメトリック認証、従業員バッジ識別などを備えた回転ドアが含まれます。

Q: AWS は、サービスプロバイダーがこれらのセキュリティ基準を確実に満たす場合に、どのように役立ちますか?

A: AWSは、サービスプロバイダーがマーケットプレイスにリストされる前に SOC 2 認定レポートを提供するよう要求し、次のことを確認しています。

信頼性 (サービスプロバイダーの監査人が AICPA によって認定されている場合)

報告期間 (SOC 2 認定の有効日)

本番サイト (サービスプロバイダーの従業員が Amazon SageMaker Ground Truth のラベリングタスクに取り組む物理的なサイト)。

Q: サービスプロバイダーのセキュリティ基準は、どのくらいの頻度でレビューを行っていますか?

A: サービスプロバイダーがセキュリティ基準を満たし続けているかどうかを判断するために、毎年レビューを行っています。

Q: AWS のレビューに例外はありますか?

A: いいえ。サービスプロバイダーがセキュリティ基準を満たしていない場合、AWS Marketplace のカタログから削除されます。削除は 24 時間以内に完了し、アクティブなお客様全員に E メールで通知されます。

Q: サービスプロバイダーが複数の本番サイトを通じてデータラベリングサービスを提供している場合、すべてのサイトがレビュープロセスを通過する必要がありますか?

A: はい、すべてのサイトにおいて必要なセキュリティ基準を満たす必要があります。

Q: サービスプロバイダーの本番サイトにデータ侵害があるとどうなりますか?

A: サービスプロバイダーは、実際の不正アクセスまたは疑わしい不正アクセス、収集、取得、使用、送信、開示、破損、または顧客情報の損失が検出されてから 24 時間以内に、AWS および影響を受けるお客様にお知らせします。サービスプロバイダーは各セキュリティのインシデントをすみやかに解決し、AWS とその影響を受けるお客様に、内部調査に関する詳細を書面で提供します。

料金と可用性

Q: Amazon SageMaker Ground Truth にかかる費用はどれくらいですか?

A: 最新の価格情報については、SageMaker Ground Truth の料金ページを参照してください。

Q: Amazon SageMaker Ground Truth を利用できるのは、どの AWS リージョンですか?

A: Amazon SageMaker Ground Truth は現在、バージニア北部、オハイオ、オレゴン、アイルランド、東京、シドニーの各 AWS リージョンで利用可能です。

Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon SageMaker Ground Truth の料金の詳細を確認する

Amazon SageMaker Ground Truth の使用を開始するために、前払いの義務や長期契約はありません。詳細については、Amazon SageMaker Ground Truth の料金ページをご確認ください。

Product-Page_Standard-Icons_02_Sign-Up_SqInk
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Product-Page_Standard-Icons_03_Start-Building_SqInk
コンソールで構築を開始する

AWS マネジメントコンソールから Amazon SageMaker Ground Truth を使った構築を開始しましょう。

サインイン