Amazon Web Services ブログ

Amazon SageMaker Ground Truth ラべリングジョブに、加わったデータラべリングサービス 2 社を使用する

Amazon SageMaker Ground Truth のラベリングジョブに使用できるデータラベリングサービスで、さらに次の 2 つのサービスが増えることになりました。

  • iMerit の米国を拠点とするワークホースによるデータラベリングサービス
  • Startek, Inc によるデータラベリングサービス

AWS Marketplace に加わったこの新しいリスティングは、現存する iMerit のインドを拠点とするワークフォースリスティングを補完するもので、合計 3 つのオプションが提供されることになります。

iMerit では今後、データラベリングを専門とするフルタイムの米国ベーススタッフを提供することになりました。同社の画像ラベリング機能には、分類、枠どり、画像分割、キーポイント、ポリゴン、ポリラインなどがあります。同社のテキストラベリング機能には、英語およびスペイン語の両言語における要素抽出と分類があります。

StarTek はビジネスプロセスのアウトソーシング企業で、データラベリングサービスを提供します。StarTek は株式公開企業 (NYSE: SRT) で、同社のワークフォースは、フィリピン、ホンジュラス、インド、ブラジル、ジャマイカに展開しています。同社の画像ラベリング機能には、分類、枠どり、画像分割、キーポイント、ポリゴン、ポリラインなどがあります。同社のテキストラベリング機能には、英語での要素抽出と分類があります。

Amazon SageMaker Ground Truth は、re:Invent 2018 で立ち上げられました。これは機械学習向けに精度の高いトレーニングデータセットを構築するのに役立つサービスです。詳細については立ち上げブログをご覧ください。Ground Truth のラベリングジョブを設定する際、ラベリングタスクを自社のワーカー、Amazon Mechanical Turk のパブリックワーカー、または AWS Marketplace のリストに掲載されているベンダーのいずれかに送信できます。

お客様は事前承認されたベンダーのいずれかにデータラベリングタスクを割り当てることが可能で、これらのベンダーは、Amazon が機密保持、サービス保証、特殊スキルなどの面で綿密に調査を行った企業です。こうしたベンダーはデータセキュリティ、物理的施設へのアクセス制限、セキュアなデータ送信などに関する特定の要件を満たしているかによって承認されます。承認されたベンダーが承認後も要件を満たしていることを確認するため、定期的にセキュリティに関する監査を行います。

通常、適切なベンダーを見つけ、その後契約を結ぶのは、時間を要する面倒な作業です。Ground Truth を活用することで、ベンダーとの作業はシンプルになり、その工程も AWS Marketplace を通してわずか数クリックするだけとなります。すべてのベンダー関連の料金は AWS Marketplace リスティングを通じて、AWS の請求書に直接記載されます。ここでは、Ground Truth のラベリングジョブを完了するためにベンダーと作業を行うのがいかに簡単かを解説しています。

ステップ 1: ラベリングワークフォースのための Vendor (ベンダー) タブに移動する

AWS アカウントにサインインしたら、Amazon SageMaker コンソールへ移動します。左側のナビゲーションパネルで、Labeling workforces (ラベリングワークフォース) を選択します。次に、右ペインで Vendor (ベンダー) を選択します。

ステップ 2: AWS Marketplace でベンダーのラベリングサービスに登録する

Find data labeling services (データラベリングサービスを見つける) を選択すると、AWS Marketplace にリダイレクトされます。

ここで、使用可能なベンダーを選択することにより、そのベンダー企業の情報、同社のラベリングサービス、料金、その他詳細情報についてさらに詳しく参照できます。自分のニーズに合ったベンダーを選択し、リスティングページで Continue to Subscribe (登録を続ける) を選択して、登録プロセスを完了します。これで、このベンダーを Ground Truth ラベリングジョブに使用できるようになりました。いつでも必要な数のベンダーに登録できます。

ステップ 3: ラベリングジョブをセットアップするときにベンダーを選択する

ラベリングジョブの作成時、Subscribed data labeling services (登録済みデータラベリングサービス) ドロップダウンリストに、すべての登録済みベンダーが一覧表示されます。ラベリングジョブを依頼するベンダーを選択します。ラベリングジョブに異なるデータラベリングサービスを使用するなど自由に選ぶことができます。

利用できません

各データラベリングサービスについてさらに詳しく知りたい場合は、AWS Marketplace リスティングページにアクセスしてください。ベンダーを活用したら、ぜひその後の感想をお聞かせください。


著者について

Vikram Madan は Amazon SageMaker Ground Truth のプロダクトマネージャーです。彼は、機械学習ソリューションの簡単な構築に役立つ製品の提供に力を入れています。余暇には長距離を走ったり、ドキュメンタリーを見て過ごします。