Amazon Web Services ブログ
Amazon A2I の一般公開を開始しました
AWS では、この度 Amazon Augmented AI (Amazon A2I) の一般公開を発表できることを、とても喜ばしく思っております。これは、機械学習 (ML) によるヒューマンレビューを大規模に実装できるようにするサービスです。Amazon A2I は、ヒューマンレビューシステムの構築や管理に関する、コストが高い上に煩雑になりがちで代わり映えのしない重労働を削減します。これを使えば、お客様の ML モデルで正確な予測生成を確実に実現することができます。Amazon A2I は、人間の判断を ML パイプラインの中に挿入することで、人間と機械が最良の結果を出せるようにしました。
Amazon A2I には、一般的な ML タスク用にヒューマンレビューのワークフローが実装済みです。これらのタスクには、Amazon Rekognition や Amazon Textract と組み合わせて実行する、ドキュメントでのコンテンツ修正やテキスト抽出などが含まれます。また、ML モデルの構築に、Amazon SageMaker を使うか、オンプレミスあるいはクラウドでのツールを API 経由で使用して、独自のヒューマンレビューワークフローを作成することも可能です。
さらに Amazon A2I では、人間のレビュー担当者が介在することができます。レビューワーには、独自で選別した人物を指定することや、Amazon Mechanical Turk を通じた ML関連作業の経験を持つ、50 万人を超える独立した契約スタッフから人材を選択することも可能となっています。お客様の ML アプリケーションに、機密性や特別なスキルが必要な場合でも、品質とセキュリティ手順に関し AWS があらかじめ選出した、実績のある人材が待機しています。
Amazon A2I は、お客様が、独自の要件に基づきヒューマンレビューを導入しようとする際の柔軟性を提供します。シンプルなビジネスルール (予測結果に対してML がどの程度の信頼度を示しているか) を設定することにより、予測を自動に任すか、検証のために人間を介在させるかを決定します。
設定した最低信頼度に抵触する予測結果が、ML パイプラインを経由して出力された場合は、ご自身の要件に基づいた判断をお客様が行えます。たとえば、社会保障番号 (SSN) のような特別な識別子を数多くのドキュメントから抽出する場合、その後に続くアプリケーションを正しく実行するために、その抽出結果には完全な正確性が必要です。この場合、要求されるモデルの正確性を実現するには、しきい値の設定を高く (99% などに) する必要があるでしょう。
同じアプリケーションでも、他のデータは SSN に対しては二次的と考えられるので、これらに同様の検証レベルは必要ありません。この時は、SSN 向けの抽出より低いしきい値を設定できます。Amazon A2I では、お客様の必要性に応じて、異なるしきい値レベルを柔軟に設定できます。加えて、ML モデル出力をランダムにサンプリングしてヒューマンレビューに送ることも可能で、このモデルが希望通りの性能を維持しているかを定常的に評価できます。
Amazon A2I は、その他のサービスと組み合わせても機能します。Amazon Textract および Amazon Rekognition との直接的な統合や、Amazon A2I 内部のカスタムワークフローを使うことで、Amazon Comprehend、Amazon Translate、あるいは他の AWS AI サービスにおいて、人間が関与する検証を実施できます。また、Amazon A2I API を使うと、Amazon SageMaker 、あるいは他のオンプレミスもしくはクラウドのツールで構築した ML カスタムモデルを使う任意の ML アプリケーションにも、ヒューマンレビューを追加することが可能です。
Amazon A2I と Amazon Textract の動作原理
次の図では、Amazon A2I と Amazon Textract の統合方法を説明しています。Amazon Textract を経由してドキュメントが供給されると、設定したビジネスルールに基づき 信頼性の低い予測結果が、Amazon A2I によりヒューマンレビューに送られます。これらの結果は、クライアントアプリケーションで利用するため、および、その正確さを確認する目的で、Amazon S3 バケットに保存できます。
たとえば、住宅ローン関連のアプリケーションでは、そのプロセスに関連して非常に多くのドキュメントが生成されます。それらの各ページには、スキャン後にシステム内にアップロードされた、さまざまな情報、署名、日付などが記載されています。時として、こういったスキャンは低品質となることがあり、そのデータが正確かつ完全であることを人間が確認する必要が生じます。こういったドキュメントは、Amazon A2I と供に Amazon Textract を介して処理することで、信頼性が低く読み取りづらい文章を、ヒューマンレビューに送ることができます。
それ以外の予測結果は、アプリケーションにとって許容できる範囲の信頼性レベルにあります。この場合には、予測結果はヒューマンレビューを介さずに、Amazon A2I からアプリケーションに即刻返信されます。お客様は、ご自身のユースケースに応じたしきい値を設定できます。
Amazon Textract とAmazon A2I の共用事例
AWS パートナーネットワーク (APN) のアドバンストコンサルティングパートナーである Belle Fleur Technologies 社には、ML がもたらす変革がライフスタイル、仕事、人間関係を変容させ、いかなる産業界におけるビジネス展開にも変革を起こすはずだという確信があります。
以前から Belle Fleur 社は、Amazon Textract について、金融機関と共同作業する際の最良なソリューションであると評価していました。Amazon Textract により同社では、多大な量のドキュメントの処理と、クライアントが求める関連データの抽出が可能になりました。しかしながら、より重要で曖昧さが残るデータの検証には、かなりの時間を割き、人手による検証を行っていました。
この状況の中に Amazon A2I を導入したことは、同社の顧客にとっても朗報となるものでした。Amazon A2I は、人手による検証作業の整備に要する時間を削減し、分かりやすいワークフローにより、抽出したすべての関連データを統一的な場所に配置します。これによりレビュー担当者は、ML からの出力を迅速かつ容易に検証することができます。Belle Fleur 社プレジデントの Tia Dubuisson 氏は「Amazon A2I により、抽出された曖昧なデータでも人間が確認しているという安心感を、当社とお客様の両方が得られるようになったばかりか、継続的な監査と改善を通じて、ML のトレーニングと改良も続けられるようになりました。」と言います。
他のお客様による、Amazon A2I の独自の ML ワークフローにおける使用方法については、「Amazon Augmented AI Customers」をご参照ください。
開始方法
使用を開始するには、Amazon A2I コンソール にサインインするか、AWS マネジメントコンソールで Amazon Augmented AI を検索します。ヒューマンレビューワークフロー作成に関する詳細については、「フロー定義を作成する」をご参照ください。
Amazon A2I は、現在 12 のリージョンでご利用いただけます。リージョンに関する詳細については「リージョン表」をご参照ください。無料での使用開始法の詳細については「Amazon Augmented AI の料金」をご参照ください。
著者について
Andrea Morton-Youmans は AWS の AI サービスチームで働くプロダクトマーケティングマネージャーです。彼女は、テクノロジーとテレコミュニケーション業界で 10 年以上にわたり、開発者事例の紹介やマーケティングキャンペーンを専門に扱ってきました。余暇には、ご主人とオージー犬の Oakley と供に湖に行ったり、ワインをたしなみ、また、さまざまな時代の映画を楽しんでいます。
Anuj Gupta は、Amazon Augmented AI のプロダクトマネージャーです。彼は、顧客が機械学習をより簡単に導入できるようにする製品の提供に力を注いでいます。趣味は、ロードトリップやフォーミュラ 1 の観戦です。