投稿日: Jul 25, 2023

Amazon SageMaker Canvas はドキュメントクエリのサポートを開始しました。これは、Amazon Textract を利用した、すぐに使用できるモデルです。ドキュメントクエリを使用すると、構造化ドキュメントから抽出するデータを自然言語を使用して指定できます。ドキュメントの構造 (テーブル、フォーム、フィールド、ネストされたデータ) に関する予備知識は必要ありません。これにより、抽出されたデータを手動で処理したり検索したりする必要がなくなり、時間を節約し、人為的ミスを減らすことができます。 

SageMaker Canvas はビジュアルインターフェイスであり、ビジネスアナリストが機械学習を使用した経験がなくても、あるいはコードを 1 行も記述することなく、正確な ML 予測を自身で生成できます。このリリースに先立って、Canvas は文書からテキスト、表、フォームなどの情報を抽出できる、すぐに使用できるモデルを提供していました。ただし、その場限りの質問 (「第 3 四半期の売上から生み出された総収益はいくらか」など) に答えるには、抽出された情報を検索して処理しなければならず、効率が悪く、時間もかかっていました。ドキュメントクエリを使用すると、自然言語による質問 (「顧客名は何ですか」など) で要求する情報を指定でき、正確な情報 (「John Doe」など) とそのドキュメント内の位置を受け取ることができます。コードを記述する必要はありません。 

開始するには、Amazon SageMaker Canvas にログインし、すぐに使用できるモデルのリストから利用できる新しいドキュメントクエリモデルにアクセスします。文書をアップロードして自然言語の質問を使用するだけで、必要な答えが得られます。 

この新機能は現在、SageMaker Canvas がサポートされているすべての AWS リージョンで利用可能です。Amazon Textract の料金が適用されます。詳細については、製品ドキュメントを参照してください。