投稿日: Sep 28, 2023

Amazon Textract はあらゆるドキュメントまたは画像から印刷されたテキスト、手書き文字、データを自動的に抽出する機械学習サービスです。本日、Amazon Textract の新機能である Layout を発表いたします。この機能により、ドキュメントから段落、タイトル、リスト、ヘッダー、フッターなどのレイアウト要素を抽出できます。Layout は Analyze Document API の新しいタイプの機能です。お客様は、Layout をスタンドアロン機能として、または他の Analyze Document 機能タイプと組み合わせて使用できます。

Layout は、金融サービス、法律、保険、医療、メディア、その他の業界のさまざまなドキュメントで事前トレーニング済みです。Layout を使用すると、ドキュメントからレイアウト要素を直接抽出できるようになり、複雑な後処理コードの開発と保守への依存度が軽減されます。また、検索インデックスの作成や検索拡張生成 (RAG) アプリケーションの埋め込みなど、ドキュメント処理操作の効率向上が期待されます。

この機能は米国東部 (オハイオ、バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、パリ)、AWS GovCloud (米国東部、米国西部) で 9 月 29 日から利用可能になります。

使用を開始するには、Amazon Textract コンソールにログオンして新機能をお試しください。Textract の機能の詳細については、Amazon Textract のウェブサイト開発者ガイド、またはリソースページにアクセスしてください。