投稿日: Nov 1, 2022

Amazon Textract はあらゆるドキュメントまたは画像から印刷されたテキスト、手書き文字、およびデータを自動的に抽出する機械学習サービスです。AnalyzeExpense は Textract の専用 API で、請求書と領収書のコンテキストを理解し、ベンダー名や請求書番号などの関連データを自動的に抽出します。本日、新しいフィールドのサポートや既存のフィールドの精度向上など、AnalyzeExpense の大幅な機能強化を発表します。

最新の AnalyzeExpense API は 40 以上の正規化されたフィールドをサポートします。新たにサポートされたフィールドには、Vendor Address のようなサマリーフィールドと Product Code のようなラインアイテムフィールドの両方があります。この新しい機能により、ユーザーは必要な情報を直接抽出して、複雑な後処理コードの記述と保守にかかる時間を節約できます。新しいフィールドのサポートに加えて、前のバージョンですでにサポートされていた Vendor Name や Total などのフィールドの精度がさらに向上しました。

AnalyzeExpense は正規化されたキーと値のペアと標準のキーと値のペアに加え、API レスポンスで OCR 出力全体を提供するようになりました。単一の API リクエストで、キーと値のペアと生の OCR 抽出物の両方を取得できます。

この更新は米国東部 (オハイオ、バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、パリ)、AWS GovCloud (米国東部、米国西部) で 10 月 31 日から利用可能になります。

使用を開始するには、Amazon Textract コンソールにログオンして新機能をお試しください。Textract の機能の詳細については、Amazon Textract のウェブサイト開発者ガイド、またはリソースページをご覧ください。