投稿日: Dec 18, 2019

Amazon Textractは、カスタム構成やテンプレートを必要とせずに、DetectText API または AnalyzeDoc API を使用して、テキストやテーブルやフォームなどの構造化データを簡単かつ迅速に取得できる機械学習サービスです。Amazon Textract などのマネージド型サービスでは、お客様が長期にわたる継続的改善による利点を享受できます。本日、Amazon Textract が PCI DSS 認定を取得したことをお知らせいたします。このことは、カード所有者データ (CHD) や機密認証データ (SAD) など、支払いカード業界データセキュリティ標準 (PCI DSS) 情報セキュリティ標準を必要とするすべてのワークロードに Amazon Textract を使用できるようになりました。また、今日から、AWS は Amazon Textract をテーブルとフォームの機能にさらに正確にする一連の品質強化を開始しました。 

まず、テーブルモデルが、分割セルと結合セルを含む複雑なテーブル構造でより適切に機能するようになりました。これにより、セル値を正しい列ヘッダーまたは行ヘッダーに揃えることが難しくなります。次に、Amazon Textract はさらに、明示的な境界のないテーブルであっても、折り返されたテキスト(複数行にまたがるテキスト)を持つセルの行と列の識別を改善しました。Amazon Textract は、明示的な境界のない新しい行である場合とは反対に、複数行にわたるコンテンツを持つセルのより正確な判別を行います。最後に、Amazon Textract はまた、フォームモデルを改善して、キー値ペアの識別に対してより正確な結果を与えます。これらの利点は多くのタイプのドキュメントに適用されますが、テーブルとキー値ペアが同じページにあるドキュメントでは特に明確です。Amazon Textract は、テーブル内に埋め込まれたキー値ペアを識別するようになりました。 

これらの更新についての詳細は、こちら を参照してください。