投稿日: Jun 27, 2018

Amazon Comprehend は、機械学習を使用してテキスト内でインサイトや関係性を検出する自然言語処理 (NLP) サービスです。本日から、新しい非同期ジョブサービスを使用して Amazon S3 バケットに保存されたドキュメントのコレクションを分析できるようになります。これは、既に使用可能な REST API に対する単一および複数のドキュメントの同期呼び出しに加えて、アプリケーションのニーズに最適なさまざまな選択肢を提供します。

非同期操作は、アプリケーションがサービスからのリアルタイム応答を必要としない場合に大きなデータセットを分析するのに特に役立ちます。たとえば、毎日、毎週、さらには毎月でもテキスト分析バッチの実行をスケジュールすることができます。非同期オプションを使用することで、サービスは最大で 100 KB のサイズのドキュメントを受け入れ、名前付きエンティティ認識 (NER) とキーフレーズ分析のための大きなドキュメントを切り捨てる必要がなくなりました。(注意: 非同期センチメント検出の最大ファイルサイズは、1 ドキュメント当たり 5 KB に制限されたままです。)

このリリースで、Amazon Comprehend は以下のオプションを提供します。

  • 同期単一ドキュメント処理 — 単一ドキュメントで Amazon Comprehend を呼び出して、同期応答を受け取ります。
  • 同期複数ドキュメント (リクエスト当たり 25 ドキュメント) — 最大で 25 のドキュメントのコレクションで Amazon Comprehend 呼び出して、同期応答を受け取ります。
  • 非同期バッチ処理 (ジョブサイズ 5 GB の制限、100 KB のドキュメントサイズ) — Amazon S3 バケットに保存されたドキュメントのコレクションを使用し、非同期操作を開始してドキュメントを分析します。分析の結果は、S3 バケットに返されます。

非同期処理操作の始め方については、Amazon Comprehend ドキュメントをお読みください。