Amazon Bedrock Data Automation で、モダリティコントロール、ハイパーリンク、より大きなドキュメントのサポートが開始

投稿日: 2025年4月25日

Amazon Bedrock Data Automation (BDA) は、モダリティ有効化、ファイルタイプ別のモダリティルーティング、標準出力でドキュメントを処理する際の埋め込みハイパーリンクの抽出がサポートされるようになり、ドキュメント全体のページ数制限が 3,000 ページに引き上げられました。これらの新機能により、マルチモーダルコンテンツの処理方法をより細かく制御できるようになり、BDA の全体的なドキュメント抽出機能が向上します。

モダリティ有効化とルーティングを使用すると、特定のプロジェクトでどのモダリティ (ドキュメント、画像、音声、動画) を有効にするかを設定し、特定のファイルタイプのモダリティルーティングを手動で指定できます。JPEG/JPG および PNG ファイルは、特定のユースケース要件に基づいて、画像またはドキュメントとして処理できます。同様に、MP4/M4V および MOV ファイルは動画ファイルまたは音声ファイルとして処理できるため、コンテンツに最適な処理パスを選択できます。

埋め込みハイパーリンクのサポートにより、BDA を使用して PDF に含まれる埋め込みハイパーリンクを検出し、BDA 標準出力の一部として返すことができます。この機能により、ドキュメントからの情報抽出機能が強化され、ナレッジベース、リサーチツール、コンテンツインデックスシステムなどのアプリケーション用の貴重なリンク参照が保持されるようになりました。

最後に、BDA ではドキュメントあたり最大 3,000 ページのドキュメント処理がサポートされるようになりました。これは、以前の制限である 1,500 ページの 2 倍です。この制限の引き上げにより、より大きなドキュメントを分割せずに処理できるようになるため、長いドキュメントやドキュメントパケットを扱う企業のワークフローが簡素化されます。

Amazon Bedrock Data Automation は米国西部 (オレゴン) および米国東部 (バージニア北部) の AWS リージョンで一般提供されています。

詳細については、Bedrock Data Automation のページ、またはドキュメントをご覧ください。