Автоматизация данных Amazon Bedrock теперь поддерживает управление модальностями, гиперссылки и более крупные документы
Автоматизация данных Amazon Bedrock (BDA) теперь поддерживает включение обработки модальностей, маршрутизацию модальностей по типам файлов, извлечение внедренных гиперссылок при обработке документов в стандартном формате вывода и увеличение общего лимита страниц документов до 3000 страниц. Эти новые функции позволяют лучше контролировать обработку мультимодального контента и улучшают общие возможности BDA по извлечению документов.
С помощью включения обработки и маршрутизации модальностей вы можете настроить, какие модальности (документ, изображение, аудио, видео) следует включить для данного проекта, и вручную указать маршрутизацию модальностей для определенных типов файлов. Файлы JPEG/JPG и PNG можно обрабатывать как изображения или документы в соответствии с конкретными требованиями для вашего варианта использования. Точно так же файлы MP4/M4V и MOV можно обрабатывать как видео- или аудиофайлы, что позволяет выбрать оптимальный способ обработки контента.
Поддержка внедренных гиперссылок позволяет BDA обнаруживать и возвращать внедренные гиперссылки, обнаруженные в PDF-файлах, в рамках стандартного вывода BDA. Эта функция расширяет возможности извлечения информации из документов, сохраняя ценные ссылки для таких приложений, как базы знаний, исследовательские инструменты и системы индексирования контента.
Наконец, BDA теперь поддерживает обработку документов объемом до 3000 страниц на документ, что вдвое превышает прежнее ограничение в 1500 страниц. Это увеличенное ограничение позволяет обрабатывать большие документы, не разбивая их на части, что упрощает рабочие процессы для предприятий, работающих с длинными документами или пакетами документов.
Автоматизация обработки данных Amazon Bedrock обычно доступна в регионах AWS «Запад США» (Орегон) и «Восток США» (Северная Вирджиния).
Чтобы узнать больше, посетите страницу Автоматизации данных Bedrock или просмотрите документацию.