Браузер Amazon Bedrock AgentCore добавляет возможности взаимодействия на уровне ОС
Браузер Amazon Bedrock AgentCore теперь поддерживает возможности взаимодействия на уровне ОС, что позволяет автоматизировать рабочие процессы браузера, требующие прямого управления операционной системой за рамками возможностей протокола Chrome DevTools (CDP). Это усовершенствование предназначено для сценариев автоматизации, в которых одного протокола CDP недостаточно, таких как операции с мышью, диалоговые окна печати, системные оповещения и сочетания клавиш. Эта функция ориентирована на разработчиков агентов ИИ, инженеров по автоматизации тестирования, а также организаций, создающих инструменты веб-взаимодействия на основе LLM.
Новые возможности обеспечивают автоматизацию операций с мышью (щелчок, перемещение, перетаскивание, прокрутка), клавиатурой (ввод текста, нажатие клавиш и их сочетания, например CTRL+A и CTRL+P) и полных скриншотов рабочего стола. Все это – в координатах на уровне ОС за пределами окна просмотра браузера. Основные примеры использования включают автоматическое тестирование с обработкой системных диалогов, рабочие процессы управления документами, сложные взаимодействия с пользовательским интерфейсом через контекстные меню и агентов ИИ на основе машинного зрения, которым требуется полная видимость среды браузера.
Данная функция доступна по умолчанию на всех инстансах браузера во всех 14 регионах AWS, где доступен браузер Amazon Bedrock AgentCore: Восток США (Огайо, Северная Вирджиния), Запад США (Орегон), Европа (Ирландия, Лондон, Париж, Стокгольм, Франкфурт), Азиатско-Тихоокеанский регион (Мумбаи, Сеул, Сингапур, Сидней, Токио) и Канада (Центральная).
Дополнительные сведения см. в документации браузера AgentCore.