Среда выполнения Amazon Bedrock AgentCore добавляет поддержку WebRTC для двунаправленной потоковой передачи в реальном времени
Среда выполнения Amazon Bedrock AgentCore теперь поддерживает WebRTC для двунаправленной потоковой передачи в реальном времени между клиентами и агентами в дополнение к существующей поддержке протокола WebSocket. С помощью WebRTC разработчики могут создавать голосовых агентов для браузерных и мобильных приложений, которые обеспечивают двунаправленную потоковую передачу аудио и видео с низкой задержкой с помощью однорангового UDP-соединения. Это позволяет реализовать естественное общение в реальном времени.
WebRTC – второй протокол двунаправленной потоковой передачи, поддерживаемый Средой выполнения AgentCore, вдобавок к WebSocket. В то время как WebSocket обеспечивает постоянные полнодуплексные соединения для потоковой передачи текста и аудио по TCP, протокол WebRTC оптимизирован для доставки медиаданных в реальном времени, когда критически важна низкая задержка, например для голосовых агентов в браузерных и мобильных приложениях. Для работы WebRTC с медиатрафиком требуется ретранслятор TURN. Среда выполнения AgentCore обеспечивает гибкость настройки этого компонента: можно выбрать управляемый ретранслятор TURN через Видеопотоки Amazon Kinesis для создания полностью управляемого решения с нативной интеграцией AWS IAM, сервис стороннего провайдера или собственную инфраструктуру TURN. Оба протокола выигрывают от изоляции, наблюдаемости и масштабирования сеансов в Среде выполнения AgentCore.
WebRTC в Среде выполнения AgentCore поддерживается в 14 регионах AWS: Азиатско-Тихоокеанский регион (Мумбаи, Сеул, Сидней, Сингапур, Токио), Восток США (Огайо, Северная Вирджиния), Запад США (Орегон), Европа (Ирландия, Лондон, Париж, Стокгольм, Франкфурт) и Канада (Центральная).
Чтобы начать работу, ознакомьтесь с материалом Двунаправленная потоковая передача в документации по Bedrock AgentCore. В нем представлены готовые к развертыванию примеры для обоих протоколов: голосовой агент Amazon Nova Sonic с сервером TURN на базе KVS, голосовые агенты Pipecat с использованием WebSocket, WebRTC и транспортного протокола Daily, голосовой агент LiveKit и голосовой агент на базе SDK Strands Agents.