실시간 대화형 AI, Amazon Nova 2 Sonic 발표
오늘 Amazon은 자연스러운 실시간 대화형 AI를 위한 음성-음성 변환 모델인 Amazon Nova 2 Sonic의 출시를 발표했습니다. 배경 소음과 사용자의 말투에 구애받지 않는 동급 최고의 스트리밍 음성 이해도, 효율적인 대화 처리, 다국어로 지원되는 표현력 있는 음성(Polyglot voice)을 통한 음성 기능을 제공합니다. 이전 모델에 비해 추론(reasoning), 명령 따르기 및 도구 간접 호출 정확도가 뛰어납니다.
Nova 2 Sonic은 오리지널 Nova Sonic 모델의 기능을 기반으로 확장된 언어 지원(포르투갈어 및 힌디어), 모델이 동일한 음성으로 다양한 언어를 유창하게 구사하는 다중 언어 음성, 개발자가 낮음, 중간 또는 높은 일시 중지 감도를 설정할 수 있도록 하는 턴 테이킹 제어 기능 등 새로운 기능을 제공합니다. 또한 이 모델에는 크로스 모달 상호 작용이 추가되어 사용자가 동일한 세션에서 음성과 텍스트 사이를 원활하게 전환할 수 있으며, 대화 흐름을 방해하지 않고 다단계 태스크를 지원하는 비동기 도구 직접 호출, 지속적인 상호 작용을 위한 1백만 토큰 컨텍스트 창이 추가되었습니다.
개발자는 Amazon Bedrock의 양방향 스트리밍 API를 사용하여 Nova Sonic 2를 실시간 음성 시스템에 직접 통합할 수 있습니다. 또한 Nova Sonic 2는 이제 Amazon Connect 및 Vonage, Twilio 및 AudioCodes를 비롯한 기타 주요 텔레포니 제공업체뿐만 아니라 LiveKit 및 Pipecat과 같은 오픈 소스 프레임워크와도 원활하게 통합됩니다.
Amazon Nova 2 Sonic은 미국 동부(버지니아 북부), 미국 서부(오리건) 및 아시아 태평양(도쿄) AWS 리전의 Amazon Bedrock에서 사용할 수 있습니다. 자세히 정보는 AWS 뉴스 블로그와 Amazon Nova Sonic 사용 설명서를 참조하세요. Amazon Bedrock에서 Nova Sonic 2를 사용하려면 Amazon Bedrock 콘솔을 방문하세요.