Công bố Amazon Nova 2 Sonic cho AI giao tiếp theo thời gian thực
Hôm nay, Amazon công bố hỗ trợ Amazon Nova 2 Sonic, mô hình chuyển giọng nói thành giọng nói của chúng tôi về AI giao tiếp tự nhiên, theo thời gian thực. Mô hình này mang lại khả năng hiểu giọng nói trực tuyến xuất sắc nhất với khả năng hoạt động vững vàng trước tạp âm nền và cách nói của người dùng, khả năng xử lý hội thoại hiệu quả và tạo giọng nói bằng các giọng nói diễn cảm như người bản xứ bằng nhiều ngôn ngữ (giọng nói đa ngữ). Mô hình này có khả năng lập luận, làm theo hướng dẫn và độ chính xác khi gọi công cụ vượt trội so với mô hình trước.
Nova 2 Sonic phát triển dựa trên những khả năng của mô hình Nova Sonic gốc, với các tính năng mới như hỗ trợ ngôn ngữ mở rộng (tiếng Bồ Đào Nha và tiếng Hindi), giọng nói đa ngữ cho phép mô hình nói nhiều ngôn ngữ khác nhau với độ diễn cảm như người bản xứ ở cùng một giọng nói, khả năng kiểm soát lượt thoại, giúp nhà phát triển điều chỉnh độ nhạy ở mức thấp, trung bình hoặc cao khi phát hiện khoảng dừng. Mô hình cũng bổ sung khả năng tương tác đa phương thức, cho phép người dùng chuyển đổi liền mạch giữa giọng nói và văn bản trong cùng một phiên, gọi công cụ không đồng bộ để hỗ trợ các tác vụ nhiều bước mà không làm gián đoạn luồng hội thoại và cửa sổ ngữ cảnh một triệu token để tương tác bền vững.
Nhà phát triển có thể tích hợp Nova Sonic 2 trực tiếp vào hệ thống giọng nói theo thời gian thực bằng API truyền hai chiều của Amazon Bedrock. Nova Sonic 2 hiện cũng tích hợp liền mạch với Amazon Connect và các nhà cung cấp dịch vụ điện thoại hàng đầu khác, bao gồm cả Vonage, Twilio và AudioCodes, cũng như các khung nguồn mở như LiveKit và Pipecat.
Amazon Nova 2 Sonic có trong Amazon Bedrock tại các Khu vực AWS sau: Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon) và Châu Á Thái Bình Dương (Tokyo). Để tìm hiểu thêm, hãy đọc Blog tin tức AWS và Hướng dẫn sử dụng Amazon Nova Sonic. Để bắt đầu sử dụng Nova Sonic 2 trong Amazon Bedrock, hãy truy cập bảng điều khiển Amazon Bedrock.