Amazon Lex công bố các mô hình nhận dạng giọng nói đa ngôn ngữ mới
Chúng tôi rất hân hạnh thông báo về việc ra mắt các mô hình nhận dạng giọng nói luồng đa ngôn ngữ mới (ASR-2.0) trong Amazon Lex. Các mô hình này cải thiện độ chính xác trong việc nhận diện ngôn ngữ nhờ vào hai nhóm chuyên biệt: một mô hình dựa trên khu vực Châu Âu hỗ trợ các ngôn ngữ như tiếng Bồ Đào Nha, tiếng Catalan, tiếng Pháp, tiếng Ý, tiếng Đức và tiếng Tây Ban Nha, còn một mô hình khác dựa trên khu vực Châu Á Thái Bình Dương, hỗ trợ tiếng Trung, tiếng Hàn và tiếng Nhật.
Các mô hình phát trực tuyến đa ngôn ngữ của Amazon Lex này sử dụng các mẫu ngôn ngữ chung trong mỗi nhóm, giúp tăng độ chính xác khi nhận diện. Các mô hình này đặc biệt xuất sắc trong việc nhận dạng giọng nói có chữ viết và số, giúp việc hiểu chính xác lời nói của khách hàng trở nên dễ dàng. Điều này là yếu tố then chốt trong việc xác định người gọi và tự động hóa các tác vụ trong các ứng dụng Phản hồi giọng nói tương tác (IVR). Ví dụ: Các mô hình mới giúp nhận diện chính xác hơn các thông tin như số tài khoản, mã xác thực, số sê-ri và mã sản phẩm. Những cải tiến này áp dụng cho tất cả các biến thể khu vực của các ngôn ngữ được hỗ trợ, ví dụ như cả tiếng Pháp Châu Âu và tiếng Pháp Canada đều sẽ được hưởng lợi từ những nâng cấp này. Ngoài ra, các mô hình mới đã cải thiện độ chính xác trong việc nhận diện người dùng không phải là người bản ngữ cũng như các đặc điểm khu vực khác nhau, giúp các tương tác trở nên toàn diện và đáng tin cậy hơn. Các mô hình này hiện đã trở thành chuẩn mực cho các ngôn ngữ hỗ trợ trong Amazon Lex và khách hàng chỉ cần cập nhật lại các bot hiện có của mình để khai thác những cải tiến này.
Các mô hình ASR-2.0 mới hiện có sẵn tại tất cả các khu vực hỗ trợ Amazon Lex V2.