Amazon Polly

Dùng deep learning để chuyển từ văn bản sang tiếng nói giống thật

Nghe Amazon Polly >>

Amazon Polly là dịch vụ chuyển từ văn bản sang tiếng nói giống thật, cho phép bạn tạo các ứng dụng có thể nói chuyện, và phát triển những mục sản phẩm có tiếng nói hoàn toàn mới. Amazon Polly là dịch vụ Text-to-Speech (từ văn bản sang tiếng nói) sử dụng công nghệ deep learning để tổng hợp thành giọng nói giống người.

Với hàng chục âm thanh giống thật của nhiều ngôn ngữ, bạn có thể lựa chọn giọng nói lý tưởng và xây dựng ứng dụng có giọng nói có thể hoạt động ở các nước khác nhau.

Giới thiệu về Amazon Polly
Ngôn ngữ Nữ Nam Văn bản mẫu
Tiếng Anh Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
Tiếng Đan Mạch Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Tiếng Bồ Đào Nha tại Brazil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Tiếng Tây Ban Nha Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.no
Tiếng Pháp Léa Mathieu Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
Tiếng Nhật Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Tiếng Hàn Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。
Hãy xem danh sách đầy đủ những giọng nói và ngôn ngữ mà Amazon Polly hỗ trợ tại đây.

Lợi ích

Giọng nói có tính tự nhiên

Amazon Polly cung cấp hàng chục ngôn ngữ và nhiều lựa chọn cho giọng nói nam hay nữ có tính tự nhiên. Với khả năng đọc phát âm mượt mà của Amazon Polly, bạn có thể đem lại giọng nói chất lượng cao cho đối tượng toàn cầu.

Lưu trữ và tái phân phối tiếng nói

Amazon Polly cho phép miễn phí dùng không giới hạn tiếng nói được tạo. Bạn có thể tạo các tệp giọng nói ở định dạng chuẩn như MP3 và OGG, lưu chúng trên đám mây hoặc trong cục bộ ứng dụng hoặc thiết bị để dùng ngoại tuyến.

Truyền dòng dữ liệu thời gian thực

Để đem lại những giọng nói giống thật và trải nghiệm trò chuyện cho người dùng, cần phải có thời gian đáp ứng luôn luôn ngắn. Khi bạn gửi văn bản tới API của Amazon Polly, ứng dụng của bạn sẽ nhận âm thanh theo cách truyền dữ liệu để bạn có thể dùng giọng nói ngay lập tức. 

Tùy chỉnh và điều khiển tiếng nói được phát

Sửa giọng nói của Amazon Polly sao cho phù hợp với nhu cầu của bạn nhất – Amazon Polly hỗ trợ bộ từ điển và các thẻ SSML, cho phép bạn điều khiển các yếu tố của tiếng nói, như cách phát âm, âm lượng, độ cao thấp, tốc độ, v.v.  

 

 

Chi phí thấp

Amazon Polly có giá trả theo lượng sử dụng, chí phí mỗi ký tự được chuyển đổi thấp, và khả năng dùng không giới hạn khiến dịch vụ này đem lại hiệu quả chi phí cao để đem lại giọng nói cho ứng dụng của bạn.

Trường hợp sử dụng

Tạo nội dung

Có thể dùng thêm âm thanh bên cạnh chữ viết hay hình ảnh. Khi có giọng đọc nội dung, bạn cung cấp cho đối tượng của bạn một cách tiếp cận thông tin khác, đáp ứng nhu cầu của một bộ phận người đọc lớn hơn. Amazon Polly có thể tạo tiếng nói ở hàng chục thứ tiếng, đơn giản hóa việc thêm tiếng nói cho ứng dụng có đối tượng toàn cầu như nguồn RSS, trang web hay video.

Ví dụ: Chuyển đổi một bài viết sang tiếng nói và tải về ở định dạng MP3
Polly-1-Content_Creation@2x
Goanimate

“Amazon Polly cho phép người dùng GoAnimate có thể cho các nhân vật hoạt hình được tạo một giọng nói nhờ nền tảng của chúng tôi. Nó sẽ cực kì hữu ích trong những tình huống mà không thể có giọng người đọc do nguồn lực hoặc thời gian không cho phép, ví dụ như khi làm một video có nhiều thứ tiếng hoặc khi trong giai đoạn tiền sản xuất để thúc đẩy nhanh quá trình chấp thuận. Tiếng nói được tích hợp thông suốt với các tài nguyên hoạt hình sẵn có phong phú của chúng tôi, củng cố thêm tính năng dễ sử dụng của GoAnimate và cho khách hàng của chúng tôi cả hiệu quả lẫn tốc độ ra mắt thị trường.”

– Alvin Hung, CEO và nhà sáng lập của GoAnimate

Xem tình huống điển hình >>

Học trực tuyến

Amazon Polly cho phép các nhà phát triển đưa vào ứng dụng của họ một trải nghiệm thị giác nâng cao, như cử động mặt khớp tiếng nói được tạo, hay làm nổi bật chữ kiểu karaoke. Amazon Polly đơn giản hóa việc yêu cầu thêm một luồng siêu dữ liệu thông tin về khoảnh khắc mà câu, từ hay âm thanh được phát âm. Khi sử dụng luồng siêu dữ liệu này cùng với luồng âm thanh tiếng nói tổng hợp, khách hàng có thể làm cử động những hình ảnh đại diện và làm nổi bật chữ khi được phát âm trên ứng dụng.

Ví dụ: Nghe bài nói và làm nổi bật chữ được phát âm
Polly-4-Language-Learning@2x
Duolingo

“Tôi không thể nghĩ ra trường hợp sử dụng nào mà đặt nặng việc phát âm chính xác hơn là khi học ngoại ngữ mới cả. Chúng tôi thấy giọng nói của Amazon Polly vừa có chất lượng cao, vừa nghe tự nhiên như tiếng nói của người, phù hợp để dạy ngoại ngữ.”

– Severin Hacker, CTO, Duolingo

Đọc blog của họ >>

Điện thoại

Với Amazon Polly, trung tâm liên lạc của bạn có thể gặp gỡ khách hàng với giọng nói tự nhiên. Bạn có thể lưu và dùng lại tiếng nói được phát ra cho người gọi của Amazon Polly qua các hệ thống trả lời giọng nói tương tác (IVR) như Amazon Connect. Ngoài ra, bạn có thể dùng API của Amazon Polly để đưa ra các thông tin thời gian thực tự động như tình trạng dịch vụ, truy vấn tài khoản và hóa đơn, địa chỉ và thông tin liên lạc.

Ví dụ: Text-to-speech cho hệ thống điện thoại
Polly-2-Customer_Contact_Center@2x
bandwidth-hdr-logo

“Bandwidth xây dựng một ứng dụng TTS nhỏ, nhanh và đáng tin cậy, được hỗ trợ bởi Amazon Polly. Chúng tôi đang sử dụng giọng nói chất lượng cao mà có chi phí thấp. Điều đáng ngạc nhiên là nhà phát triển phải bỏ ra khá ít công sức để xây dựng dịch vụ mới này.”

– Yiannis Philipopoulos, nhà phát triển phần mềm cấp cao, Bandwidth 

Đọc blog của họ >>

Tìm hiểu thêm về Amazon Polly

Truy cập trang tính năng
Bạn đã sẵn sàng xây dựng chưa?
Bắt đầu với Amazon Polly
Bạn có thêm câu hỏi?
Hãy liên hệ với chúng tôi