Amazon Polly

Chuyển đổi văn bản thành giọng nói chân thực bằng cách dùng deep learning

Amazon Polly là dịch vụ chuyển từ văn bản thành giọng nói chân thực, cho phép bạn tạo các ứng dụng có thể nói chuyện và phát triển những thể loại sản phẩm được trang bị khả năng nói hoàn toàn mới. Amazon Polly là dịch vụ Text-to-Speech (TTS) (từ văn bản sang giọng nói) sử dụng công nghệ deep learning tiên tiến để tổng hợp thành giọng nói giống người.

Với hàng chục giọng nói chân thực theo nhiều ngôn ngữ, bạn có thể lựa chọn giọng nói lý tưởng và xây dựng ứng dụng có giọng nói hoạt động ở nhiều nước khác nhau. Ngoài giọng TTS Tiêu chuẩn, Amazon Polly còn cung cấp giọng nói Neural Text-to-Speech (NTTS), mang đến những cải tiến nâng cao trong chất lượng giọng nói qua phương pháp machine learning mới, mang lại cho khách hàng một trong những giọng nói text-to-speech tự nhiên và giống con người nhất trên thị trường. Công nghệ TTS Nơ-ron cũng hỗ trợ kiểu đọc Newscaster được tùy chỉnh theo trường hợp sử dụng tường thuật tin tức.

Nghe giọng Newscaster của Amazon Polly »
Giới thiệu về Amazon Polly (2:08)
Ngôn ngữ Nữ Nam Văn bản mẫu
Tiếng Anh

Joanna (Tiêu chuẩn)

Joanna (Nơ-ron)

Matthew (Tiêu chuẩn) 

Matthew (Nơ-ron)

Hello. Do you speak a foreign language? One language is never enough.
Tiếng Bồ Đào Nha tại Brazil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Tiếng Đan Mạch Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Tiếng Pháp Léa Mathieu Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
Tiếng Nhật Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
Tiếng Hàn Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다.
Mandarin Chinese Zhiyu   你好,你会不会说其他外语?只会一种语言是不够的。
Tiếng Tây Ban Nha Penélope Miguel ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Hãy xem danh sách đầy đủ những giọng nói và ngôn ngữ mà Amazon Polly hỗ trợ tại đây.

Lợi ích

Giọng nói có tính tự nhiên

Amazon Polly cung cấp hàng chục ngôn ngữ và nhiều lựa chọn cho giọng nói nam hay nữ có tính tự nhiên. Với khả năng đọc phát âm mượt mà của Amazon Polly, bạn có thể đem lại giọng nói chất lượng cao cho đối tượng toàn cầu.

Lưu trữ và tái phân phối tiếng nói

Amazon Polly cho phép miễn phí dùng không giới hạn tiếng nói được tạo. Bạn có thể tạo các tệp giọng nói ở định dạng chuẩn như MP3 và OGG, lưu chúng trên đám mây hoặc trong cục bộ ứng dụng hoặc thiết bị để dùng ngoại tuyến.

Truyền dòng dữ liệu thời gian thực

Để đem lại những giọng nói giống thật và trải nghiệm trò chuyện cho người dùng, cần phải có thời gian đáp ứng luôn luôn ngắn. Khi bạn gửi văn bản tới API của Amazon Polly, ứng dụng của bạn sẽ nhận âm thanh theo cách truyền dữ liệu để bạn có thể dùng giọng nói ngay lập tức. 

Tùy chỉnh và điều khiển tiếng nói được phát

Sửa giọng nói của Amazon Polly sao cho phù hợp với nhu cầu của bạn nhất – Amazon Polly hỗ trợ bộ từ điển và các thẻ SSML, cho phép bạn điều khiển các yếu tố của tiếng nói, như cách phát âm, âm lượng, độ cao thấp, tốc độ, v.v.  

 

 

Chi phí thấp

Amazon Polly có giá trả theo lượng sử dụng, chí phí mỗi ký tự được chuyển đổi thấp, và khả năng dùng không giới hạn khiến dịch vụ này đem lại hiệu quả chi phí cao để đem lại giọng nói cho ứng dụng của bạn.

Trường hợp sử dụng

Tạo nội dung

Có thể dùng thêm âm thanh bên cạnh chữ viết và/hoặc hình ảnh. Khi có giọng đọc nội dung, bạn cung cấp cho đối tượng của bạn một cách tiếp cận thông tin khác, đáp ứng nhu cầu của một bộ phận người đọc lớn hơn. Amazon Polly có thể tạo tiếng nói ở hàng chục thứ tiếng, đơn giản hóa việc thêm tiếng nói cho ứng dụng có đối tượng toàn cầu như nguồn RSS, trang web hay video.

Ví dụ: Chuyển đổi một bài viết sang bài nói và tải về ở định dạng MP3
Chuyển đổi một bài viết sang bài nói và tải về ở định dạng MP3
GoAnimate

“Amazon Polly cho phép người dùng GoAnimate cung cấp giọng nói cho các nhân vật hoạt hình được tạo nhờ nền tảng của chúng tôi. Nó sẽ cực kì hữu ích trong những tình huống mà không thể có giọng người đọc do nguồn lực hoặc thời gian không cho phép, ví dụ như khi làm một video có nhiều thứ tiếng hoặc khi trong giai đoạn tiền sản xuất để thúc đẩy nhanh quá trình chấp thuận. Tiếng nói được tích hợp thông suốt với các tài nguyên hoạt hình sẵn có phong phú của chúng tôi, củng cố thêm tính năng dễ sử dụng của GoAnimate và cho khách hàng của chúng tôi cả hiệu quả lẫn tốc độ ra mắt thị trường.”

– Alvin Hung, CEO và nhà sáng lập của GoAnimate

Xem tình huống điển hình >>

Học trực tuyến

Amazon Polly cho phép các nhà phát triển đưa vào ứng dụng của họ một trải nghiệm thị giác nâng cao, như cử động mặt khớp tiếng nói được tạo, hay làm nổi bật chữ kiểu karaoke. Amazon Polly đơn giản hóa việc yêu cầu thêm một luồng siêu dữ liệu thông tin về khoảnh khắc mà câu, từ hay âm thanh được phát âm. Khi sử dụng luồng siêu dữ liệu này cùng với luồng âm thanh tiếng nói tổng hợp, khách hàng có thể làm cử động những hình ảnh đại diện và làm nổi bật chữ khi được phát âm trên ứng dụng.

Ví dụ: Nghe bài nói và làm nổi bật chữ được phát âm
Nghe bài nói và làm nổi bật chữ được phát âm
Duolingo

“Tôi không thể nghĩ ra trường hợp sử dụng nào mà đặt nặng việc phát âm chính xác hơn là khi học ngoại ngữ mới cả. Chúng tôi thấy giọng nói của Amazon Polly vừa có chất lượng cao, vừa nghe tự nhiên như tiếng nói của người, phù hợp để dạy ngoại ngữ.”

– Severin Hacker, CTO, Duolingo

Đọc blog của họ >>

Điện thoại

Với Amazon Polly, trung tâm liên lạc của bạn có thể gặp gỡ khách hàng với giọng nói tự nhiên. Bạn có thể lưu và dùng lại tiếng nói được phát ra cho người gọi của Amazon Polly qua các hệ thống trả lời giọng nói tương tác (IVR) như Amazon Connect. Ngoài ra, bạn có thể dùng API của Amazon Polly để đưa ra các thông tin thời gian thực tự động như tình trạng dịch vụ, truy vấn tài khoản và hóa đơn, địa chỉ và thông tin liên lạc.

Ví dụ: Chuyển văn bản thành lời nói cho hệ thống điện thoại
Chuyển văn bản thành lời nói cho hệ thống điện thoại
Băng thông

“Băng thông xây dựng một ứng dụng TTS nhỏ, nhanh và đáng tin cậy, được hỗ trợ bởi Amazon Polly. Chúng tôi đang sử dụng giọng nói chất lượng cao mà có chi phí thấp. Điều đáng ngạc nhiên là nhà phát triển phải bỏ ra khá ít công sức để xây dựng dịch vụ mới này.”

– Ông Yiannis Philipopoulos, Nhà phát triển phần mềm, Bandwidth 

Đọc blog của họ >>

Tìm hiểu thêm về Amazon Polly

Truy cập trang tính năng
Bạn đã sẵn sàng xây dựng chưa?
Bắt đầu với Amazon Polly
Bạn có thêm câu hỏi?
Hãy liên hệ với chúng tôi