Amazon Transcribe

Nhận dạng giọng nói tự động

Amazon Transcribe là dịch vụ nhận dạng giọng nói tự động (ASR) giúp các nhà phát triển dễ dàng bổ sung khả năng chuyển giọng nói thành văn bản vào các ứng dụng của họ. Bằng cách sử dụng API Amazon Transcribe, bạn có thể phân tích các tệp âm thanh được lưu trữ trên Amazon S3 và yêu cầu dịch vụ trả về tệp văn bản của giọng nói đã được ghi lại thành văn bản.

Bạn có thể sử dụng Amazon Transcribe cho nhiều ứng dụng phổ biến, trong đó có ghi lại thành văn bản các cuộc gọi dịch vụ khách hàng và tạo phụ đề cho nội dung âm thanh và video. Dịch vụ này có khả năng ghi thành văn bản các tệp âm thanh được lưu trữ dưới các định dạng phổ biến, ví dụ như WAV và MP3, với nhãn thời gian cho từng từ để bạn có thể dễ dàng định vị âm thanh trong nguồn gốc bằng cách tìm đoạn văn bản. Amazon Transcribe liên tục học hỏi và cải thiện để có thể bắt kịp nhịp phát triển của ngôn ngữ.

Hội nghị thượng đỉnh San Francisco AWS 2018 – Amazon Transcribe nay đã được cung cấp rộng rãi

Tính năng chính

Bản chuyển lời thoại dễ đọc

Hầu hết các hệ thống nhận dạng giọng nói đều cho ra một chuỗi văn bản mà không có dấu câu. Amazon Transcribe sử dụng deep learning để thêm dấu câu và tự động định dạng để tệp kết quả dễ đọc hơn và có thể sử dụng mà không phải chỉnh sửa gì thêm.

Kho từ vựng tùy chỉnh

Amazon Transcribe cho bạn khả năng mở rộng và tùy chỉnh kho từ vựng để nhận dạng giọng nói. Bạn có thể thêm từ mới vào kho từ vựng cơ sở và tạo ra các bản chép có độ chính xác cao theo trường hợp sử dụng của bạn, ví dụ: tên sản phẩm, thuật ngữ theo lĩnh vực chuyên môn hoặc tên người.

Tạo nhãn thời gian

Amazon Transcribe sẽ trả về nhãn thời gian cho từng từ để bạn có thể dễ dàng xác định âm thanh của từ đó trong bản ghi gốc bằng cách tìm văn bản.

 

Nhận dạng nhiều người nói

Amazon Transcribe có khả năng nhận dạng khi người nói thay đổi và tạo thuộc tính thích hợp cho văn bản được chuyển lời thoại từ âm thanh. Khả năng này có thể giảm đáng kể lượng công việc cần thực hiện để thành văn bản các đoạn âm thanh có nhiều người nói như cuộc gọi điện thoại, cuộc họp và chương trình truyền hình.

Hỗ trợ nhiều trường hợp sử dụng đa dạng

Amazon Transcribe được thiết kế để cung cấp bản chuyển lời thoại chính xác và tự động hóa cho nhiều chất lượng âm thanh đa dạng. Bạn có thể tạo phụ đề cho bất kỳ tệp video hoặc âm thanh nào và thậm chí chuyển thành văn bản các bản ghi âm điện thoại có chất lượng thấp, ví dụ như các cuộc gọi dịch vụ khách hàng.

Tổng hợp kênh (sắp ra mắt)

Amazon Transcribe sẽ xử lý âm thanh tốt hơn khi mỗi người nói được ghi trên một kênh khác nhau. Các trung tâm liên hệ sẽ được hưởng lợi đáng kể khi gửi một tệp âm thanh đơn lẻ tới Amazon Transcribe, dịch vụ này sẽ xác định hai kênh âm thanh, tách chúng ra, ghi lại lời nói của mỗi người từ mỗi kênh, sau đó ghép vào và xuất ra một bản chuyển lời thoại dễ hiểu đã gắn nhãn từng kênh.

Trường hợp sử dụng

Amazon Transcribe có thể cung cấp bản chuyển lời thoại của nhiều loại trường hợp sử dụng đa dạng, trong đó có dịch vụ khách hàng, tạo phụ đề, tìm kiếm và tuân thủ.

Cải thiện dịch vụ khách hàng

Bằng cách chuyển âm thanh thu được thành văn bản, Amazon Transcribe sẽ giúp bạn dựng các ứng dụng phân tích văn bản có khả năng tìm kiếm và phân tích giọng nói đầu vào. Trung tâm liên hệ khách hàng có thể sử dụng Amazon Transcribe để chuyển lời thoại cho các đoạn tương tác bằng giọng nói và khai thác dữ liệu để tìm thông tin chi tiết bằng cách sử dụng các dịch vụ AWS như Amazon Comprehend để trích xuất ngữ nghĩa và chủ ý từ các cuộc hội thoại.

Quy trình tạo phụ đề/thuyết minh

Amazon Transcribe có thể giúp các đơn vị tạo nội dung và phân phối nội dung đa phương tiện cải thiện khả năng tiếp cận và truyền thông bằng cách tự động tạo phụ đề có nhãn thời gian có thể hiển thị song song với nội dung video.

Tạo danh mục lưu trữ âm thanh

Dịch vụ này đem đến cho bạn khả năng chuyển âm thanh và các tài sản video thành nội dung lưu trữ có thể tìm kiếm để phục vụ công tác theo dõi tuân thủ và quản lý rủi ro. Khách hàng có thể sử dụng Amazon Transcribe để chuyển âm thanh thành văn bản và sử dụng Amazon Elasticsearch Service để tạo chỉ mục và thực hiện tìm kiếm theo văn bản cho toàn bộ thư viện âm thanh/video của mình.

Khách hàng của Amazon Transcribe

Tìm hiểu thêm về giá Amazon Transcribe

Truy cập trang giá
Bạn đã sẵn sàng xây dựng chưa?
Bắt đầu với Amazon Transcribe
Bạn có thêm câu hỏi?
Hãy liên hệ với chúng tôi