Các tính năng của Amazon Transcribe

Amazon Transcribe là dịch vụ nhận dạng giọng nói tự động (ASR) dựa trên mô hình nền tảng giọng nói hỗ trợ hơn 100 ngôn ngữ. Các tính năng của Transcribe cho phép bạn tải nhập dữ liệu đầu vào âm thanh, tạo bản chép lời dễ đọc và dễ xem xét, cải thiện độ chính xác thông qua tính năng tùy chỉnh và lọc nội dung để đảm bảo quyền riêng tư của khách hàng.

Đầu vào âm thanh

Transcribe được thiết kế để xử lý dữ liệu đầu vào âm thanh hoặc video trực tiếp và được thu sẵn nhằm mang đến các bản chép lời chất lượng cao cho mục đích tìm kiếm và phân tích. Chúng tôi cũng cung cấp các API riêng biệt có khả năng hiểu rõ cuộc gọi của khách hàng (Phân tích cuộc gọi của Amazon Transcribe) và các cuộc trao đổi về y tế (Amazon Transcribe Medical).

Chép lời phát trực tuyến và hàng loạt

Bạn có thể xử lý các bản ghi âm thanh hiện có của mình hoặc phát trực tuyến âm thanh để chép lời theo thời gian thực. Sử dụng kết nối bảo mật, bạn có thể gửi luồng âm thanh trực tiếp đến dịch vụ và nhận được một luồng văn bản trả về.

Mô hình cụ thể theo lĩnh vực

Chọn một mô hình được điều chỉnh cho các cuộc gọi điện thoại hoặc nội dung video đa phương tiện. Ví dụ: Transcribe thích ứng với âm thanh điện thoại có độ trung thực thấp, thường gặp tại các trung tâm liên hệ.

Nhận dạng ngôn ngữ tự động

Với Amazon Transcribe, bạn có thể tự động xác định ngôn ngữ chiếm ưu thế trong tệp âm thanh và tạo bản chép lời. Điều này rất hữu ích khi thư viện phương tiện của bạn chứa tệp âm thanh bằng các ngôn ngữ khác nhau. Bạn cũng có thể sử dụng tính năng này để phân loại nội dung phương tiện và xác minh rằng ngôn ngữ nói chính trong video và podcast của bạn được gắn nhãn chính xác.

Bản chép lời dễ đọc

Amazon Transcribe cho phép bạn tạo bản chép lời chính xác, dễ đọc, xem xét và tích hợp vào các ứng dụng cụ thể của mình. Chúng tôi nỗ lực để mang đến dữ liệu đầu ra có thể sẵn sàng phục vụ cho các hoạt động hạ nguồn như phân tích bản chép lời từ cuộc gọi, tạo phụ đề và tìm kiếm nội dung.

Chuẩn hóa dấu câu và con số

Amazon Transcribe tự động thêm dấu câu và định dạng số để dữ liệu đầu ra có chất lượng gần bằng với chất lượng chép lời thủ công mà chỉ tốn rất ít thời gian và chi phí. Các con số cũng được phiên âm thành chữ số hoặc “dạng thông thường” thay vì từ ngữ.

Tạo dấu thời gian

Amazon Transcribe sẽ trả về dấu thời gian cho từng từ để bạn có thể dễ dàng tìm thấy một từ hoặc cụm từ trong bản ghi gốc hoặc thêm phụ đề vào video.

Nhận dạng nhiều người nói

Nhiều người nói khác nhau được tự động nhận dạng và gán thuộc tính vào văn bản để nắm bắt các tình huống như cuộc gọi điện thoại, cuộc họp và chương trình truyền hình một cách chính xác. Tìm hiểu thêm về nhận dạng người nói.

Nhận dạng kênh

Các trung tâm liên hệ có thể gửi một tệp âm thanh tới Amazon Transcribe, sau đó dịch vụ sẽ xác định và xuất ra một bản chép lời được chú thích tự động theo nhãn kênh.

Tùy chỉnh dữ liệu đầu ra của bạn

Độ chính xác là yếu tố rất quan trọng và chúng tôi cung cấp cho bạn nhiều tùy chọn để tùy chỉnh bản chép lời theo nhu cầu kinh doanh cụ thể và ngôn ngữ bản địa của bạn. Transcribe cũng cung cấp tối đa 10 bản chép lời thay thế cho mỗi câu, vì vậy bạn có thể nhanh chóng lựa chọn phương án tốt nhất áp dụng cho nội dung và lĩnh vực của mình. Điều này rất hữu ích cho quy trình tạo phụ đề với sự tham gia của con người.

Kho từ vựng tùy chỉnh

Với kho từ vựng tùy chỉnh, bạn có thể thêm từ mới vào kho từ vựng cơ sở để tạo ra các bản chép lời có độ chính xác cao hơn đối với những từ và cụm từ thuộc lĩnh vực cụ thể, chẳng hạn như tên sản phẩm, thuật ngữ kỹ thuật hoặc tên người.

Mô hình ngôn ngữ tùy chỉnh

Khi cần thiết, bạn có thể xây dựng và đào tạo mô hình ngôn ngữ tùy chỉnh (CLM) của riêng mình cho trường hợp sử dụng và lĩnh vực của bạn bằng cách gửi một tập dữ liệu văn bản đến Amazon Transcribe. CLM là một tính năng phù hợp để tăng cường độ chính xác trong quá trình nhận dạng giọng nói với dữ liệu của riêng bạn.

Tính năng đảm bảo an toàn và quyền riêng tư của người dùng

Đảm bảo quyền riêng tư và sự an toàn của khách hàng là rất quan trọng. Khi cần, Transcribe sẽ cho phép bạn che chắn hoặc xóa các từ ngữ nhạy cảm hoặc không phù hợp với khán giả của bạn từ kết quả chép lời.

Lọc từ vựng

Bạn có thể chỉ định danh sách các từ cần xóa khỏi bản chép lời bằng tính năng lọc từ vựng. Ví dụ: bạn có thể chỉ định một danh sách từ tục tĩu hoặc từ phản cảm và Amazon Transcribe sẽ tự động xóa các từ đó khỏi bản chép lời.

Tính năng đảm bảo an toàn và quyền riêng tư của người dùng

Biên tập nội dung tự động/Biên tập PII

Khi được hướng dẫn, Amazon Transcribe có thể giúp khách hàng xác định và biên tập thông tin nhận dạng cá nhân (PII) nhạy cảm khỏi các bản chép lời của ngôn ngữ được hỗ trợ. Điều này cho phép các trung tâm liên hệ dễ dàng xem xét và chia sẻ bản chép lời để thu thập thông tin chuyên sâu về trải nghiệm của khách hàng và đào tạo nhân viên.

Bảo vệ dữ liệu

Bảo mật dữ liệu đang được lưu trữ bằng khóa Amazon S3 (SSE-S3) hoặc chỉ định khóa Dịch vụ quản lý khóa của AWS của riêng bạn. Amazon Transcribe sử dụng TLS (Bảo mật lớp truyền tải) 1.2, một giao thức mã hóa cho phép thực hiện các kết nối được xác thực và vận chuyển dữ liệu bảo mật trên internet qua HTTP, với chứng chỉ AWS để mã hóa dữ liệu đang được truyền. Điều này bao gồm bản chép lời phát trực tuyến.

Phát hiện nội dung âm thanh độc hại

Tính năng Phát hiện nội dung độc hại của Amazon Transcribe sử dụng công nghệ Máy học để duy trì các cuộc trò chuyện âm thanh văn minh và mang tính xây dựng nhằm khuyến khích một môi trường trực tuyến an toàn và hòa nhập. Nội dung âm thanh độc hại được gắn cờ vào một trong nhiều danh mục để người kiểm duyệt có thể dễ dàng nhận biết và thực hiện biện pháp thích hợp.

Phân tích cuộc gọi của Amazon Transcribe

Trích xuất thông tin chuyên sâu về cuộc trò chuyện như cảm xúc và độ lớn của giọng nói trong cuộc gọi để cải thiện năng suất nhân viên và trải nghiệm của khách hàng với tính năng Phân tích cuộc gọi của Amazon Transcribe.

Cải thiện năng suất trong các trung tâm liên hệ với tính năng tóm tắt cuộc gọi dựa trên AI tạo sinh

Tự động tạo tóm tắt cuộc gọi để giúp nhân viên tập trung vào việc cung cấp trải nghiệm khách hàng tuyệt vời và tăng năng suất bằng cách giảm bước tóm tắt thủ công sau cuộc gọi. Tính năng này tóm tắt quá trình tương tác với người gọi, nắm bắt các thành phần chính như lý do của cuộc gọi, các bước được thực hiện để giải quyết vấn đề và các bước tiếp theo. Giám sát viên của trung tâm liên hệ có thể xem lại tóm tắt cuộc gọi để nhanh chóng hiểu bối cảnh của tương tác mà không cần đọc toàn bộ bản chép lời khi nghiên cứu vấn đề của người gọi.

Trích xuất dữ liệu phân tích cuộc gọi chi tiết và thông tin chuyên sâu về cuộc trò chuyện

Khi sử dụng sức mạnh của công nghệ máy học, bạn có thể nhanh chóng áp dụng khả năng chuyển giọng nói thành văn bản và kỹ thuật xử lý ngôn ngữ tự nhiên để khám phá những thông tin chuyên sâu có giá trị về cuộc trò chuyện. Sau đó, bạn có thể tích hợp các thông tin chuyên sâu như cảm xúc của khách hàng và nhân viên, các vấn đề được phát hiện và những đặc điểm giọng nói như thời gian không đàm thoại, gián đoạn và tốc độ nói chuyện vào các ứng dụng phân tích cuộc gọi đến và đi của mình. Điều này có thể giúp giám sát viên của bạn dễ dàng xác định các vấn đề khách hàng tiềm ẩn, cơ hội huấn luyện nhân viên và xu hướng cuộc gọi.

Phân tích cuộc gọi của Amazon Transcribe

Cải thiện mức độ tuân thủ và giám sát với tính năng phân loại cuộc gọi tự động

Giám sát các cuộc gọi của bạn trên quy mô lớn để theo dõi việc tuân thủ các chính sách của công ty hoặc các yêu cầu theo quy định. Xây dựng và đào tạo các danh mục tùy chỉnh riêng của bạn dựa trên những tiêu chí bạn đặt ra (ví dụ: từ/cụm từ hoặc đặc điểm của cuộc trò chuyện). Ví dụ: bạn có thể thiết lập nhãn danh mục để xem tỷ lệ phần trăm cuộc gọi là bán thêm hay yêu cầu hủy tài khoản.

Tạo bản chép lời cuộc gọi phong phú

Cung cấp cho nhân viên của bạn quyền truy cập vào thông tin chi tiết về cuộc trò chuyện từ các tương tác trong quá khứ. Bản chép lời từng lượt cung cấp thông tin chuyên sâu như cảm xúc của khách hàng, các vấn đề được phát hiện và các gián đoạn trong cuộc gọi.

Bảo vệ dữ liệu nhạy cảm của khách hàng

Các cuộc trò chuyện thường chứa dữ liệu nhạy cảm của khách hàng như tên, địa chỉ, số thẻ tín dụng và số an sinh xã hội. Tính năng Phân tích cuộc gọi của Transcribe giúp xác định và biên tập thông tin này từ cả âm thanh và văn bản.

Tích hợp trung tâm liên hệ

Genesys Cloud CX
Genesys Cloud CX là giải pháp trung tâm liên hệ trên nền tảng đám mây giúp hợp nhất trải nghiệm của khách hàng và nhân viên trên nhiều kênh như điện thoại, văn bản và trò chuyện. Bạn có thể phát trực tuyến âm thanh cuộc gọi sang Amazon Transcribe từ môi trường Genesys Cloud để cải thiện hiệu suất của nhân viên và trích xuất thông tin chuyên sâu về hoạt động tương tác với khách hàng. Vui lòng tham khảo tích hợp Genesys Cloud AudioHook để biết thêm thông tin. Ngoài ra, hãy bắt đầu phân tích các cuộc gọi trên Genesys Cloud của bạn với giải pháp Phân tích cuộc gọi trực tiếp của AWS.

SDK Amazon Chime
SDK Amazon Chime là một tập hợp các thành phần giao tiếp theo thời gian thực mà các nhà phát triển có thể sử dụng để nhanh chóng thêm các tính năng gọi thoại, gọi video và chia sẻ màn hình vào các ứng dụng web, di động hoặc điện thoại của riêng họ.

Bộ kết nối giọng nói Amazon Chime
Bộ kết nối giọng nói Amazon Chime cho phép bạn dễ dàng tích hợp với các trung tâm liên hệ dựa trên SIP để tạo bản chép lời trực tiếp, được gán cho người dùng, bằng cách sử dụng Amazon Transcribe. Vui lòng tham khảo tài liệu về Bộ kết nối giọng nói Amazon Chime để biết thêm thông tin.

Amazon Transcribe Medical

Chuyên khoa y tế

Dễ dàng chép lời các cuộc trao đổi về y tế của bạn bằng Transcribe Medical, một dịch vụ nhận dạng giọng nói tự động (ASR) đáp ứng điều kiện của HIPAA.

Chế độ đọc chép

Chép lời chính xác âm thanh từ một người nói, thường thấy trong các trường hợp sử dụng chế độ đọc chép y tế. Tìm hiểu thêm »

Chế độ trò chuyện

Chép lời chính xác âm thanh trò chuyện giữa nhiều người nói bao gồm bác sĩ lâm sàng và/hoặc bệnh nhân. Tìm hiểu thêm »

Chuyển giọng nói thành văn bản trên nhiều hạng mục chuyên khoa y tế đa dạng. Tìm hiểu thêm »

API hàng loạt

Chép lời các tệp âm thanh y tế được thu sẵn trên quy mô lớn với tính đồng thời cao. Tìm hiểu thêm »

API phát trực tuyến

Chép lời các luồng âm thanh gần với thời gian thực thông qua giao thức WebSocket Secure hoặc HTTP/2. Tìm hiểu thêm »

Kho từ vựng tùy chỉnh

Tăng độ chính xác trong quá trình chép lời bằng cách sử dụng kho từ vựng tùy chỉnh cho các thuật ngữ có thể không thuộc phần từ vựng. Tìm hiểu thêm »

Nhận dạng kênh

Đồng thời chép lời âm thanh đa kênh mà không mất thêm phí. Nhận một bản chép lời liền mạch cuối cùng. Tìm hiểu thêm »

Phân tách âm thanh theo người nói

Tách giọng nói từ những người nói khác nhau trong bất kỳ âm thanh đơn kênh nào. Tìm hiểu thêm »

Tìm hiểu thêm về định giá sản phẩm

Truy cập trang định giá Amazon Transcribe.

Tìm hiểu thêm

Đăng ký tài khoản miễn phí

Nhận ngay quyền sử dụng Bậc miễn phí của AWS.

Đăng ký

Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng với Amazon Transcribe trong Bảng điều khiển quản lý AWS.

Đăng nhập

Các tính năng của Amazon Transcribe

Đầu vào âm thanh

Chép lời phát trực tuyến và hàng loạt

Mô hình cụ thể theo lĩnh vực

Nhận dạng ngôn ngữ tự động

Bản chép lời dễ đọc

Chuẩn hóa dấu câu và con số

Tạo dấu thời gian

Nhận dạng nhiều người nói

Nhận dạng kênh

Tùy chỉnh dữ liệu đầu ra của bạn

Kho từ vựng tùy chỉnh

Mô hình ngôn ngữ tùy chỉnh

Tính năng đảm bảo an toàn và quyền riêng tư của người dùng

Lọc từ vựng

Biên tập nội dung tự động/Biên tập PII

Bảo vệ dữ liệu

Phát hiện nội dung âm thanh độc hại

Phân tích cuộc gọi của Amazon Transcribe

Cải thiện năng suất trong các trung tâm liên hệ với tính năng tóm tắt cuộc gọi dựa trên AI tạo sinh

Trích xuất dữ liệu phân tích cuộc gọi chi tiết và thông tin chuyên sâu về cuộc trò chuyện

Cải thiện mức độ tuân thủ và giám sát với tính năng phân loại cuộc gọi tự động

Tạo bản chép lời cuộc gọi phong phú

Bảo vệ dữ liệu nhạy cảm của khách hàng

Tích hợp trung tâm liên hệ

Amazon Transcribe Medical

Chuyên khoa y tế

Chế độ đọc chép

Chế độ trò chuyện

API hàng loạt

API phát trực tuyến

Kho từ vựng tùy chỉnh

Nhận dạng kênh

Phân tách âm thanh theo người nói

Ngừng hỗ trợ cho Internet Explorer