Thông tin chung

Câu hỏi: Amazon Transcribe là gì?

Amazon Transcribe là một dịch vụ Trí tuệ nhân tạo AWS (AI) giúp bạn dễ dàng chuyển lời nói thành văn bản. Khi sử dụng công nghệ Nhận dạng lời nói tự động (Automatic Speech Recognition (ASR)), bạn có thể sử dụng Amazon Transcribe cho nhiều ứng dụng trong công việc, bao gồm cả chép lời các cuộc gọi thoại của bộ phận dịch vụ khách hàng, tạo phụ đề trên nội dung âm thanh/video và tiến hành phân tích nội dung (dựa trên văn bản) trên nội dung âm thanh/video.  

Câu hỏi: Amazon Transcribe tương tác với các sản phẩm AWS khác như thế nào?

Amazon Transcribe chuyển nội dung thoại thành văn bản, mở ra cơ hội cho rất nhiều ứng dụng phân tích văn bản sử dụng đầu vào âm thanh. Ví dụ: khi sử dụng Amazon Comprehend về dữ liệu văn bản chuyển đổi từ Amazon Transcribe, bạn có thể thực hiện phân tích biểu cảm hoặc trích xuất các thực thể và cụm từ khóa. Tương tự, khi tích hợp với Amazon Translate và Amazon Polly, bạn có thể chấp nhận nội dung thoại đầu vào ở một ngôn ngữ rồi dịch sang ngôn ngữ khác và tạo nội dung thoại đầu ra, cho phép thực hiện những cuộc trò chuyện đa ngôn ngữ một cách hiệu quả. Công nghệ này cũng cho phép tích hợp Amazon Transcribe với Amazon Kendra hoặc Amazon OpenSearch để lập chỉ mục và tiến hành nghiên cứu dựa trên văn bản trên toàn thư viện âm thanh/video. Để tìm hiểu thêm, vui lòng tham khảo Live Call Analytics and Agent Assist, Post Call Analytics, MediaSearch, hoặc giải pháp Content Analysis.

Câu hỏi: Tôi cần biết những thông tin gì khác trước khi sử dụng Amazon Transcribe?

Amazon Transcribe được thiết kế để xử lý nhiều đặc điểm lời nói và âm thanh, bao gồm những hình mẫu khác nhau trong âm lượng, âm vực và tốc độ nói. Chất lượng và nội dung của tín hiệu âm thanh (bao gồm nhưng không giới hạn ở các yếu tố như tiếng ồn xung quanh, người nói chồng chéo, tiếng địa phương hoặc chuyển đổi giữa các ngôn ngữ trong một tệp âm thanh) có thể ảnh hưởng đến độ chính xác của đầu ra dịch vụ. Chúng tôi liên tục cập nhật dịch vụ này để cải thiện khả năng nhận diện nhiều biến thể âm thanh và loại nội dung hơn nữa.

Sử dụng Amazon Transcribe

Câu hỏi: Các nhà phát triển tiếp cận với Amazon Transcribe bằng cách nào?

Cách dễ nhất để bắt đầu là gửi một tác vụ bằng cách sử dụng bảng điều khiển để chép lời tệp âm thanh. Bạn cũng có thể trực tiếp gọi dịch vụ từ Giao diện dòng lệnh AWS hoặc dùng một trong các SDK được hỗ trợ mà bạn muốn để tích hợp với ứng dụng của mình. Cả hai cách này đều giúp bạn dùng Amazon Transcribe để tạo ra bản chép lời tự động cho tệp âm thanh chỉ với một vài dòng mã.

Câu hỏi: Amazon Transcribe có hỗ trợ chép lời theo thời gian thực không?

Có. Amazon Transcribe cho phép bạn mở luồng hai chiều qua HTTP2. Bạn có thể gửi luồng âm thanh đến dịch vụ trong khi nhận luồng văn bản về trong thời gian thực. Vui lòng tham khảo trang tài liệu để biết thêm chi tiết.

Câu hỏi: Tính năng chép lời trong thời gian thực hỗ trợ công nghệ mã hóa nào?

Các loại phương tiện được hỗ trợ khác nhau giữa bản chép lời hàng loạt và bản chép lời phát trực tiếp, mặc dù các định dạng không mất dữ liệu được khuyến nghị cho cả hai. Vui lòng tham khảo trang tài liệu để biết thêm chi tiết.

Câu hỏi: Amazon Transcribe hỗ trợ những ngôn ngữ nào?

Để biết thông tin về ngôn ngữ được hỗ trợ, vui lòng tham khảo trang tài liệu này.

Câu hỏi: Amazon Transcribe hoạt động với thiết bị nào?

Amazon Transcribe thường hoạt động với hầu hết các thiết bị. Nói chung, nó hoạt động với bất kỳ thiết bị nào có micrô trên thiết bị, chẳng hạn như điện thoại, máy tính, máy tính bảng và thiết bị IoT (chẳng hạn như hệ thống âm thanh ô tô). API Amazon Transcribe sẽ có thể phát hiện chất lượng của luồng âm thanh đang được nhập ở thiết bị (8 kHz so với 16 kHz) và sẽ chọn mô hình âm thanh phù hợp để chuyển lời nói thành văn bản. Ngoài ra, nhà phát triển có thể gọi API Amazon Transcribe thông qua ứng dụng của họ để truy cập vào tính năng chuyển lời nói thành văn bản.

Câu hỏi: Có giới hạn kích thước đối với nội dung âm thanh mà Amazon Transcribe có thể xử lý không?

Các lệnh gọi dịch vụ dùng trong Amazon Transcribe được giới hạn ở bốn giờ (hoặc 2 GB) mỗi lệnh gọi API đối với dịch vụ hàng loạt. Dịch vụ truyền có thể hỗ trợ các kết nối mở dài tới bốn giờ.

Câu hỏi: Amazon Transcribe hỗ trợ ngôn ngữ lập trình nào?

Dịch vụ hàng loạt của Amazon Transcribe hỗ trợ các ngôn ngữ .NET, Go, Java, JavaScript, PHP, Python và Ruby. Dịch vụ thời gian thực của Amazon Transcribe hỗ trợ các ngôn ngữ Java SDK, Ruby SDK và C++ SDK. SDK khác sẽ sớm được hỗ trợ. Để biết thêm chi tiết, vui lòng truy cập vào trang Tài nguyêntrang tài liệu.

Câu hỏi: Dịch vụ không nhận ra các từ trong bộ từ vựng tùy chỉnh của tôi. Tôi có thể làm gì?

Đầu ra của dịch vụ nhận dạng lời nói tùy thuộc vào một số yếu tố ngoài các mục nhập trong bộ từ vựng tùy chỉnh. Do đó, chúng tôi không thể đảm bảo dịch vụ này có thể nhận dạng chính xác một thuật ngữ trong bộ từ vựng tùy chỉnh. Tuy nhiên, lý do thường gặp nhất là vì từ tùy chỉnh đó có cách phát âm không chính xác. Nếu bạn chưa cung cấp cách phát âm cho từ tùy chỉnh, hãy thử tạo cách phát âm cho từ đó. Nếu đã cung cấp cách phát âm, hãy kiểm tra lại xem cách phát âm đó đã chính xác chưa hoặc bổ sung những cách phát âm khác, nếu cần. Bạn có thể thực hiện việc này bằng cách tạo nhiều mục nhập trong tệp từ vựng tùy chỉnh có trường phát âm khác nhau. Vui lòng tham khảo tài liệu từ vựng tùy chỉnh để biết thêm thông tin.

Câu hỏi: Vì sao tôi thấy quá nhiều từ tùy chỉnh trong đầu ra của mình?

Bộ từ vựng tùy chỉnh được tối ưu hóa cho một danh sách từ nhắm mục tiêu ở quy mô nhỏ, các bộ từ vựng lớn hơn có thể dẫn tới việc tạo ra quá nhiều từ tùy chỉnh, đặc biệt khi chúng chứa các từ có cách phát âm tương tự nhau. Nếu bạn có một danh sách từ vựng dài, hãy thử rút gọn và chỉ để lại các từ hiếm cũng như những từ bạn thực sự muốn xuất hiện trong tệp âm thanh của mình. Nếu bạn có nhiều từ vựng có thể dùng trong nhiều trường hợp, hãy tách bộ từ vựng đó thành danh sách cho từng trường hợp sử dụng riêng. Các từ ngắn và nghe giống nhiều từ khác có thể dẫn đến việc tạo ra quá nhiều từ tùy chỉnh xuất hiện trong đầu ra. Sẽ tốt hơn nếu kết hợp những từ này với các từ xung quanh và liệt kê dưới dạng các cụm từ được phân cách bằng dấu gạch nối. Ví dụ: bạn có thể bao gồm từ tùy chỉnh “A.D.” dưới dạng một phần của cụm từ, chẳng hạn như “A.D.-converter”.

Hỏi: có hai cách để cung cấp các trường phát âm trong bảng từ vựng tùy chỉnh, đó là IPA (Bảng ký hiệu ngữ âm quốc tế) hoặc SoundsLike. Cách nào tốt hơn?

IPA đem lại cách phát âm chính xác hơn. Bạn nên cung cấp cách phát âm theo IPA nếu có thể tạo IPA (chẳng hạn như bằng từ vựng có cách phát âm theo IPA hoặc bằng công cụ chuyển đổi trực tuyến).

Hỏi: Tôi muốn sử dụng IPA nhưng không phải là chuyên gia ngôn ngữ. Có công cụ trực tuyến để tôi sử dụng không?

Một số từ điển tiêu chuẩn, chẳng hạn như Từ điển Tiếng Anh của Oxford hoặc Từ điển Cambridge (bao gồm cả phiên bản trực tuyến), cung cấp cách phát âm theo IPA. Ngoài ra còn có các công cụ chuyển đổi trực tuyến (ví dụ: easypronunciation.com hoặc tophonetics.com đối với tiếng Anh); tuy nhiên, lưu ý rằng trong hầu hết trường hợp, các công cụ này dựa trên các từ điển cơ bản và không thể tạo IPA chính xác cho một số từ, chẳng hạn như tên riêng. Amazon Transcribe không xác nhận chất lượng của bất kỳ công cụ bên thứ ba nào.

Hỏi: tôi có cần sử dụng các tiêu chuẩn IPA khác nhau dành riêng cho những giọng khác nhau của cùng một ngôn ngữ không? (ví dụ: tiếng Anh Mỹ so với tiếng Anh Anh)?

Bạn nên sử dụng tiêu chuẩn IPA phù hợp với các tệp âm thanh mà bạn sẽ xử lý. Ví dụ: nếu bạn muốn xử lý âm thanh từ những người nói tiếng Anh Anh, hãy sử dụng tiêu chuẩn phát âm tiếng Anh Anh. Bộ ký hiệu IPA được phép có thể không giống nhau đối với các ngôn ngữ và thổ ngữ khác nhau mà Amazon Transcribe hỗ trợ; vui lòng đảm bảo rằng cách phát âm của bạn chỉ chứa những ký tự được phép. Bạn có thể tìm thấy các bộ ký tự IPA trong tài liệu: Từ vựng tùy chỉnh

Hỏi: Tôi làm cách nào để cung cấp cách phát âm bằng trường SoundsLike trong bảng từ vựng tùy chỉnh?

Bạn có thể chia một từ hoặc một cụm từ thành các thành phần nhỏ hơn và cung cấp cách phát âm cho từng thành phần theo cách đọc chính tả tiêu chuẩn của ngôn ngữ đó để bắt chước cách từ được phát âm. Ví dụ: trong tiếng Anh, bạn có thể cung cấp các gợi ý phát âm cho cụm từ Los-Angeles như sau: loss-ann-gel-es. Gợi ý phát âm cho từ Etienne sẽ có dạng: eh-tee-en. Bạn phân cách từng phần của gợi ý bằng dấu gạch nối (-). Bạn có thể sử dụng bất kỳ ký tự nào được phép cho ngôn ngữ đầu vào. Để biết thêm thông tin, vui lòng truy cập trang Từ vựng tùy chỉnh.

Hỏi: Hai cách khác nhau để cung cấp các từ viết tắt (có dấu chấm và không có dấu chấm nhưng có cách phát âm) hoạt động như thế nào?

Nếu bạn sử dụng từ viết tắt chứa các dấu chấm, cách phát âm theo chính tả sẽ tự động được tạo. Nếu bạn không sử dụng dấu chấm, vui lòng cung cấp cách phát âm trong trường phát âm. Đối với một số từ viết tắt, không rõ liệu chúng có cách phát âm theo chính tả hay cách phát âm giống từ. Ví dụ: NATO thường được phát âm là 'n eɪ t oʊ' (nay-toh) thay vì 'ɛn eɪ ti oʊ' (N. A. T. O.). Để biết thêm thông tin, vui lòng truy cập trang Từ vựng tùy chỉnh.

Hỏi: tôi có thể tìm thấy các ví dụ về cách sử dụng phát âm tùy chỉnh không?

Bạn có thể tìm thấy các ví dụ minh họa định dạng đầu vào và các ví dụ trong tài liệu ở đây.

Hỏi: điều gì xảy ra nếu tôi sử dụng sai IPA? Nếu không chắc chắn, tốt nhất là tôi không nên đưa vào bất kỳ IPA nào đúng ko?

Hệ thống sẽ sử dụng cách phát âm bạn cung cấp, qua đó tăng khả năng từ sẽ được công nhận là chính xác nếu cách phát âm chuẩn và khớp với cách từ được nói. Nếu bạn không chắc là mình đang tạo đúng IPA, vui lòng chạy một bản so sánh bằng cách xử lý các tệp âm thanh của bạn với từ vựng chứa cách phát âm theo IPA này và với từ vựng chỉ chứa các từ (và các mẫu display-as, nếu muốn). Nếu bạn không cung cấp bất kỳ cách phát âm nào, dịch vụ sẽ sử dụng cách phát âm ước đoán, có thể chính xác hơn dữ liệu nhập của bạn hoặc không.

Hỏi: khi sử dụng các mẫu DisplayAs, tôi có thể hiển thị những bộ ký tự không liên quan đến ngôn ngữ gốc được chép lại không? (ví dụ: dữ liệu xuất của “Street” là “街道“)?

Có. Mặc dù các cụm từ có thể chỉ sử dụng bộ ký tự hạn chế dành cho ngôn ngữ cụ thể, các ký tự UTF-8 ngoài \t (TAB) được cho phép trong cột DisplayAs.

Câu hỏi: Biên tập nội dung tự động hoặc biên tập thông tin nhận dạng cá nhân (PII) có sẵn cho cả API theo lô và API truyền phát cho Transcribe không?

Có, Amazon Transcribe hỗ trợ biên tập nội dung tự động hoặc biên tập PII cho cả API theo lô và API truyền phát.

Câu hỏi: Ngôn ngữ nào được hỗ trợ cho Biên tập nội dung tự động/nhận dạng và biên tập PII?

Vui lòng tham khảo tài liệu về Amazon Transcribe để biết thông tin về ngôn ngữ có sẵn cho việc biên tập nội dung tự động/biên tập PII.

Câu hỏi: Có phải Biên tập nội dung tự động cũng biên tập thông tin cá nhân nhạy cảm có trong âm thanh nguồn?

Không, tính năng này không loại bỏ thông tin cá nhân nhạy cảm khỏi âm thanh nguồn. Tuy nhiên, tính năng Phân tích cuộc gọi Amazon Transcribe loại bỏ thông tin cá nhân nhạy cảm khỏi cả bản chép lời và âm thanh nguồn. Truy cập liên kết này để tìm hiểu thêm thông tin về cách tính năng phân tích cuộc gọi có thể biên tập âm thanh. Bạn cũng có thể tự biên tập thông tin cá nhân khỏi âm thanh nguồn bằng cách sử dụng các nhãn thời gian bắt đầu và kết thúc được cung cấp trong bản chuyển lời thoại được biên tập cho mỗi trường hợp của lời nói được xác định chứa PII. Vui lòng tham khảo giải pháp biên tập âm thanh này dành cho API Transcribe tiêu chuẩn.

Tuy nhiên, API phân tích cuộc gọi Amazon Transcribe dành riêng loại bỏ thông tin cá nhân nhạy cảm khỏi cả bản chép lời và âm thanh nguồn. Để tìm hiểu thêm, vui lòng xem lại tài liệu biên tập âm thanh Phân tích cuộc gọi.

Câu hỏi: Tôi có thể sử dụng biên tập nội dung tự động để biên tập thông tin cá nhân trong các bản chuyển lời thoại sang văn bản hiện có không?

Không, biên tập nội dung tự động chỉ hoạt động với đầu vào là âm thanh.

Câu hỏi: Còn thông tin nào khác mà tôi cần biết trước khi sử dụng biên tập nội dung tự động không?

Biên tập nội dung tự động được thiết kế để xác định và loại bỏ thông tin nhận dạng cá nhân (PII) nhưng do bản chất dự đoán của machine learning nên chức năng này có thể không nhận dạng và loại bỏ được tất cả các trường hợp PII trong bản chuyển lời thoại mà dịch vụ tạo ra. Bạn nên xem lại mọi kết quả được cung cấp bởi Biên tập nội dung tự động để đảm bảo nội dung đó đáp ứng được các nhu cầu của bạn.

Câu hỏi: Có bất kỳ sự khác biệt nào giữa Biên tập nội dung tự động cho các API truyền phát và theo lô không?

Có, biên tập nội dung tự động cho các API truyền phát hỗ trợ hai tính năng bổ sung, trong khi đó API theo lô không hỗ trợ hai tính năng này. Bạn có thể chọn cách chỉ xác định PII và không biên tập khi sử dụng tính năng biên tập nội dung với API truyền phát. Ngoài ra, bạn có thể xác định hoặc biên tập các loại PII cụ thể với API truyền phát. Ví dụ: bạn có thể chỉ biên tập số an sinh xã hội và thông tin thẻ tín dụng cũng như giữ lại các PII khác như tên và địa chỉ email.

Câu hỏi: Biên tập nội dung tự động hoặc biên tập PII có sẵn ở Khu vực AWS nào?

Vui lòng tham khảo tài liệu về Amazon Transcribe để biết thông tin về mức độ sẵn sàng của tính năng biên tập nội dung cũng như biên tập PII cho các API theo lô và API truyền phát ở các Khu vực AWS.

Câu hỏi: API nào có thể hỗ trợ nhận dạng ngôn ngữ tự động?

Nhận dạng ngôn ngữ tự động hiện được hỗ trợ cho các API theo lô và truyền phát.

Câu hỏi: Những ngôn ngữ nào được Amazon Transcribe tự động nhận diện?

Amazon Transcribe có thể xác định bất kỳ ngôn ngữ nào được API theo lô và truyền phát hỗ trợ. Truy cập vào đây để biết chi tiết về các ngôn ngữ được hỗ trợ và các tính năng cụ thể theo ngôn ngữ.

Câu hỏi: Amazon Transcribe có thể nhận diện nhiều ngôn ngữ trong cùng một tệp âm thanh không?

Amazon Transcribe hỗ trợ ID nhiều ngôn ngữ theo lô. Xem liên kết này để biết thêm chi tiết.

Câu hỏi: Có cách nào để hạn chế danh sách các ngôn ngữ có thể chọn cho Nhận dạng ngôn ngữ tự động không?

Có, bạn có thể chỉ định một danh sách các ngôn ngữ có thể hiển thị trong thư viện đa phương tiện của bạn. Khi bạn cung cấp một danh sách các ngôn ngữ, ngôn ngữ được nhận diện sẽ được lựa chọn từ danh sách đó. Nếu không có ngôn ngữ nào được chỉ định, hệ thống sẽ xử lý tệp âm thanh dựa trên tất cả các ngôn ngữ được hỗ trợ bởi Amazon Transcribe và lựa chọn ngôn ngữ gần đúng nhất. Độ chính xác của nhận dạng ngôn ngữ được cải thiện khi bạn cung cấp một danh sách các ngôn ngữ có thể chọn. Xem liên kết này để biết thêm chi tiết.

Giá cả và tình trạng sẵn có

Hỏi: giá của công cụ này là bao nhiêu?

Hãy tham khảo trang Giá công cụ Amazon Transcribe để tìm hiểu thêm.

Hỏi: Amazon Transcribe sử dụng được ở những Khu vực AWS nào?

Vui lòng tham khảo Bảng khu vực cơ sở hạ tầng toàn cầu của AWS. Truy cập vào đây để biết thêm chi tiết về điểm cuối và hạn mức của Amazon Transcribe.

Quyền riêng tư về dữ liệu

Câu hỏi: Dữ liệu giọng nói nhập vào để Amazon Transcribe xử lý có được lưu trữ không và AWS sử dụng dữ liệu này như thế nào?

Amazon Transcribe chỉ có thể lưu trữ và sử dụng dữ liệu giọng nói đầu vào mà dịch vụ xử lý cho mục đích cung cấp và duy trì dịch vụ, cũng như để cải thiện và phát triển chất lượng của Amazon Transcribe và các công nghệ trí tuệ nhân tạo/máy học khác của Amazon. Chúng tôi cần sử dụng nội dung của bạn để không ngừng cải thiện trải nghiệm Amazon Transcribe của khách hàng, bao gồm cả việc phát triển và đào tạo các công nghệ liên quan. Chúng tôi không sử dụng bất kỳ thông tin nhận dạng cá nhân nào có thể có trong nội dung của bạn để tiếp thị hoặc nhắm mục tiêu các sản phẩm, dịch vụ đến bạn hoặc người dùng cuối của bạn. Sự tin cậy, quyền riêng tư của bạn và tính bảo mật của nội dung là ưu tiên hàng đầu của chúng tôi. Chúng tôi triển khai các biện pháp kiểm soát vật lý cũng như kỹ thuật phức tạp và phù hợp, bao gồm cả công nghệ mã hóa nội dung trong khi truyền và khi không truyền, được thiết kế để ngăn khả năng truy cập trái phép hoặc tiết lộ nội dung của bạn và đảm bảo việc sử dụng của chúng tôi tuân thủ những gì chúng tôi cam kết với bạn. Vui lòng xem https://aws.amazon.com/compliance/data-privacy-faq/ để biết thêm thông tin. Bạn có thể chọn không cho phép chúng tôi sử dụng nội dung của bạn để cải thiện và phát triển chất lượng của Amazon Transcribe và các công nghệ trí tuệ nhân tạo/máy học khác của Amazon bằng cách sử dụng chính sách từ chối của AWS Organizations. Để biết thông tin về cách từ chối, hãy xem Chính sách từ chối dịch vụ AI.

Hỏi: Tôi có thể xóa dữ liệu và thành phần lạ đi kèm tác vụ chuyển lời thoại được Amazon Transcribe lưu trữ hay không?

Có. Bạn có thể sử dụng các API xóa có sẵn để xóa dữ liệu và các thành phần lạ khác đi kèm tác vụ chuyển lời thoại. Nếu bạn gặp sự cố khi thực hiện thao tác này, hãy liên hệ với bộ phận hỗ trợ của AWS.

Hỏi: ai có thể xem nội dung mà Amazon Transcribe xử lý và lưu trữ?

Chỉ những người được ủy quyền mới có thể xem nội dung mà Amazon Transcribe xử lý. Sự tin cậy, quyền riêng tư của bạn và tính bảo mật của nội dung là ưu tiên hàng đầu của chúng tôi. Chúng tôi triển khai các biện pháp kiểm soát vật lý cũng như kỹ thuật phức tạp và phù hợp, bao gồm cả công nghệ mã hóa nội dung trong khi truyền và khi không truyền, được thiết kế để ngăn khả năng truy cập trái phép hoặc tiết lộ nội dung của bạn và đảm bảo việc sử dụng của chúng tôi tuân thủ những gì chúng tôi cam kết với bạn. Vui lòng xem https://aws.amazon.com/compliance/data-privacy-faq/ để biết thêm thông tin.

Hỏi: tôi vẫn nắm quyền sở hữu nội dung mà Amazon Transcribe xử lý và lưu trữ chứ?

Bạn luôn nắm quyền sở hữu nội dung của mình và chúng tôi chỉ sử dụng nội dung này khi bạn đồng ý.

Câu hỏi: Điều gì xảy ra với dữ liệu của tôi được dùng trong các mô hình ngôn ngữ tùy chỉnh của khóa đào tạo? Tôi vẫn sở hữu dữ liệu này?

Khi gửi dữ liệu văn bản được dùng để đào tạo mô hình chuyên dụng, bạn có quyền sở hữu dữ liệu văn bản gốc và mô hình tùy chỉnh được tạo. Dữ liệu văn bản sẽ không được lưu trữ hoặc sử dụng để cải thiện cộng cụ nhận dạng giọng nói chung của chúng tôi. Các mô hình được tạo ra bằng cách sử dụng CLM được tự chứa và chỉ bạn mới có thể truy cập.

Hỏi: Vì dịch vụ sẽ không giữ lại dữ liệu đào tạo của tôi, nên chất lượng bản chép lời hoặc trải nghiệm dịch vụ chung có bị hạn chế hoặc giảm không?

Chất lượng bản chép lời sẽ không bị giảm do dịch vụ của chúng tôi không lưu trữ dữ liệu đào tạo của bạn. Sau khi dữ liệu đào tạo được dùng để thực sự tạo ra mô hình ngôn ngữ tùy chỉnh, thì chính mô hình đó sẽ được cung cấp để sử dụng nhiều lần theo ý của bạn. Bộ đào tạo gốc bạn tải lên bị xóa khỏi hệ thống của chúng tôi. Hạn chế duy nhất là nếu bạn yêu cầu hỗ trợ kỹ thuật. Vì không giữ lại dữ liệu đào tạo gốc, chúng tôi không có quyền truy cập nhất quán vào các nội dung đó hoặc thành phần lạ trung gian có liên quan, nếu bạn yêu cầu nhóm hỗ trợ để điều tra các vấn đề dịch vụ tiềm ẩn. Chúng tôi vẫn cung cấp dịch vụ hỗ trợ nhưng không thiết thực vì chúng tôi có thể cần phải yêu cầu bạn cung cấp thêm thông tin.

Hỏi: Tôi có thể sử dụng lại dữ liệu để cải thiện hoặc cập nhật mô hình trong tương lai không?

Vì dữ liệu đào tạo không được lưu trữ, bộ dữ liệu tương tự và mọi dữ liệu bổ sung sẽ phải được tải lên lần nữa để đào tạo các mô hình mới. Khi có bản cập nhật cho mô hình cơ sở do Amazon Transcribe cung cấp, bạn sẽ nhận được thông báo. Để tận dụng mô hình cơ sở mới nhất, bạn nên gửi dữ liệu của mình để đào tạo mô hình mới. Sau đó, bạn sẽ có cả mô hình tùy chỉnh gốc mà trước đó bạn đã tạo và cả phiên bản mới để sử dụng.

Hỏi: Tôi xóa mô hình bằng cách nào?

Bạn có thể xóa mọi mô hình ngôn ngữ khách hàng mà bạn đã tạo theo ý mình.

Hỏi: Nội dung Amazon Transcribe xử lý có được chuyển ra bên ngoài khu vực AWS mà tôi đang dùng Amazon Transcribe không?

Mọi nội dung mà Amazon Transcribe xử lý đều được mã hóa và lưu trữ trong khu vực AWS bạn đang dùng Amazon Transcribe. Chúng tôi sẽ chỉ lưu trữ một số phần nội dung mà Amazon Transcribe xử lý ở một khu vực AWS khác để phục vụ mục đích không ngừng phát triển và cải thiện trải nghiệm khách hàng Amazon Transcribe, cũng như các công nghệ trí thông minh nhân tạo/machine learning khác của Amazon. Nếu bạn liên hệ với bộ phận AWS Support và yêu cầu chúng tôi không sử dụng nội dung của bạn cho mục đích nâng cao chất lượng của Amazon Transcribe và các công nghệ trí thông minh nhân tạo/machine learning khác của Amazon, thì chúng tôi sẽ không lưu trữ nội dung của bạn ở khu vực AWS khác. Bạn có thể liên hệ với bộ phận AWS Support để yêu cầu xóa giọng nói đã nhập được liên kết với tài khoản của mình. Sự tin cậy, quyền riêng tư của bạn và tính bảo mật của nội dung là ưu tiên hàng đầu của chúng tôi. Chúng tôi triển khai các biện pháp kiểm soát vật lý cũng như kỹ thuật phức tạp và phù hợp, bao gồm cả công nghệ mã hóa nội dung trong khi truyền và khi không truyền, được thiết kế để ngăn khả năng truy cập trái phép hoặc tiết lộ nội dung của bạn và đảm bảo việc sử dụng của chúng tôi tuân thủ những gì chúng tôi cam kết với bạn. Vui lòng xem https://aws.amazon.com/compliance/data-privacy-faq/ để biết thêm thông tin.

Hỏi: tôi có thể dùng Amazon Transcribe cho các trang web, chương trình hoặc ứng dụng khác hướng đến hoặc nhắm mục tiêu đến trẻ em dưới 13 tuổi và tuân theo Đạo luật bảo vệ quyền riêng tư của trẻ em trên mạng (COPPA) không?

Có, tùy thuộc vào mức độ tuân thủ Điều khoản dịch vụ của Amazon Transcribe, bao gồm nghĩa vụ cung cấp mọi thông báo bắt buộc và có được mọi sự đồng ý cần thiết, có thể xác minh của phụ huynh như quy định trong COPPA, bạn có thể sử dụng Amazon Transcribe cho (một phần/toàn bộ) trang web, chương trình hoặc ứng dụng khác hướng đến hoặc nhắm mục tiêu đến trẻ em dưới 13 tuổi.

Hỏi: làm cách nào để xác định trang web, chương trình hoặc ứng dụng của tôi có tuân thủ COPPA không?

Để biết thông tin về các yêu cầu trong COPPA và hướng dẫn cách xác định xem trang web, chương trình hoặc ứng dụng khác của bạn có tuân thủ COPPA hay không, vui lòng tham khảo trực tiếp các tài nguyên mà Ủy ban thương mại liên bang Mỹ cung cấp và duy trì. Trang web này cũng cung cấp thông tin liên quan đến cách xác định xem một dịch vụ (một phần/toàn bộ) có hướng đến hay nhắm mục tiêu đến trẻ em dưới 13 tuổi hay không.

Amazon Transcribe Call Analytics

Câu hỏi: Amazon Transcribe Call Analytics là gì?

Amazon Transcribe Call Analytics là một API được AI hỗ trợ nhằm cung cấp bản chép lại cuộc gọi giàu thông tin và thông tin chi tiết thúc đẩy hành động từ cuộc trò chuyện mà bạn có thể thêm vào các ứng dụng gọi điện để cải thiện trải nghiệm khách hàng cũng như năng suất của tổng đài viên. Công cụ này kết hợp các mô hình xử lý ngôn ngữ tự nhiên tùy chỉnh (NLP) và chuyển giọng nói thành văn bản mạnh mẽ, được đào tạo đặc biệt để nắm bắt các cuộc gọi chăm sóc khách hàng và cuộc gọi bán hàng. Là một trong các giải pháp Dịch vụ trí tuệ cho trung tâm liên hệ AWS (CCI), API này không phụ thuộc vào trung tâm liên hệ và giúp khách hàng cũng như các nhà cung cấp phần mềm độc lập (ISV) thêm những tính năng phân tích cuộc gọi vào ứng dụng của họ dễ dàng hơn.

Hỏi: Tôi có thể làm gì với Amazon Transcribe Call Analytics?

Phân tích cuộc gọi của Amazon Transcribe có thể thực hiện cả phân tích theo thời gian thực và phân tích sau cuộc gọi. Với Phân tích cuộc gọi, nhà phát triển có thể nhanh chóng bổ sung các thông tin giá trị (như điểm cảm xúc của khách hàng và tổng đài viên, yếu tố thúc đẩy cuộc gọi, danh mục cuộc gọi, tóm tắt cuộc gọi) dưới dạng đầu ra API vào mọi ứng dụng gọi đến hoặc gọi đi. Các trường hợp sử dụng thường gặp bao gồm hỗ trợ tổng đài viên, tóm tắt, cảnh báo giám sát viên và phân tích cuộc gọi. Đây là hai giải pháp nguồn mở mẫu được dựa trên Phân tích cuộc gọi của Transcribe: Phân tích cuộc gọi theo thời gian thực với tính năng hỗ trợ tổng đài viênPhân tích sau cuộc gọi.

Hỏi: Làm thế nào để bắt đầu sử dụng Amazon Transcribe Call Analytics?

Bạn có thể sử dụng Transcribe Call Analytics thông qua API và Bảng điều khiển quản lý AWS. Bạn có thể tạo và giám sát các tác vụ phân tích thông qua API hoặc Bảng điều khiển. Trong Bảng điều khiển, bạn sẽ thấy một danh sách những tác vụ phân tích và một trang thông tin chi tiết về tác vụ với các tham số đầu vào và bản xem trước đầu ra JSON. Ngoài ra, với tính năng tự động phân loại liên lạc, bạn sẽ có thể tạo và chỉnh sửa các danh mục thông qua API hoặc Bảng điều khiển.

Hỏi: Amazon Transcribe Call Analytics hỗ trợ những ngôn ngữ nào?

Vui lòng tham khảo tài liệu về Amazon Transcribe để biết thông tin về ngôn ngữ có sẵn cho Amazon Transcribe Call Analytics.

Hỏi: Amazon Transcribe Call Analytics được cung cấp ở khu vực AWS nào?

Vui lòng tham khảo tài liệu dịch vụ Khu vực AWS để biết thông tin về phạm vi Khu vực AWS cho Phân tích cuộc gọi của Amazon Transcribe. Xin lưu ý rằng tính năng tóm tắt cuộc gọi tổng hợp của Phân tích cuộc gọi của Amazon Transcribe chỉ được cung cấp dưới dạng tính năng xem trước ở Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon).

Hỏi: Có thể sử dụng tính năng tóm tắt cuộc gọi tổng hợp với API Phân tích cuộc gọi của Transcribe dành cho phân tích sau cuộc gọi và phân tích theo thời gian thực không?

Hiện tại, chỉ có thể sử dụng tính năng tóm tắt cuộc gọi tổng hợp với API Phân tích cuộc gọi của Transcribe dành cho phân tích sau cuộc gọi.

Hỏi: Giá của Amazon Transcribe Call Analytics được tính như thế nào?

API Amazon Transcribe Call Analytics được tính phí riêng biệt với các API Amazon Transcribe tiêu chuẩn. Vui lòng xem trang giá của Amazon Transcribe để biết thêm chi tiết.

Amazon Transcribe Medical

Câu hỏi: Amazon Transcribe Medical là gì?

Amazon Transcribe Medical là dịch vụ nhận dạng giọng nói tự động (ASR) giúp các nhà phát triển dễ dàng bổ sung khả năng chuyển giọng nói thành văn bản về y tế vào các ứng dụng của họ. Sử dụng Amazon Transcribe Medical, bạn có thể phiên âm chính tả và hội thoại về y tế thành văn bản một cách nhanh chóng và chính xác cho nhiều mục đích khác nhau, chẳng hạn như ghi lại ghi chú của bác sĩ hoặc xử lý trong phân tích văn bản xuôi chiều để thu được những thông tin quan trọng.

Câu hỏi: Tôi có thể làm gì với Amazon Transcribe Medical?

Amazon Transcribe Medical sử dụng các mô hình máy học tiên tiến để phiên âm chính xác lời nói về y tế thành văn bản. Transcribe Medical có thể tạo các bản sao văn bản dùng để hỗ trợ nhiều trường hợp sử dụng khác nhau, từ quy trình ghi chép lâm sàng và theo dõi an toàn thuốc (cảnh giác dược) đến tạo phụ đề cho y học từ xa và thậm chí cả các phân tích trung tâm liên lạc trong lĩnh vực chăm sóc sức khỏe và khoa học đời sống.

Hỏi: Tôi có cần phải là chuyên gia trong nhận dạng giọng nói tự động (ASR) để sử dụng Amazon Transcribe Medical không?

Không, bạn không cần bất kỳ chuyên môn nào về ASR hay chuyên môn về machine learning để sử dụng Amazon Transcribe Medical. Bạn chỉ cần gọi API của Transcribe Medical và dịch vụ sẽ xử lý machine learning được yêu cầu trong backend để chuyển lời nói về y tế thành văn bản.

Câu hỏi: Tôi bắt đầu với Amazon Transcribe Medical bằng cách nào?

Bạn có thể bắt đầu với Amazon Transcribe Medical từ Bảng điều khiển quản lý AWS hoặc bằng cách sử dụng SDK. Vui lòng tham khảo trang tài liệu kỹ thuật này để biết chi tiết.

Amazon Transcribe Medical cung cấp bậc miễn phí để bạn có thể dùng thử dịch vụ. Tham khảo trang mức giá này để biết thêm thông tin.

Câu hỏi: Amazon Transcribe Medical hỗ trợ những ngôn ngữ nào?

Amazon Transcribe Medical hiện hỗ trợ bản sao chép y tế bằng tiếng Anh Mỹ.

Câu hỏi: Amazon Transcribe Medical hỗ trợ những chuyên khoa y tế nào?

Amazon Transcribe Medical hỗ trợ chép lại đối với một loạt các chuyên khoa chăm sóc chính và chăm sóc đặc biệt. Truy cập tài liệu của chúng tôi để xem danh sách đầy đủ các dịch vụ chăm sóc y tế đặc biệt được hỗ trợ.

Câu hỏi: Amazon Transcribe Medical được cung cấp ở khu vực AWS nào?

Vui lòng tham khảo tài liệu dịch vụ Khu vực AWS để biết thông tin về phạm vi Khu vực AWS cho Amazon Transcribe Medical.

Hỏi: Giá dịch vụ Amazon Transcribe Medical như thế nào?

Hãy tham khảo trang giá Amazon Transcribe Medical để tìm hiểu thêm về chi tiết giá cả.

Hỏi: Amazon Transcribe Medical có đủ điều kiện HIPAA không?

Có.

Câu hỏi: Nội dung mà Amazon Transcribe Medical xử lý có được sử dụng cho bất kỳ mục đích nào khác ngoài việc cung cấp dịch vụ không?

Amazon Transcribe Medical không sử dụng nội dung do dịch vụ xử lý cho bất kỳ lý do nào khác ngoài việc cung cấp và duy trì dịch vụ. Nội dung do dịch vụ này xử lý không được sử dụng để phát triển hoặc cải thiện chất lượng cho Amazon Transcribe Medical hoặc bất kỳ công nghệ machine-learning/trí tuệ nhân tạo nào khác của Amazon.

Câu hỏi: Amazon Transcribe Medical có học theo thời gian không?

Có, Amazon Transcribe Medical sử dụng machine learning và liên tục được đào tạo để cải tiến nhằm phục vụ tốt hơn các trường hợp sử dụng của khách hàng. Amazon Transcribe Medical không lưu trữ hoặc sử dụng dữ liệu khách hàng được sử dụng với dịch vụ để đào tạo các mô hình

Câu hỏi: Tôi cần biết những thông tin gì khác trước khi sử dụng dịch vụ Amazon Transcribe Medical?

Amazon Transcribe Medical không thể thay thế cho tư vấn, chẩn đoán hoặc điều trị y tế chuyên môn. Bạn và người dùng cuối của bạn chịu trách nhiệm thực hiện theo ý định, kinh nghiệm và phán đoán của riêng mình trong việc quyết định tính chính xác, đầy đủ, kịp thời và sự phù hợp của mọi thông tin do Amazon Transcribe Medical cung cấp. Bạn và người dùng cuối của bạn hoàn toàn chịu trách nhiệm về mọi quyết định, lời khuyên, hành động và/hoặc không hành động dựa trên việc sử dụng Amazon Transcribe Medical. 

Amazon Transcribe Medical có thể không xác định chính xác thông tin sức khỏe được bảo vệ trong mọi trường hợp và có thể không đáp ứng các yêu cầu về việc hủy nhận dạng thông tin sức khỏe được bảo vệ theo HIPAA. Bạn chịu trách nhiệm xem xét mọi thông tin đầu ra do Amazon Transcribe Medical cung cấp để đảm bảo thông tin đó đáp ứng nhu cầu của mình.

Mô hình ngôn ngữ tùy chỉnh

Câu hỏi: Hiện tại, mô hình ngôn ngữ tùy chỉnh cung cấp những chức năng gì?

Bạn có thể sử dụng mô hình ngôn ngữ tùy chỉnh (CLM) để đào tạo và phát triển các mô hình ngôn ngữ theo lĩnh vực cụ thể. CLM hiện tại đang hỗ trợ chép lời theo lô bằng tiếng Anh-Úc, tiếng Anh-Anh, tiếng Hindi, tiếng Anh-Mỹ và tiếng Tây Ban Nha-Mỹ cũng như chép lời phát trực tiếp bằng tiếng Anh-Mỹ. CLM hỗ trợ sử dụng kho từ vựng tùy chỉnh đồng thời để chép lời theo lô.

Hỏi: Tôi cần loại dữ liệu đào tạo nào và với số lượng ra sao? Tôi có thể nhận dữ liệu bằng cách nào? Dữ liệu có cần phải có định dạng cụ thể không?

Dữ liệu văn bản phải thích hợp với âm thanh sẽ được chép lời bằng mô hình tùy chỉnh; dữ liệu này phải chứa càng nhiều từ, cụm từ và tổ hợp từ dành riêng cho miền càng tố. Bạn nên dùng ít nhất 100 ngàn và tối đa 10 triệu từ văn bản chạy. Bạn có thể nhận tài nguyên dữ liệu văn bản từ bất kỳ nguồn nội bộ hoặc công khai nào (ví dụ: sử dụng văn bản từ trang web của khách hàng). Chúng tôi khuyến nghị mỗi tệp văn bản thuần túy chứa 200.000 từ trở lên nhưng kích thước tệp chung không quá 1 GB. Văn bản phải ở định dạng UTF-8 và sử dụng mỗi dòng một câu. Mỗi câu phải có một dấu chấm. Người dùng chịu trách nhiệm kiểm tra chính tả, xóa các ký tự định dạng và xác nhận mã hóa.

Câu hỏi: Tôi sử dụng mô hình ngôn ngữ tùy chỉnh (CLM) như thế nào?

Để đào tạo mô hình ngôn ngữ tùy chỉnh, khách hàng chỉ cung cấp dữ liệu văn bản trong vùng lưu trữ Amazon S3. Sau đó, người dùng có thể sử dụng bảng điều khiển dịch vụ Amazon Transcribe để tải và xử lý dữ liệu để đào tạo một mô hình ngôn ngữ tùy chỉnh. Việc đào tạo hoàn toàn tự động và cần sự can thiệp tối thiểu của người dùng. Khi mô hình tùy chỉnh sau cùng đã sẵn sàng, mô hình này được cung cấp trong tài khoản AWS của khách hàng để chép lời tệp âm thanh dành riêng cho miền. Hơn nữa, khách hàng có thể đào tạo nhiều mô hình tùy chỉnh để sử dụng cho nhiều trường hợp sử dụng khác nhau.

Hỏi: Sự cải thiện có được đảm bảo không? Việc này có đáng phải nỗ lực thu thập dữ liệu văn bản không?

Việc cải thiện không được đảm bảo – thay đổi về hiệu suất sẽ tùy thuộc vào dữ liệu văn bản phù hợp chặt chẽ với âm thanh đến mức nào và vào lượng dữ liệu được cung cấp. Nhiều dữ liệu thường tốt hơn nhưng điều quan trọng nhất là dữ liệu phải bao gồm các từ và trình tự cần phải diễn ra trong tệp âm thanh mà bạn dự định chép lời. Việc cải thiện độ chỉnh xác của bản chép lời tùy thuộc vào chất lượng của dữ liệu đào tạo cũng như trường hợp sử dụng. Trong một số trường hợp, chuẩn mực chung cho biết 10% đến 15% cải thiện độ chính xác tương đối.

Hỏi: Đào tạo mô hình mất bao lâu? Khi nào tôi có thể sử dụng mô hình này?

Đào tạo mô hình thường mất từ 6 đến 10 giờ. Khoảng thời gian đào tạo phụ thuộc vào độ lớn của bộ dữ liệu. Mô hình tùy chỉnh sẽ được cung cấp trực tiếp sau khi việc đào tạo hoàn tất.

Hỏi: Tôi sẽ có thể sử dụng mô hình như thế nào? Làm cách nào để tôi biết mô hình này có hiệu quả hơn mô hình chung do Amazon Transcribe cung cấp không?

Mô hình sẽ được cung cấp trong tài khoản của bạn trong ID mô hình do bạn gán trước quy trình đào tạo. Để sử dụng mô hình, cờ có ID mô hình cần phải được thêm vào yêu cầu chép lời. Bạn phải kiểm tra mô hình trong tệp âm thanh của mình và so sánh đầu ra với kết quả thu được từ công cụ chung.

Hỏi: Tôi có thể đào tạo bao nhiêu mô hình ngôn ngữ tùy chỉnh? Tôi có thể bật đồng thời nhiều mô hình cho tài khoản của mình không?

Bạn có thể đào tạo đồng thời tối đa 5 mô hình khác nhau tại một thời giam nhất định cho mỗi tài khoản AWS. Theo mặc định, đối với mỗi tài khoản, bạn có thể lưu trữ tối đa 10 mô hình. Nếu cần nhiều mô hình hơn, bạn có thể tăng giới hạn dịch vụ tại đây.

Hỏi: Các mô hình âm thanh tùy chỉnh có được hỗ trợ không?

Không. Các mô hình âm thanh tùy chỉnh không được hỗ trợ. Các mô hình ngôn ngữ tùy chỉnh được xây dựng từ dữ liệu văn bản có liên quan đến trường hợp sử dụng hoặc miền của bạn.

Tìm hiểu thêm về định giá Amazon Transcribe

Truy cập vào trang giá
Bạn đã sẵn sàng để bắt đầu chưa?
Hãy dùng thử bảng điều khiển Amazon Transcribe
Bạn có câu hỏi khác ư?
Liên hệ với chúng tôi