Thông tin chung

Câu hỏi: Amazon Transcribe là gì?

Amazon Transcribe là một dịch vụ AWS giúp khách hàng dễ dàng chuyển lời nói thành văn bản. Khi sử dụng công nghệ Nhận dạng lời nói tự động (Automatic Speech Recognition (ASR)), khách hàng có thể chọn dùng Amazon Transcribe cho nhiều ứng dụng trong công việc, bao gồm cả chép lời các cuộc gọi thoại của bộ phận dịch vụ khách hàng, tạo phụ đề trên nội dung âm thanh/video và tiến hành phân tích nội dung (dựa trên văn bản) trên nội dung âm thanh/video.  

Câu hỏi: Amazon Transcribe tương tác với các sản phẩm AWS khác như thế nào?

Amazon Transcribe chuyển nội dung thoại thành văn bản, mở ra cơ hội cho rất nhiều ứng dụng phân tích văn bản sử dụng đầu vào âm thanh. Ví dụ: khi sử dụng Amazon Comprehend về dữ liệu văn bản chuyển đổi từ Amazon Transcribe, khách hàng có thể thực hiện phân tích biểu cảm hoặc trích xuất các thực thể và cụm từ khóa. Tương tự, khi tích hợp với Amazon Translate và Amazon Polly, khách hàng có thể chấp nhận đầu vào thoại ở một ngôn ngữ rồi dịch sang ngôn ngữ khác và tạo đầu ra thoại, cho phép thực hiện những cuộc trò chuyện đa ngôn ngữ một cách hiệu quả. Công nghệ này cũng cho phép tích hợp Amazon Transcribe với Amazon Elasticsearch để lập chỉ mục và tiến hành nghiên cứu dựa trên văn bản trên toàn thư viện âm thanh/video. 

Câu hỏi: Tôi cần biết những thông tin gì khác trước khi sử dụng dịch vụ Amazon Transcribe?

Dịch vụ Amazon Transcribe được thiết kế để xử lý nhiều đặc điểm lời nói và âm thanh, bao gồm những hình mẫu khác nhau trong âm lượng, âm vực và tốc độ nói. Chất lượng và nội dung của tín hiệu âm thanh (bao gồm nhưng không giới hạn ở các yếu tố như tiếng ồn xung quanh, người nói chồng chéo, tiếng địa phương hoặc chuyển đổi giữa các ngôn ngữ trong một tệp âm thanh) có thể ảnh hưởng đến độ chính xác của đầu ra dịch vụ. Chúng tôi liên tục cập nhật dịch vụ này để cải thiện khả năng nhận diện nhiều biến thể âm thanh và loại nội dung hơn nữa. 

Sử dụng Amazon Transcribe

Câu hỏi: Các nhà phát triển tiếp cận với Transcribe bằng cách nào?

Cách dễ nhất để bắt đầu với Amazon Transcribe là gửi một tác vụ bằng cách sử dụng bảng điều khiển để chép lời tệp âm thanh. Bạn cũng có thể trực tiếp gọi dịch vụ từ Giao diện dòng lệnh AWS hoặc dùng một trong các SDK được hỗ trợ mà bạn muốn để tích hợp với ứng dụng của mình. Cả hai cách này đều giúp bạn dùng Amazon Transcribe để tạo ra bản chép lời tự động cho tệp âm thanh chỉ với một vài dòng mã.

Câu hỏi: Amazon Transcribe có hỗ trợ chép lời theo thời gian thực không?

Có. Amazon Transcribe cho phép người dùng mở luồng hai chiều qua HTTP2. Người dùng có thể gửi luồng âm thanh đến dịch vụ trong khi nhận luồng văn bản về trong thời gian thực.  

Câu hỏi: Tính năng chép lời trong thời gian thực hỗ trợ công nghệ mã hóa nào?

Hoạt động truyền bản chép lời hiện hỗ trợ mã hóa PCM tuyến tính 16 bit. 

Câu hỏi: Amazon Transcribe hỗ trợ những ngôn ngữ nào?

Để biết thông tin về hỗ trợ ngôn ngữ, vui lòng tham khảo trang tài liệu này. 

Câu hỏi: Amazon Transcribe hoạt động với thiết bị nào?

Amazon Transcribe thường hoạt động với hầu hết các thiết bị. Nói chung, Amazon Transcribe hoạt động với bất kỳ thiết bị nào có micrô trên thiết bị, chẳng hạn như điện thoại, máy tính, máy tính bảng và thiết bị IoT (ví dụ: hệ thống âm thanh ô tô). API Amazon Transcribe sẽ có thể phát hiện chất lượng của luồng âm thanh đang được nhập ở thiết bị (8 kHz so với 16 kHz) và sẽ chọn mô hình âm thanh phù hợp để chuyển lời nói thành văn bản. Ngoài ra, nhà phát triển có thể gọi API Transcribe thông qua ứng dụng của họ để truy cập vào tính năng chuyển lời nói thành văn bản. 

Câu hỏi: Có giới hạn kích thước đối với nội dung âm thanh mà Amazon Transcribe có thể xử lý không?

Các lệnh gọi dịch vụ dùng trong Amazon Transcribe được giới hạn ở 4 giờ (hoặc 2 GB) mỗi lệnh gọi API đối với dịch vụ hàng loạt. Dịch vụ truyền có thể hỗ trợ các kết nối mở dài tới 4 giờ. 

Câu hỏi: Amazon Transcribe hỗ trợ ngôn ngữ lập trình nào?

Dịch vụ hàng loạt của Amazon Transcribe hỗ trợ các ngôn ngữ .NET, Go, Java, Javascript, PHP, Python và Ruby.
Dịch vụ thời gian thực của Amazon Transcribe hỗ trợ các ngôn ngữ Java SDK, Ruby SDK và C++ SDK. Các SDK khác sẽ sớm được hỗ trợ. Để biết thêm chi tiết, vui lòng truy cập trang Tài nguyên

Câu hỏi: Dịch vụ không nhận ra các từ trong bộ từ vựng tùy chỉnh của tôi! Tôi có thể làm gì?

Đầu ra của dịch vụ nhận dạng lời nói tùy thuộc vào một số yếu tố ngoài các mục nhập trong bộ từ vựng tùy chỉnh. Do đó, chúng tôi không thể đảm bảo dịch vụ này có thể nhận dạng chính xác một thuật ngữ trong bộ từ vựng tùy chỉnh.
Tuy nhiên, lý do thường gặp nhất là vì từ tùy chỉnh đó có cách phát âm không chính xác. Nếu bạn chưa cung cấp cách phát âm cho từ tùy chỉnh, hãy thử tạo cách phát âm cho từ đó. Nếu đã cung cấp cách phát âm, hãy kiểm tra lại xem cách phát âm đó đã chính xác chưa hoặc bổ sung những cách phát âm khác, nếu cần. Bạn có thể thực hiện việc này bằng cách tạo nhiều mục nhập trong tệp từ vựng tùy chỉnh có trường phát âm khác nhau.

Câu hỏi: Vì sao tôi thấy quá nhiều từ tùy chỉnh trong đầu ra của mình?

Bộ từ vựng tùy chỉnh được tối ưu hóa cho một danh sách từ nhắm mục tiêu ở quy mô nhỏ, các bộ từ vựng lớn hơn có thể dẫn tới việc tạo ra quá nhiều từ tùy chỉnh, đặc biệt khi chúng chứa các từ có cách phát âm tương tự nhau. Nếu bạn có một danh sách từ vựng dài, hãy thử rút gọn và chỉ để lại các từ hiếm cũng như những từ bạn thực sự muốn xuất hiện trong tệp âm thanh của mình. Nếu bạn có nhiều từ vựng có thể dùng trong nhiều trường hợp, hãy tách bộ từ vựng đó thành danh sách cho từng trường hợp sử dụng riêng. Các từ ngắn và nghe giống nhiều từ khác có thể dẫn đến việc tạo ra quá nhiều từ tùy chỉnh xuất hiện trong đầu ra. Sẽ tốt hơn nếu kết hợp những từ này với các từ xung quanh và liệt kê dưới dạng các cụm từ được phân cách bằng dấu gạch nối. Ví dụ: bạn có thể bao gồm từ tùy chỉnh “A.D.” dưới dạng một phần của cụm từ, chẳng hạn như ‘A.D.-converter’.

Hỏi: có hai cách để cung cấp các trường phát âm trong bảng từ vựng tùy chỉnh, đó là IPA (Bảng ký hiệu ngữ âm quốc tế) hoặc SoundsLike. Cách nào tốt hơn?

IPA đem lại cách phát âm chính xác hơn. Bạn nên cung cấp cách phát âm theo IPA nếu có thể tạo IPA (ví dụ: bằng từ vựng có cách phát âm theo IPA hoặc bằng công cụ chuyển đổi trực tuyến).

Hỏi: tôi muốn sử dụng IPA nhưng không phải là chuyên gia ngôn ngữ. Có công cụ trực tuyến để tôi sử dụng không?

Một số từ điển tiêu chuẩn, chẳng hạn như Từ điển Tiếng Anh của Oxford hoặc Từ điển Cambridge (bao gồm cả phiên bản trực tuyến), cung cấp cách phát âm theo IPA. Ngoài ra còn có các công cụ chuyển đổi trực tuyến (ví dụ: easypronunciation.com hoặc tophonetics.com đối với tiếng Anh). Tuy nhiên, lưu ý rằng trong hầu hết trường hợp, các công cụ này dựa trên các từ điển cơ bản và không thể tạo IPA chính xác cho một số từ, chẳng hạn như tên riêng. Amazon Transcribe không xác nhận chất lượng của bất kỳ công cụ bên thứ ba nào.

Hỏi: tôi có cần sử dụng các tiêu chuẩn IPA khác nhau dành riêng cho những giọng khác nhau của cùng một ngôn ngữ không? (ví dụ: tiếng Anh Mỹ so với tiếng Anh Anh)?

Bạn nên sử dụng tiêu chuẩn IPA phù hợp cho các tệp âm thanh mà bạn sẽ xử lý. Ví dụ: nếu muốn xử lý âm thanh giọng nói của người Anh Anh, bạn nên sử dụng tiêu chuẩn phát âm Anh Anh. Bộ ký hiệu IPA được phép có thể không giống nhau đối với các ngôn ngữ và thổ ngữ khác nhau mà Amazon Transcribe hỗ trợ; vui lòng đảm bảo rằng cách phát âm của bạn chỉ chứa những ký tự được phép. Bạn có thể tìm thấy thông tin chi tiết về ký tự IPA trong tài liệu sau: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

Hỏi: tôi làm cách nào để cung cấp cách phát âm bằng trường SoundsLike trong bảng từ vựng tùy chỉnh?

Bạn có thể chia một từ hoặc một cụm từ thành các thành phần nhỏ hơn và cung cấp cách phát âm cho từng thành phần theo cách đọc chính tả tiêu chuẩn của ngôn ngữ đó để bắt chước cách từ được phát âm. Ví dụ: trong tiếng Anh, bạn có thể cung cấp các gợi ý phát âm cho cụm từ Los-Angeles như sau: loss-ann-gel-es. Gợi ý phát âm cho từ Etienne sẽ có dạng: eh-tee-en. Bạn phân cách từng phần của gợi ý bằng dấu gạch nối (-). Bạn có thể sử dụng bất kỳ ký tự nào được phép cho ngôn ngữ đầu vào.

Hỏi: hai cách khác nhau để cung cấp các từ viết tắt (có dấu chấm và không có dấu chấm nhưng có cách phát âm) hoạt động như thế nào?

Nếu bạn sử dụng từ viết tắt chứa các dấu chấm, cách phát âm theo chính tả sẽ tự động được tạo. Nếu bạn không sử dụng dấu chấm, vui lòng cung cấp cách phát âm trong trường phát âm. Đối với một số từ viết tắt, sẽ không rõ là phát âm theo chính tả hay phát âm thành một từ (ví dụ: NATO thường được phát âm là ‘n eɪ t oʊ’ (nay-toh) thay vì ‘ɛn eɪ ti oʊ’ (N. A. T. O.)).

Hỏi: tôi có thể tìm thấy các ví dụ về cách sử dụng phát âm tùy chỉnh không?

Bạn có thể tìm thấy các định dạng nhập liệu mẫu và ví dụ trong tài liệu sau: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html.

Hỏi: điều gì xảy ra nếu tôi sử dụng sai IPA? Nếu không chắc chắn, tốt nhất là tôi không nên đưa vào bất kỳ IPA nào đúng ko?

Hệ thống sẽ sử dụng cách phát âm bạn cung cấp, qua đó tăng khả năng từ sẽ được công nhận là chính xác nếu cách phát âm chuẩn và khớp với cách từ được nói. Nếu bạn không chắc là mình đang tạo đúng IPA, vui lòng chạy một bản so sánh bằng cách xử lý các tệp âm thanh của bạn với từ vựng chứa cách phát âm theo IPA này và với từ vựng chỉ chứa các từ (và các mẫu display-as, nếu muốn). Nếu bạn không cung cấp bất kỳ cách phát âm nào, dịch vụ sẽ sử dụng cách phát âm ước đoán, có thể chính xác hơn dữ liệu nhập của bạn hoặc không.

Hỏi: khi sử dụng các mẫu DisplayAs, tôi có thể hiển thị những bộ ký tự không liên quan đến ngôn ngữ gốc được chép lại không? (ví dụ: dữ liệu xuất của “Street” là “街道“).

Có. Mặc dù các cụm từ có thể chỉ sử dụng bộ ký tự hạn chế dành cho ngôn ngữ cụ thể, các ký tự UTF-8 ngoài \t (TAB) được cho phép trong cột DisplayAs.

Câu hỏi: Có phải Biên tập nội dung tự động được cung cấp cho cả API theo lô và API truyền phát của Transcribe không?

Không, chức năng này chỉ được cung cấp cho API theo lô tại thời điểm này.

Câu hỏi: Biên tập nội dung tự động hỗ trợ những ngôn ngữ nào?

Hiện chức năng đang hỗ trợ tiếng Anh-Mỹ (en-US).

Câu hỏi: Có phải Biên tập nội dung tự động cũng biên tập thông tin cá nhân nhạy cảm khỏi âm thanh nguồn?

Không, tính năng này không loại bỏ thông tin cá nhân nhạy cảm khỏi âm thanh nguồn. Tuy nhiên, bạn có thể tự biên tập thông tin cá nhân khỏi âm thanh nguồn bằng cách sử dụng các nhãn thời gian bắt đầu và kết thúc được cung cấp trong bản chuyển lời thoại được biên tập cho mỗi trường hợp của lời nói được xác định chứa PII.

Câu hỏi: Tôi có thể sử dụng Biên tập nội dung tự động để biên tập thông tin cá nhân khỏi các bản chuyển lời thoại sang văn bản hiện có không?

Không, Biên tập nội dung tự động chỉ hoạt động với tệp âm thanh dưới dạng đầu vào.

Câu hỏi: Tôi cần biết thông tin gì khác trước khi sử dụng Biên tập nội dung tự động?

Biên tập nội dung tự động được thiết kế để xác định và loại bỏ thông tin nhận dạng cá nhân (PII) nhưng do bản chất dự đoán của machine learning nên chức năng này có thể không nhận dạng và loại bỏ được tất cả các trường hợp PII trong bản chuyển lời thoại mà dịch vụ tạo ra. Bạn nên xem lại mọi kết quả được cung cấp bởi Biên tập nội dung tự động để đảm bảo nội dung đó đáp ứng được các nhu cầu của bạn.

Câu hỏi: API nào có thể hỗ trợ nhận dạng ngôn ngữ tự động?

Nhận dạng ngôn ngữ tự động hiện được hỗ trợ cho một loạt API.

Câu hỏi: Những ngôn ngữ nào được Amazon Transcribe tự động nhận diện?

Amazon Transcribe có thể nhận diện bất cứ ngôn ngữ nào được hỗ trợ bởi một loạt API.

Câu hỏi: Amazon Transcribe có thể nhận diện nhiều ngôn ngữ trong cùng một tệp âm thanh không?

Amazon Transcribe chỉ có thể nhận diện ngôn ngữ chính trong một tệp âm thanh.

Câu hỏi: Có cách nào để hạn chế danh sách các ngôn ngữ có thể chọn cho Nhận dạng ngôn ngữ tự động không?

Có, bạn có thể chỉ định một danh sách các ngôn ngữ có thể hiển thị trong thư viện đa phương tiện của bạn. Khi bạn cung cấp một danh sách các ngôn ngữ, ngôn ngữ được nhận diện sẽ được lựa chọn từ danh sách đó. Nếu không có ngôn ngữ nào được chỉ định, hệ thống sẽ xử lý tệp âm thanh dựa trên tất cả các ngôn ngữ được hỗ trợ bởi Amazon Transcribe và lựa chọn ngôn ngữ gần đúng nhất. Độ chính xác của nhận dạng ngôn ngữ được cải thiện khi bạn cung cấp một danh sách các ngôn ngữ có thể chọn.

Giá và tình trạng sẵn có

Hỏi: giá của công cụ này là bao nhiêu?

Hãy tham khảo trang Giá công cụ Amazon Transcribe để tìm hiểu thêm.

Hỏi: Amazon Transcribe sử dụng được ở những khu vực AWS nào?

Vui lòng tham khảo Bảng khu vực cơ sở hạ tầng toàn cầu của AWS.

Quyền riêng tư về dữ liệu

Câu hỏi: Dữ liệu giọng nói nhập vào để Amazon Transcribe xử lý có được lưu trữ không và AWS sử dụng dữ liệu này như thế nào?

Amazon Transcribe chỉ có thể lưu trữ và sử dụng dữ liệu giọng nói đầu vào mà dịch vụ xử lý cho mục đích cung cấp và duy trì dịch vụ, cũng như để cải thiện và phát triển chất lượng của Amazon Transcribe và các công nghệ trí tuệ nhân tạo/máy học khác của Amazon. Chúng tôi cần sử dụng nội dung của bạn để không ngừng cải thiện trải nghiệm Amazon Transcribe của khách hàng, bao gồm cả việc phát triển và đào tạo các công nghệ liên quan. Chúng tôi không sử dụng bất kỳ thông tin nhận dạng cá nhân nào có thể có trong nội dung của bạn để tiếp thị hoặc nhắm mục tiêu các sản phẩm, dịch vụ đến bạn hoặc người dùng cuối của bạn. Sự tin cậy, quyền riêng tư của bạn và tính bảo mật của nội dung là ưu tiên hàng đầu của chúng tôi. Chúng tôi triển khai các biện pháp kiểm soát vật lý cũng như kỹ thuật phức tạp và phù hợp, bao gồm cả công nghệ mã hóa nội dung trong khi truyền và khi không truyền, được thiết kế để ngăn khả năng truy cập trái phép hoặc tiết lộ nội dung của bạn và đảm bảo việc sử dụng của chúng tôi tuân thủ những gì chúng tôi cam kết với bạn. Vui lòng xem https://aws.amazon.com/compliance/data-privacy-faq/ để biết thêm thông tin. Bạn có thể chọn không cho phép chúng tôi sử dụng nội dung của bạn để cải thiện và phát triển chất lượng của Amazon Transcribe và các công nghệ trí tuệ nhân tạo/máy học khác của Amazon bằng cách sử dụng chính sách từ chối của AWS Organizations. Để biết thông tin về cách từ chối, hãy xem Chính sách từ chối quản lý dịch vụ AI.

Hỏi: Tôi có thể xóa dữ liệu và thành phần lạ đi kèm tác vụ chuyển lời thoại được Amazon Transcribe lưu trữ hay không?

Có. Bạn có thể sử dụng các API xóa có sẵn để xóa dữ liệu và các thành phần lạ khác đi kèm tác vụ chuyển lời thoại. Nếu bạn gặp sự cố khi thực hiện thao tác này, hãy liên hệ với bộ phận hỗ trợ của AWS.

Hỏi: ai có thể xem nội dung mà Amazon Transcribe xử lý và lưu trữ?

Chỉ những người được ủy quyền mới có thể xem nội dung mà Amazon Transcribe xử lý. Sự tin cậy, quyền riêng tư của bạn và tính bảo mật của nội dung là ưu tiên hàng đầu của chúng tôi. Chúng tôi triển khai các biện pháp kiểm soát vật lý cũng như kỹ thuật phức tạp và phù hợp, bao gồm cả công nghệ mã hóa nội dung trong khi truyền và khi không truyền, được thiết kế để ngăn khả năng truy cập trái phép hoặc tiết lộ nội dung của bạn và đảm bảo việc sử dụng của chúng tôi tuân thủ những gì chúng tôi cam kết với bạn. Vui lòng xem https://aws.amazon.com/compliance/data-privacy-faq/ để biết thêm thông tin.

Hỏi: tôi vẫn nắm quyền sở hữu nội dung mà Amazon Transcribe xử lý và lưu trữ chứ?

Bạn luôn nắm quyền sở hữu nội dung của mình và chúng tôi chỉ sử dụng nội dung này khi bạn đồng ý.

Câu hỏi: Điều gì xảy ra với dữ liệu của tôi được dùng trong các mô hìnhngôn ngữ tùy chỉnh của khóa đào tạo? Tôi vẫn sở hữu dữ liệu này?

Khi gửi dữ liệu văn bản được dùng để đào tạo mô hình chuyên dụng, khách hàng có quyền sở hữu cả dữ liệu văn bản gốc cũng như mô hình tùy chỉnh được tạo. Dữ liệu văn bản sẽ không được lưu trữ hoặc sử dụng để cải thiện cộng cụ nhận dạng giọng nói chung của chúng tôi. Các mô hình được tạo ra bằng cách sử dụng CLM được tự chứa và khách hàng có thể truy cập được.

Câu hỏi: Vì dịch vụ sẽ không giữ lại dữ liệu đào tạo của tôi, nên chất lượng bản chép lời hoặc trải nghiệm dịch vụ chung có bị hạn chế hoặc giảm không?

Chất lượng bản chép lời sẽ không bị giảm do dịch vụ của chúng tôi không lưu trữ dữ liệu đào tạo của bạn. Sau khi dữ liệu đào tạo được dùng để thực sự tạo ra mô hình ngôn ngữ tùy chỉnh, thì chính mô hình đó sẽ được cung cấp để sử dụng nhiều lần theo ý của bạn. Bộ đào tạo gốc bạn tải lên bị xóa khỏi hệ thống của chúng tôi. Hạn chế duy nhất là nếu bạn yêu cầu hỗ trợ kỹ thuật. Vì không giữ lại dữ liệu đào tạo gốc, chúng tôi không có quyền truy cập nhất quán vào các nội dung đó hoặc thành phần lạ trung gian có liên quan, nếu bạn yêu cầu nhóm hỗ trợ để điều tra các vấn đề dịch vụ tiềm ẩn. Chúng tôi vẫn cung cấp dịch vụ hỗ trợ nhưng không thiết thực vì chúng tôi có thể cần phải yêu cầu bạn cung cấp thêm thông tin.

Câu hỏi: Tôi có thể sử dụng lại dữ liệu để cải thiện hoặc cập nhật mô hình trong tương lai không?

Vì dữ liệu đào tạo không được lưu trữ, bộ dữ liệu tương tự và mọi dữ liệu bổ sung sẽ phải được tải lên lần nữa để đào tạo các mô hình mới. Khi có bản cập nhật cho mô hình cơ sở do Amazon Transcribe cung cấp, bạn sẽ nhận được thông báo. Để tận dụng mô hình cơ sở mới nhất, bạn nên gửi dữ liệu của mình để đào tạo mô hình mới. Sau đó, bạn sẽ có cả mô hình tùy chỉnh gốc mà trước đó bạn đã tạo và cả phiên bản mới để sử dụng.

Câu hỏi: Tôi xóa mô hình mới bằng cách nào?

Người dùng có thể xóa mọi mô hình ngôn ngữ của khách hàng mà họ đã tạo theo ý mình.

Hỏi: Nội dung Amazon Transcribe xử lý có được chuyển ra bên ngoài khu vực AWS mà tôi đang dùng Amazon Transcribe không?

Mọi nội dung mà Amazon Transcribe xử lý đều được mã hóa và lưu trữ trong khu vực AWS bạn đang dùng Amazon Transcribe. Chúng tôi sẽ chỉ lưu trữ một số phần nội dung mà Amazon Transcribe xử lý ở một khu vực AWS khác để phục vụ mục đích không ngừng phát triển và cải thiện trải nghiệm khách hàng Amazon Transcribe, cũng như các công nghệ trí thông minh nhân tạo/machine learning khác của Amazon. Nếu bạn liên hệ với bộ phận AWS Support và yêu cầu chúng tôi không sử dụng nội dung của bạn cho mục đích nâng cao chất lượng của Amazon Transcribe và các công nghệ trí thông minh nhân tạo/machine learning khác của Amazon, thì chúng tôi sẽ không lưu trữ nội dung của bạn ở khu vực AWS khác. Bạn có thể liên hệ với bộ phận AWS Support để yêu cầu xóa giọng nói đã nhập được liên kết với tài khoản của mình. Sự tin cậy, quyền riêng tư của bạn và tính bảo mật của nội dung là ưu tiên hàng đầu của chúng tôi. Chúng tôi triển khai các biện pháp kiểm soát vật lý cũng như kỹ thuật phức tạp và phù hợp, bao gồm cả công nghệ mã hóa nội dung trong khi truyền và khi không truyền, được thiết kế để ngăn khả năng truy cập trái phép hoặc tiết lộ nội dung của bạn và đảm bảo việc sử dụng của chúng tôi tuân thủ những gì chúng tôi cam kết với bạn. Vui lòng xem https://aws.amazon.com/compliance/data-privacy-faq/ để biết thêm thông tin.

Hỏi: tôi có thể dùng Amazon Transcribe cho các trang web, chương trình hoặc ứng dụng khác hướng đến hoặc nhắm mục tiêu đến trẻ em dưới 13 tuổi và tuân theo Đạo luật bảo vệ quyền riêng tư của trẻ em trên mạng (COPPA) không?

Có, tùy thuộc vào mức độ tuân thủ Điều khoản dịch vụ của Amazon Transcribe, bao gồm nghĩa vụ cung cấp mọi thông báo bắt buộc và có được mọi sự đồng ý cần thiết, có thể xác minh của phụ huynh như quy định trong COPPA, bạn có thể sử dụng Amazon Transcribe cho (một phần/toàn bộ) trang web, chương trình hoặc ứng dụng khác hướng đến hoặc nhắm mục tiêu đến trẻ em dưới 13 tuổi.

Hỏi: làm cách nào để xác định trang web, chương trình hoặc ứng dụng của tôi có tuân thủ COPPA không?

Để biết thông tin về các yêu cầu trong COPPA và hướng dẫn cách xác định xem trang web, chương trình hoặc ứng dụng khác của bạn có tuân thủ COPPA hay không, vui lòng tham khảo trực tiếp các tài nguyên mà Ủy ban thương mại liên bang Mỹ cung cấp và duy trì. Trang web này cũng cung cấp thông tin liên quan đến cách xác định xem một dịch vụ (một phần/toàn bộ) có hướng đến hay nhắm mục tiêu đến trẻ em dưới 13 tuổi hay không.

Amazon Transcribe Medical

Câu hỏi: Amazon Transcribe Medical là gì?

Amazon Transcribe Medical là dịch vụ nhận dạng giọng nói tự động (ASR) giúp các nhà phát triển dễ dàng bổ sung khả năng chuyển giọng nói thành văn bản về y tế vào các ứng dụng của họ. Sử dụng Amazon Transcribe Medical, bạn có thể phiên âm chính tả và hội thoại về y tế thành văn bản một cách nhanh chóng và chính xác cho nhiều mục đích khác nhau, chẳng hạn như ghi lại ghi chú của bác sĩ hoặc xử lý trong phân tích văn bản xuôi chiều để thu được những thông tin quan trọng.

Câu hỏi: Tôi có thể làm gì với Amazon Transcribe Medical?

Amazon Transcribe Medical sử dụng các mô hình machine learning tiên tiến để phiên âm chính xác lời nói về y tế thành văn bản. Transcribe Medical có thể tạo các bản sao văn bản dùng để hỗ trợ nhiều trường hợp sử dụng khác nhau, từ quy trình ghi chép lâm sàng và theo dõi an toàn thuốc (cảnh giác dược) đến tạo phụ đề cho y học từ xa và thậm chí cả các phân tích trung tâm liên lạc trong lĩnh vực chăm sóc sức khỏe và khoa học đời sống.

Câu hỏi: Tôi có cần phải là chuyên gia trong nhận dạng giọng nói tự động (ASR) để sử dụng Amazon Transcribe Medical không?

Không, bạn không cần bất kỳ chuyên môn nào về ASR hay chuyên môn về machine learning để sử dụng Amazon Transcribe Medical. Bạn chỉ cần gọi API của Transcribe Medical và dịch vụ sẽ xử lý machine learning được yêu cầu trong backend để chuyển lời nói về y tế thành văn bản.

Câu hỏi: Tôi bắt đầu với Amazon Transcribe Medical bằng cách nào?

Bạn có thể bắt đầu với Amazon Transcribe Medical từ Bảng điều khiển quản lý AWS hoặc bằng cách sử dụng SDK. Vui lòng tham khảo trang tài liệu kỹ thuật này để biết chi tiết.

Amazon Transcribe Medical cung cấp bậc miễn phí để bạn có thể dùng thử dịch vụ. Tham khảo trang mức giá này để biết thêm thông tin.

Câu hỏi: Amazon Transcribe Medical hỗ trợ những ngôn ngữ nào?

Amazon Transcribe Medical hiện hỗ trợ bản sao chép y tế bằng tiếng Anh Mỹ.

Câu hỏi: Amazon Transcribe Medical hỗ trợ những chuyên khoa y tế nào?

Amazon Transcribe Medical hỗ trợ chép lại đối với một loạt các chuyên khoa chăm sóc chính và chăm sóc đặc biệt. Truy cập tài liệu của chúng tôi để xem danh sách đầy đủ các dịch vụ chăm sóc y tế đặc biệt được hỗ trợ.

Câu hỏi: Amazon Transcribe Medical được cung cấp ở khu vực AWS nào?

Amazon Transcribe Medical hiện có sẵn ở Miền Đông Hoa Kỳ (Bắc Virginia), Miền Đông Hoa Kỳ (Ohio), Miền Tây Hoa Kỳ (Oregon), Canada (Miền Trung), Châu Âu (Ai-len) và Châu Á Thái Bình Dương (Sydney).

Câu hỏi: Giá dịch vụ Amazon Transcribe Medical như thế nào?

Hãy tham khảo trang giá Amazon Transcribe Medical để tìm hiểu thêm về chi tiết giá cả.

Câu hỏi: Amazon Transcribe Medical có đủ điều kiện HIPAA không?

Có.

Câu hỏi: Nội dung mà Amazon Transcribe Medical xử lý có được sử dụng cho bất kỳ mục đích nào khác ngoài việc cung cấp dịch vụ không?

Amazon Transcribe Medical không sử dụng nội dung do dịch vụ xử lý cho bất kỳ lý do nào khác ngoài việc cung cấp và duy trì dịch vụ. Nội dung do dịch vụ này xử lý không được sử dụng để phát triển hoặc cải thiện chất lượng cho Amazon Transcribe Medical hoặc bất kỳ công nghệ machine-learning/trí tuệ nhân tạo nào khác của Amazon.

Câu hỏi: Amazon Transcribe Medical có học theo thời gian không?

Có, Amazon Transcribe Medical sử dụng machine learning và liên tục được đào tạo để cải tiến nhằm phục vụ tốt hơn các trường hợp sử dụng của khách hàng. Amazon Transcribe Medical không lưu trữ hoặc sử dụng dữ liệu khách hàng được sử dụng với dịch vụ để đào tạo các mô hình

Câu hỏi: Tôi cần biết những thông tin gì khác trước khi sử dụng dịch vụ Amazon Transcribe Medical?

Amazon Transcribe Medical không thể thay thế cho tư vấn, chẩn đoán hoặc điều trị y tế chuyên môn. Bạn và người dùng cuối của bạn chịu trách nhiệm thực hiện theo ý định, kinh nghiệm và phán đoán của riêng mình trong việc quyết định tính chính xác, đầy đủ, kịp thời và sự phù hợp của mọi thông tin do Amazon Transcribe Medical cung cấp. Bạn và người dùng cuối của bạn hoàn toàn chịu trách nhiệm về mọi quyết định, lời khuyên, hành động và/hoặc không hành động dựa trên việc sử dụng Amazon Transcribe Medical. 

Amazon Transcribe Medical có thể không xác định chính xác thông tin sức khỏe được bảo vệ trong mọi trường hợp và có thể không đáp ứng các yêu cầu về việc hủy nhận dạng thông tin sức khỏe được bảo vệ theo HIPAA. Bạn chịu trách nhiệm xem xét mọi thông tin đầu ra do Amazon Transcribe Medical cung cấp để đảm bảo thông tin đó đáp ứng nhu cầu của mình.

Mô hình ngôn ngữ tùy chỉnh

Hỏi: Hiện tại, mô hình ngôn ngữ tùy chỉnh có những chức năng gì?

Mô hình ngôn ngữ tùy chỉnh (CLM) hiện hỗ trợ bản chép lời tiếng Anh Mỹ. Bản chép lời này được cung cấp là một phần của API xử lý âm thanh theo loạt của Amazon Transcribe. CLM không đồng thời hỗ trợ việc sử dụng bổ sung Kho từ vựng tùy chỉnh.

Hỏi: Tôi cần bao nhiêu và loại dữ liệu đào tạo nào? Tôi có thể nhận dữ liệu bằng cách nào? Dữ liệu có cần phải có định dạng cụ thể không?

Dữ liệu văn bản phải thích hợp với âm thanh sẽ được chép lời bằng mô hình tùy chỉnh; dữ liệu này phải chứa càng nhiều từ, cụm từ và tổ hợp từ dành riêng cho miền càng tố. Bạn nên dùng ít nhất 100 ngàn và tối đa 10 triệu từ văn bản chạy. Bạn có thể nhận tài nguyên dữ liệu văn bản từ bất kỳ nguồn nội bộ hoặc công khai nào (ví dụ: sử dụng văn bản từ trang web của khách hàng). Chúng tôi khuyến nghị mỗi tệp văn bản thuần túy chứa 200.000 từ trở lên nhưng kích thước tệp chung không quá 1GB. Văn bản phải ở định dạng UTF-8 và sử dụng mỗi dòng một câu. Mỗi câu phải có một dấu chấm. Người dùng chịu trách nhiệm kiểm tra chính tả, xóa các ký tự định dạng và xác nhận mã hóa.

Hỏi: Tôi sử dụng Mô hình ngôn ngữ tùy chỉnh (CLM) như thế nào?

Để đào tạo mô hình ngôn ngữ tùy chỉnh, khách hàng chỉ cung cấp dữ liệu văn bản trong vùng lưu trữ Amazon S3. Sau đó, người dùng có thể sử dụng bảng điều khiển dịch vụ Amazon Transcribe để tải và xử lý dữ liệu để đào tạo một mô hình ngôn ngữ tùy chỉnh. Việc đào tạo hoàn toàn tự động và cần sự can thiệp tối thiểu của người dùng. Khi mô hình tùy chỉnh sau cùng đã sẵn sàng, mô hình này được cung cấp trong tài khoản AWS của khách hàng để chép lời tệp âm thanh dành riêng cho miền. Hơn nữa, khách hàng có thể đào tạo nhiều mô hình tùy chỉnh để sử dụng cho nhiều trường hợp sử dụng khác nhau.

Hỏi: Sự cải thiện có được đảm bảo không? Việc này có đáng phải nỗ lực thu thập dữ liệu văn bản không?

Việc cải thiện không được đảm bảo – thay đổi về hiệu suất sẽ tùy thuộc vào dữ liệu văn bản phù hợp chặt chẽ với âm thanh đến mức nào và vào lượng dữ liệu được cung cấp. Nhiều dữ liệu thường tốt hơn nhưng điều quan trọng nhất là dữ liệu phải bao gồm các từ và trình tự cần phải diễn ra trong tệp âm thanh mà bạn dự định chép lời. Việc cải thiện độ chỉnh xác của bản chép lời tùy thuộc vào chất lượng của dữ liệu đào tạo cũng như trường hợp sử dụng. Trong một số trường hợp, chuẩn mực chung cho biết 10% đến 15% cải thiện độ chính xác tương đối.

Hỏi: Đào tạo mô hình mất bao lâu? Khi nào tôi có thể sử dụng mô hình này?

Đào tạo mô hình thường mất từ 6 đến 10 giờ. Khoảng thời gian đào tạo phụ thuộc vào độ lớn của bộ dữ liệu. Mô hình tùy chỉnh sẽ được cung cấp trực tiếp sau khi việc đào tạo hoàn tất.

Hỏi: Tôi sẽ có thể sử dụng mô hình như thế nào? Làm cách nào để tôi biết mô hình này có hiệu quả hơn mô hình chung do Amazon Transcribe cung cấp không?

Mô hình sẽ được cung cấp trong tài khoản của khách hàng trong ID mô hình do khách hàng gán trước quy trình đào tạo. Để sử dụng mô hình, cờ có ID mô hình cần phải được thêm vào yêu cầu chép lời. Khách hàng phải kiểm tra mô hình trong tệp âm thanh của họ và so sánh đầu ra với kết quả thu được từ công cụ chung.

Hỏi: Tôi có thể đào tạo bao nhiêu Mô hình ngôn ngữ tùy chỉnh? Tôi có thể bật đồng thời nhiều mô hình cho tài khoản của mình không?

Bạn có thể đào tạo đồng thời tối đa 5 mô hình khác nhau tại một thời giam nhất định cho mỗi tài khoản AWS. Theo mặc định, đối với mỗi tài khoản, bạn có thể lưu trữ tối đa 10 mô hình. Nếu cần nhiều mô hình hơn, bạn có thể thực hiện tăng giới hạn dịch vụ tại đây.

Hỏi: Các mô hình âm thanh tùy chỉnh có được hỗ trợ không?

Không. Các mô hình âm thanh tùy chỉnh không được hỗ trợ. Các mô hình ngôn ngữ tùy chỉnh được xây dựng từ dữ liệu văn bản có liên quan đến trường hợp sử dụng hoặc miền của bạn.

Tìm hiểu thêm về định giá Amazon Transcribe

Truy cập vào trang giá
Bạn đã sẵn sàng để bắt đầu chưa?
Hãy dùng thử bảng điều khiển Amazon Transcribe
Bạn có thêm câu hỏi?
Liên hệ với chúng tôi