一般問題

問:什麼是 Amazon Transcribe?

Amazon Transcribe 是一種 AWS 服務,可以讓客戶將語音輕鬆轉換成文字。透過自動語音辨識 (ASR) 技術,客戶可以選擇在各種商業應用中使用 Amazon Transcribe,包括轉錄語音客服電話、產生音訊/視訊內容的字幕,以及分析 (以文字為基礎) 音訊/視訊內容。 

問:Amazon Transcribe 如何與其他 AWS 產品互動?

Amazon Transcribe 會將音訊輸入轉換為文字,為語音輸入的文字分析應用提供更多的可能性。例如,將 Amazon Comprehend 應用到 Amazon Transcribe 轉換的文字資料上,客戶可以執行情感分析或擷取實體和關鍵片語。同樣地,整合 Amazon Translate 和 Amazon Polly 之後,客戶可以接受一種語言的語音輸入,然後將其翻譯成另一種語言並產生語音輸出,從而有效地進行多語言對話。還可以整合 Amazon Transcribe 與 Amazon Elasticsearch,以便在音訊/視訊程式庫編製索引和執行文字搜尋。 

使用 Amazon Transcribe

問:開發人員如何存取 Transcribe?

開始使用 Amazon Transcribe 最簡單的方法是使用主控台提交任務,以轉錄音訊檔案。您也可以直接從 AWS 命令列界面呼叫服務,或是使用您選擇的支援 SDK 將服務整合到您的應用程式。無論採用哪種方式,只需幾行程式碼即可開始使用 Amazon Transcribe 為您的音訊檔案產生自動轉錄。

問:Amazon Transcribe 支援哪種類型的輸入?

Amazon Transcribe 支援 16 kHz 和 8 kHz 音訊串流以及多種音訊編碼,包括 WAV、MP3、MP4 和 FLAC。

問:Amazon Transcribe 是否支援即時轉寫?

是。Amazon Transcribe 讓使用者開啟 HTTP2 的雙向串流。使用者可在即時接收返回的文字串流同時傳送服務的音訊串流。 

問:即時轉寫支援的是什麼編碼?

串流轉寫目前支援的是 16 位元線性 PCM 編碼。 

問:Amazon Transcribe 支援哪些語言?

如需語言支援的相關資訊,請瀏覽此文件頁面。 

問:Amazon Transcribe 可以搭配哪些裝置?

Amazon Transcribe 適用於絕大多數的裝置。一般而言,Amazon Transcribe 可與任何內建麥克風的裝置 (例如手機、個人電腦、平板電腦和汽車音響系統等 IoT 裝置) 搭配使用。Amazon Transcribe API 可以偵測裝置上的音訊串流輸入品質 (8 kHz 與 16 kHz),並為語音轉文字功能選擇適用的聲學模型。此外,開發人員可以透過應用程式呼叫 Transcribe API,以存取語音轉換文字功能。 

問:Amazon Transcribe 可以處理的音訊內容是否有大小限制?

使用批次服務時,每次 API 呼叫的 Amazon Transcribe 服務呼叫時間僅限 4 小時 (或 2 GB)。串流服務可提供高達 4 小時長的開放連接。 

問:Amazon Transcribe 支援哪些程式設計語言?

Amazon Transcribe 批次服務支援 .NET、Go、Java、Javascript、PHP、Python 和 Ruby。
Amazon Transcribe 即時服務支援 Java SDK、Ruby SDK 和 C++ SDK。即將支援其他 SDK。如需詳細資訊,請參閱資源頁面。 

問︰我的自訂詞彙字詞未被識別! 我該怎麼辦?

除了自訂詞彙項目之外,語音識別輸出還取決於許多因素,因此無法保證術語是否包含在自訂詞彙中,以及是否會被正確識別。
但最常見的原因是自訂字詞缺少正確的發音。如果您沒有為自訂字詞提供發音,請嘗試建立一個。如果您已提供一個,請仔細檢查其正確性,或在必要時包含其他發音變體。這可透過在自訂詞彙檔案中建立發音欄位不同的多個項目來完成。

問:為什麼輸出中會看到太多自訂字詞?

自訂詞彙針對一小部分目標字詞進行了優化;較大的詞彙可能會導致自訂字詞過度產生,尤其是當它們包含以類似方式發音的字詞時。如果您有一個大型清單,請嘗試將其縮減為罕見字詞,以及實際預期會出現在音訊檔案中的字詞。如果您有涵蓋多個使用案例的大型詞彙,請針對不同使用案例將其拆分為單獨的清單。較短且聽起來類似於許多其他字詞的字詞可能導致過度產生 (輸出中出現太多自訂字詞)。最好將這些字詞與周圍的字詞組合,並將其列為用連字號分隔的片語。例如,自訂字詞 “A.D.” 可以作為 ‘A.D.-converter’ 等片語的一部分包括在內。

問:有兩種方法可以在自訂詞彙中提供發音、IPA 或 SoundsLike 欄位。哪一個更好?

IPA 可實現更精確的發音。如果能夠產生 IPA (例如,來自具有 IPA 發音的詞典或線上轉換器工具),則應提供 IPA 發音。

問:我想使用 IPA,但我不是語言專家。我可以使用線上工具嗎?

一些標準詞典,例如牛津英語詞典或劍橋詞典 (包括其線上版本) 在 IPA 中提供發音。還有以下線上轉換器 (例如 easypronunciation.comtophonetics.com,適用於英文) - 但請注意,在大多數情況下,這些工具都基於基礎詞典,並且可能無法為某些字詞 (例如專有名稱) 產生正確的 IPA。Amazon Transcribe 不支援任何第三方工具。

問:我是否需要使用針對同一語言不同口音的不同 IPA 標準? (例如美式英文與英式英文)?

您應使用適合您將要處理的音訊檔案的 IPA 標準 - 例如,如果您希望處理來自英式英文使用者的音訊,則使用英式英文發音標準。對於 Amazon Transcribe 支援的不同語言和方言,允許的 IPA 符號集可能會有所差異;請確保您的發音僅包含允許的字元。有關 IPA 字元集的詳細資訊,請參閱文件:https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

問:如何在自訂詞彙中使用 SoundsLike 欄位提供發音?

您可以將字詞或片語分成更小的片段,並使用語言的標準拼寫法為每個片段提供發音,以模仿字詞的發音方式。例如,在英文中,您可以為片語提供發音提示, Los-Angeles 像這樣:loss-ann-gel-es。Etienne 這個字的提示看起來像這樣:eh-tee-en.用連字號 (-) 分隔提示的每個部分。您可以使用任何允許的字元作為輸入語言。

問:提供首字母縮略字的兩種不同方式 (帶句點和不帶句點但有發音) 如何運作?

如果使用帶句點的首字母縮略字,拼寫發音將在內部產生。如果不使用句點,請在發音欄中提供發音。對於某些首字母縮略字,它們是否具有拼寫發音或類似字詞的發音並不明顯 (例如 NATO 的發音通常為 ‘n eɪ t oʊ’ (nay-toh) 而非 ‘ɛn eɪ ti oʊ’ (N. A.T. O.))。

問:在哪裡可以找到如何使用自訂發音的範例?

您可以在文件中找到範例輸入格式和範例︰https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html

問:如果使用了錯誤的 IPA 會怎樣? 如果不確定,最好不要輸入任何 IPA 嗎?

系統將使用您提供的發音;如果發音正確且與所說的相符,這應該增加正確識別字詞的可能性。如果您不確定是否產生正確的 IPA,請透過使用包含 IPA 發音的詞彙來處理您的音訊檔案,以及僅包含字詞的詞彙 (還可選擇顯示為表單) 來進行比較。如果您不提供任何發音,則服務將使用近似發音,這可能會或可能不會比您的輸入更好。

問:使用 DisplayAs 表單時,是否可以顯示與原始語言無關的字元集? (例如將 “Street” 輸出為 “街道”)

是。雖然片語可能僅對特定語言使用受限字元集,但在 DisplayAs 欄中允許使用除 \t (TAB) 之外的 UTF-8 字元。

定價與可用性

問:如何收費?

如需進一步了解,請參閱 Amazon Transcribe 定價頁面。

問:哪些 AWS 區域可使用 Amazon Transcribe?

請參閱 AWS 全球基礎設施區域表

資料隱私權

問:是否會存放 Amazon Transcribe 處理的語音輸入?AWS 如何使用這些內容?

Amazon Transcribe 可能會單方面存放及使用服務處理過的語音輸入,以提供及維護服務,以及改善 Amazon Transcribe 的品質和開發其他 Amazon 機器學習/人工智慧技術。為了持續改善 Amazon Transcribe 客戶體驗 (包括開發及訓練相關技術),我們必須使用您的內容。不過,我們不會使用內容中包含的任何個人識別資訊來指定產品、服務或向您或您最終使用者進行行銷。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/。 您可能會選擇聯絡 AWS Support 來讓我們使用您的內容,來改善和開發 Amazon Transcribe 和其他 Amazon 機器學習/人工智慧技術的品質。

問:是否可刪除 Amazon Transcribe 存放的語音輸入?

是。您可以聯絡 AWS Support,請求刪除與您帳戶關聯的語音輸入。刪除語音輸入可能會降低 Amazon Transcribe 的使用體驗。

問:哪些人可以存取 Amazon Transcribe 所處理及存放的內容?

只有得到授權的員工可以存取 Amazon Transcribe 所處理的內容。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/

問:我是否仍擁有經過 Amazon Transcribe 處理及存放的內容?

您會永久保有自己內容的擁有權,而且我們只會在取得同意的情況下,才使用您的內容。

問:Amazon Transcribe 處理的內容是否會移出我使用 Amazon Transcribe 的 AWS 區域?

Amazon Transcribe 處理的任何內容都會經過加密,並靜態存放在您使用 Amazon Transcribe 的 AWS 區域中。Amazon Transcribe 處理的部分內容可能會存放在其他 AWS 區域,僅用於繼續改善及開發 Amazon Transcribe 客戶使用體驗和其他 Amazon 機器學習/人工智慧技術。您可能會選擇聯絡 AWS Support 來讓我們使用您的內容,來改善和開發 Amazon Transcribe 和其他 Amazon 機器學習/人工智慧技術的品質,您的內容將不會存放在另一個 AWS 區域中。您可以聯絡 AWS Support,請求刪除與您帳戶關聯的語音輸入。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/

問:我是否可以在導向或針對 13 歲以下兒童且受兒童線上隱私保護法令 (COPPA) 規範的網站、程式或其他應用程式上使用 Amazon Transcribe?

是,您必須遵守 Amazon Transcribe 服務條款的規範,包括您有義務依據 COPPA 提供任何必要的通知和取得任何必要的可查證家長同意,如此即可在導向或針對 13 歲以下兒童的全部或部分網站、程式或其他應用程式使用 Amazon Transcribe。

問:如何判斷我的網站、程式或應用程式是否受 COPPA 規範?

如需 COPPA 要求的資訊以及判斷您的網站、程式或其他應用程式是否受 COPPA 規範的指導,請直接參閱美國聯邦貿易委員會提供和維護的資源。這個網站也包含如何判斷某個服務 (全部或部署) 是否針對 13 歲以下兒童的相關資訊。

進一步了解 Amazon Transcribe 定價

瀏覽定價頁面
準備好開始使用了嗎?
試用 Amazon Transcribe 主控台
還有其他問題嗎?
聯絡我們