建立音訊記錄

建立音訊記錄

在此逐步教學中,您將學習如何使用 Amazon Transcribe,以透過 AWS 管理主控台建立錄製音訊檔案的文字記錄。Amazon Transcribe 是一項自動語音辨識 (ASR) 服務,可讓開發人員在應用程式中輕鬆加入語音轉換文字功能。您可以使用 Amazon Transcribe API 分析存放在 Amazon Simple Storage Service (S3) 中的音訊檔,讓服務傳回轉寫語音的文字檔案。

作為開發人員,建立客戶服務通話記錄或在音訊和影片內容上產生字幕,通常需要語音轉換文字功能。透過從頭開始建置自己的機器學習模型可以解決這一挑戰。然而,該選項非常耗時、昂貴且需要機器學習專業知識。您可以不用走這條艱難的路徑,而是使用 Amazon Transcribe,這是一種經過預先培訓的全受管服務,這項服務可提供快速、高品質的轉錄。

在本教學中,您將下載一個範例音訊檔案,再將其上傳至您將建立的 S3 儲存貯體。然後,您將使用 Amazon Transcribe,透過 AWS 管理主控台從範例音訊剪輯中建立複本。

本教學示範使用 AWS CLI 或 Transcribe API 時可用的功能。如需生產或概念驗證實作,建議您使用這些程式設計介面,而非 Amazon Transcribe 主控台。

本教學需要 AWS 帳戶

Amazon Transcribe 免費方案讓您快速上手。每月轉錄多達 60 分鐘的音訊 - 您開設 AWS 帳戶前 12 個月可免費使用。

進一步了解免費方案 >>


步驟 1.建立 S3 儲存貯體並上傳範例音訊檔案

在此步驟中,您將下載範例音訊檔案,建立一個 S3 儲存貯體,然後將範例檔案上傳至 S3 儲存貯體。Transcribe 僅從 S3 儲存貯體存取音訊和影片檔案以進行轉錄。


a.  按一下這裡,將會下載範例音訊檔案以在本教學的後面進行轉錄。檔案名稱是 transcribe-sample.mp3


b.  按一下這裡,即可在新瀏覽器視窗開啟 AWS 管理主控台,讓此逐步指南保持開啟狀態。當畫面載入時,請輸入您的使用者名稱和密碼以開始使用。使用區域下拉清單,選取提供 Amazon Transcribe 的區域。

在撰寫本文的同時,Amazon Transcribe 已於美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、亞太區域 (雪梨)、加拿大 (中部) 和歐洲 (愛爾蘭) 區域提供。

create-audio-transcript-transcribe-step-1b
create-audio-transcript-transcribe-step-1b

(按一下以放大)


c.然後,在搜尋列輸入 S3,再選取 S3 以開啟主控台。

create-audio-transcript-transcribe-step-1c
create-audio-transcript-transcribe-step-1c

(按一下以放大)


d.  在 S3 儀表板中選擇建立儲存貯體

如果這是您第一次建立儲存貯體,則會看到與此影像類似的畫面。

如果您已經建立了 S3 儲存貯體,則 S3 儀表板會列出所有您建立的儲存貯體。

create-audio-transcript-transcribe-step-1d
create-audio-transcript-transcribe-step-1d

(按一下以放大)


e.  輸入唯一的儲存貯體名稱。儲存貯體名稱不可以和 Amazon S3 現有的儲存貯體名稱重複。S3 儲存貯體名稱還有一些其他的限制。然後,選取要建立儲存貯體的區域。

選取下一步

create-audio-transcript-transcribe-step-1e
create-audio-transcript-transcribe-step-1e

(按一下以放大)


f.  S3 儲存貯體有許多有用的選項,包括版本設定伺服器存取日誌記錄標籤物件登記日誌記錄預設加密。我們不會在此教學啟用這些功能。

選取下一步

create-audio-transcript-transcribe-step-1f
create-audio-transcript-transcribe-step-1f

(按一下以放大)


g.  在此步驟中,您可以在 S3 儲存貯體建立過程中調整 S3 儲存貯體的許可設定。

保留預設值,然後選取下一步

create-audio-transcript-transcribe-step-1g
create-audio-transcript-transcribe-step-1g

(按一下以放大)


h.  檢查組態設定並選取建立儲存貯體

create-audio-transcript-transcribe-step-1h
create-audio-transcript-transcribe-step-1h

(按一下以放大)


i.  您會在 S3 主控台看到新的儲存貯體。按一下儲存貯體名稱以導覽到該儲存貯體。您的儲存貯體名稱將與右側螢幕擷取畫面中顯示的名稱不同。

create-audio-transcript-transcribe-step-1i
create-audio-transcript-transcribe-step-1i

(按一下以放大)


j. 您現在位於儲存貯體首頁。

選取上傳

create-audio-transcript-transcribe-step-1j
create-audio-transcript-transcribe-step-1j

(按一下以放大)


k.  選取新增檔案並選擇檔案,或拖放 transcribe-sample.mp3 至上傳方塊,來上傳 transcribe-sample.mp3 檔案。

選取上傳

create-audio-transcript-transcribe-step-1k
create-audio-transcript-transcribe-step-1k

(按一下以放大)


l.  選中儲存貯體 transcribe-sample.mp3 檔案旁邊的核取方塊。transcribe-sample.mp3 檔案的檔案詳細資訊窗格機會顯示。複製連結至檔案並儲存,以供本教學稍後使用。

create-audio-transcript-transcribe-step-1l
create-audio-transcript-transcribe-step-1l

(按一下以放大)


步驟 2.建立轉錄任務

在此步驟中,您將使用 Amazon Transcribe 主控台建立並執行轉錄任務。


a.  在頂部功能表列中,選取服務,然後開始在搜索列中輸入 Transcribe,並選取 Amazon Transcribe 以開啟服務主控台。

create-audio-transcript-transcribe-step-2a
create-audio-transcript-transcribe-step-2a

(按一下以放大)


b.  在 Amazon Transcribe 主控台主頁面上,開啟導覽窗格,然後按一下 轉錄任務

c.在轉錄任務頁面上,按一下建立任務

create-audio-transcript-transcribe-step-2b
create-audio-transcript-transcribe-step-2b

(按一下以放大)


d.  在建立轉錄任務頁面的名稱欄位中,鍵入 sample-transcription-job。

將預設的語言保留為英文

在 S3 上輸入檔案位欄位中,將連結貼上至 S3 儲存貯體中的範例檔案。範例檔案的連結將與右側螢幕擷取畫面不同。 

保留預設的格式mp3

您可以使用自訂詞彙表功能來協助 Amazon Translate 識別特定於您應用程式的字詞和短語,例如 Etienne 等非英語名稱。在本教學中,您不會使用此功能。

create-audio-transcript-transcribe-step-2c
create-audio-transcript-transcribe-step-2c

(按一下以放大)


e.  將預設的資料位置保留為 Amazon 預設值

若啟用聲道識別,Amazon Transcribe 則可處理在不同聲道記錄每個發言者的音訊,並產生帶有聲道標籤註釋的單一轉錄。

若啟用發言者識別,Amazon Transcribe 能夠判斷發言者是否換人並適當地歸屬轉錄的文字內容。

本教學中都不會使用這兩個選項。

選取建立以開始您的轉錄任務。 

create-audio-transcript-transcribe-step-2d
create-audio-transcript-transcribe-step-2d

(按一下以放大)


步驟 3.檢閱轉錄結果

在此步驟中,您將學習如何檢查進度並檢閱轉錄任務的結果。


a.  按一下建立按鈕之後,將移至轉錄任務螢幕。這會顯示 sample-transcription-job 的狀態。狀態可能是進行中完成失敗

若狀態為完成,按一下名稱欄中的 sample-transcription-job 連結,以檢視轉錄結果。

create-audio-transcript-transcribe-step-3a
create-audio-transcript-transcribe-step-3a

(按一下以放大)


b.   接著,您會看到 sample-transcription-job 詳細資訊。向下捲動至轉錄面板,以檢視轉錄任務輸出。在 JSON 窗格中,您可以檢視轉錄結果,就像從 Transcribe API 或 AWS CLI 傳回的那樣。

create-audio-transcript-transcribe-step-3b
create-audio-transcript-transcribe-step-3b

(按一下以放大)


步驟 4.終止資源

在此步驟中,您將從 S3 儲存貯體中刪除範例檔案,以避免不必要的費用。


a.  在此上方導航功能表中,按一下服務,然後開始在搜索列中輸入 S3,然後選取 S3 以開啟主控台。

create-audio-transcript-transcribe-step-4a
create-audio-transcript-transcribe-step-4a

(按一下以放大)


b.  捲動瀏覽 S3 儲存貯體,尋找在本教學之前建立的儲存貯體。按一下此儲存貯體名稱,以檢視儲存貯體的內容。您的儲存貯體名稱將與右側螢幕擷取畫面所示名稱不同。

create-audio-transcript-transcribe-step-4b
create-audio-transcript-transcribe-step-4b

(按一下以放大)


c.  選取儲存貯體中包含的 transcribe-sample.mp3 檔案,然後從動作功能表中選取刪除。確認刪除。

create-audio-transcript-transcribe-step-4c
create-audio-transcript-transcribe-step-4c

(按一下以放大)


恭喜您!

正如您在本教學中所看到的,Amazon Transcribe 可以實現大規模語音轉換文字。使用 Amazon Transcribe 可以處理各種音訊或影片檔案,例如客戶服務電話、商務會議、廣播電視和隨需影片。

 

學習大規模翻譯文字

在此 10 分鐘教學中,了解如何使用 Amazon Translate 將轉錄的文字翻譯成其他語言。

Transcribe API 和 CLI 入門

文件的此教學中,了解如何使用 Amazon Transcribe API 和 CLI。

探索 Amazon Comprehend

在此 10 分鐘教學中,了解如何使用 Amazon Comprehend 分析文字中的情緒。