什麼是機器翻譯?

機器翻譯是使用人工智慧自動將文字從一種語言翻譯成另一種語言的過程,而無需人力參與。現代機器翻譯已不再是簡單的逐字翻譯,而是用目標語言傳達原始語言文字的全部含義。它會分析所有文字元素並識別字詞間的相互影響方式。

機器翻譯具有哪些優勢?

譯者可使用機器翻譯服務來更快、更高效地進行翻譯。以下是機器翻譯的一些優勢:

自動化翻譯協助

機器翻譯為專業譯者提供了一個不錯的起點。許多翻譯管理系統會在其工作流程中整合一個或多個機器翻譯模型。他們會設定自動執行翻譯,然後將其傳送給譯者以進行譯後編輯。

速度和數量

機器翻譯的速度非常快,幾乎可以瞬間翻譯數百萬個單字。它可以翻譯大量的資料,例如即時聊天或大型法律案件。它還可以處理外文文件,搜尋相關術語,並記住這些術語以供將來套用。

大量語言選擇

許多主要的機器翻譯供應商可提供 50-100 多種語言的支援。另外,還可同時進行多種語言的翻譯,而這對於全球產品推廣和文件更新非常有用。

經濟高效的翻譯

機器翻譯可提高工作效率和更快地交付翻譯的能力,從而縮短產品上市時間。由於機器翻譯提供了基本但有價值的翻譯,因此減少了人力參與的過程,進而降低了交付成本並縮短了交付時間。例如,在大型專案中,您可以將機器翻譯與您的內容管理系統進行整合,以便自動標記和組織內容,然後再將內容翻譯成不同語言。

第 1 集:Amazon Translate 和神經機器翻譯簡介

機器翻譯有哪些使用案例?

機器翻譯有幾個使用案例,如下所示:

內部通訊

對於在全球不同國家/地區營運的公司而言,可能很難對溝通進行管理。語言技能因員工而異,有些人可能不太了解公司的官方語言。機器翻譯有助於降低或消除溝通中的語言障礙。個人可以快速獲得文字的翻譯並理解內容的核心訊息。您可以使用它來翻譯簡報、公司佈告欄和其他常見的通訊。

外部通訊

公司使用機器翻譯來更有效地與外部利害關係人和客戶溝通。例如,您可以將重要文件翻譯成不同的語言,以方便全球合作夥伴和客戶使用。如果一家線上商店在許多不同的國家/地區營運,則機器翻譯可以翻譯產品評論,以便客戶可以用他們自己的語言進行閱讀。

資料分析

某些類型的機器翻譯可以在短時間內處理數百萬使用者產生的評論,並提供高度準確的結果。公司每天要翻譯社交媒體和網站上發佈的大量內容,並進行分析。例如,他們可以自動分析用各種語言編寫的客戶意見。

線上客戶服務

藉助機器翻譯,品牌可以與世界各地的客戶互動,而無論他們所說語言為何。例如,他們可以使用機器翻譯來:

  • 準確翻譯來自世界各地客戶的請求
  • 增加即時聊天的規模並自動化客戶服務電子郵件
  • 改善客戶體驗而又無需僱傭更多員工

法律部門使用機器翻譯來準備不同國家/地區的法律文件。許多內容在不同語言中可能難以進行處理,而藉助機器翻譯,則可以分析這些內容。

機器翻譯的發展歷程?

使用電腦自動翻譯人類語言的想法最早出現在 1950 年代初期。然而,在當時,翻譯的複雜性遠高於電腦科學家的早期估計。它需要巨大的資料處理能力和儲存能力,而這是早期的電腦功能無法達到的。

在 2000 年代初期,電腦軟體、資料和硬體能夠進行基本的機器翻譯。早期的開發人員使用語言統計資料庫來訓練電腦翻譯文字。這就需要大量的人力和時間才能完成。每種新增的語言都要求他們重新開始該語言的開發。從那時起,機器翻譯在速度和準確性方面有所發展,並出現了幾種不同的機器翻譯策略。

機器翻譯有哪些不同的方法?

在機器翻譯中,原始文字或語言稱為源語言,而您要將其翻譯成的語言稱為目標語言。機器翻譯基本需要兩個步驟:

  1. 解碼原始文字的源語言含義
  2. 將含義編碼為目標語言

我們提供了一些關於語言翻譯技術如何實現這種機器翻譯過程的常用方法。

以規則為基礎的機器翻譯

語言專家為特定產業或主題開發內建語言規則和雙語詞典。以規則為基礎的機器翻譯會使用這些詞典來準確翻譯特定內容。該過程的步驟包括:

  1. 機器翻譯軟體剖析輸入文字並建立轉換表示
  2. 它使用語法規則和詞典作為參考,將陳述轉換為目標語言

優點與缺點

以規則為基礎的機器翻譯可以針對特定產業或主題進行自訂。它具有可預測性,並且可提供優質翻譯。但是,如果原文有錯誤或使用內建詞典中不存在的單字,則會得到品質不佳的翻譯結果。對其進行改進的唯一方法是定期手動更新詞典。

統計機器翻譯

統計機器翻譯不依賴語言規則,而是使用機器學習來翻譯文字。機器學習演算法可分析大量已經存在的人工翻譯並尋找統計模式。然後,當被要求翻譯新的原文時,該軟體會做出智慧猜測。它會根據特定單詞或短語與目標語言中的另一個單詞或短語的統計可能性進行預測。

以語法為基礎的機器翻譯

以語法為基礎的機器翻譯是統計機器翻譯的一個子類別。它使用語法規則來翻譯語法單元。它會對句子進行分析,以將語法規則合併到統計翻譯模型中。

優點與缺點

統計方法需要為每個語言對訓練數百萬個單字。然而,在充足的資料支援下,機器翻譯才能準確。

神經機器翻譯

神經機器翻譯使用人工智慧來學習語言,並使用稱為神經網路的特定機器學習方法不斷改進知識。它通常與統計翻譯方法結合使用。

神經網路

神經網路是受人腦啟發的一組互連節點。它是一個資訊系統,輸入資料會通過幾個互連節點,進而產生輸出。神經機器翻譯軟體使用神經網路來處理龐大的資料集。每個節點會將原文屬性變更為目標文字,直到輸出節點給出最終結果為止。

神經機器翻譯與其他翻譯方法

在產生輸出句子時,神經網路會在每一步驟都考慮整個輸入句子;其他機器翻譯模型則是將輸入句子分解成單字和片語的集合,然後將其對應到目標語言中的單字或句子。神經機器翻譯系統可以解決其他方法的許多限制,並且通常會產生更好的翻譯品質。

混合機器翻譯

混合機器翻譯工具可在一個軟體上使用兩個或多個機器翻譯模型。您可以使用混合方法來提高單個翻譯模型的有效性。此機器翻譯過程通常使用基於規則和統計的機器翻譯子系統。最終的翻譯輸出是所有子系統輸出的組合。

優點與缺點

混合機器翻譯模型解決了與單一翻譯方法相關的問題,進而成功地提高了翻譯品質。

什麼是電腦輔助翻譯工具?

電腦輔助翻譯 (CAT) 工具可與機器翻譯軟體搭配使用,以支援文字翻譯。CAT 工具可自動執行與翻譯相關的任務,例如編輯、管理和儲存翻譯。將文字輸入到 CAT 軟體中,並將其分割成區段,例如片語、句子或段落。該軟體將每個片段及其翻譯保存在資料庫中,從而加快了翻譯過程並保證與以前翻譯的一致性。
 
許多全球公司使用 CAT 軟體工具來自動化需要翻譯的專案。

自動化翻譯

自動化翻譯是指 CAT 工具中內建的任何自動化功能,以用於執行重複的翻譯相關任務。自動化翻譯會與內嵌的觸發器協同處理文字,其中這些觸發器會告知系統使用自動化。例如,您可以使用它來將常用文字插入資料庫的文件中。

最準確的機器翻譯技術是什麼?

神經機器翻譯被普遍認為是最準確、通用和流暢的機器翻譯方法。自其於 2010 年代中期誕生以來,神經機器翻譯已成為最先進的機器翻譯技術。無論是從流暢性還是普遍性來看,它都比統計機器翻譯更準確。現在,其已被視為機器翻譯開發的標準。

機器翻譯器的效能取決於幾個因素,包括:

  • 機器翻譯引擎或技術
  • 語言對
  • 可用的訓練資料
  • 用於翻譯的文字類型。隨著軟體針對特定語言或領域執行更多翻譯,它將產生更高品質的輸出。經過訓練,神經機器翻譯將會更準確、更快,且更容易新增語言

機器翻譯可以代替人工翻譯嗎?

機器翻譯可以在一些有意義且需求量極大的情況下取代人工翻譯。例如,許多與服務相關的公司會透過即時聊天功能或在快速回覆電子郵件時使用機器翻譯來幫助客戶。但是,如果您要翻譯更深入的內容,例如網頁或行動應用程式,則翻譯可能並不準確。所以,請務必在使用前讓譯者對內容進行編輯。

最準確的機器翻譯技術是什麼?

Amazon Translate 是一項神經機器翻譯服務,可提供快速、高品質、價格合理且可自訂的語言翻譯。您可以為不同的使用者當地語系化網站和應用程式等內容,輕鬆翻譯大量文字以進行分析,並有效地支援使用者間的跨語言交流。藉助 Amazon Translate,您可以:

  • 透過簡單的 API 呼叫輕鬆整合到您的應用程式中
  • 使用自訂術語來自訂您的機器翻譯輸出,進而定義如何翻譯品牌名稱、模型名稱和其他獨特術語
  • 透過快速可靠的翻譯來進行擴展,以滿足您的翻譯需求

要開始使用 Amazon Translate,請立即建立 AWS 帳戶

AWS 機器翻譯後續步驟

Standard Product Icons (Features) Squid Ink
查看額外的產品相關資源
進一步了解 Amazon Translate 
Sign up for a free account
檢視 AWS 免費方案

使用 AWS 免費方案,立即獲得免費服務。

檢視 AWS 免費方案 
Standard Product Icons (Start Building) Squid Ink
開始在主控台進行建置

開始在 AWS 管理主控台使用 SageMaker 進行建置。

註冊