張貼日期: Feb 17, 2020

Amazon Rekognition 是深度學習型影像和影片分析服務,可識別各種物件、人物、文字、場景,並藉由偵測不安全的內容來支援內容仲裁。即日起,您可以偵測影片中的文字,並獲取偵測可信度、位置邊界框以及每個文字偵測的時間戳記。此外,影像和影片中的文字偵測現在都提供了方便的選項,可以按興趣區域 (ROI)、字詞邊界框大小和文字可信度分數來篩選字詞。 

影片中的文字偵測可用於多種使用案例,尤其是在媒體和娛樂應用程式中。首先,您可以搜尋螢幕上出現特定關鍵字的影片或影片時間戳記,例如「最新新聞」。其次,為了使內容國際化,您可以在節目影片時間軸上快速找到所有文字執行個體,以便可以用另一種語言的文字來取代。第三,對於合規性和適度使用案例,可以透過對照列入黑名單的字詞和片語來檢查字詞,偵測意外文字的存在,例如字幕中損壞的文字,或包含褻瀆和仇恨言論的標誌文字。最後,您可以使用邊界框位置來研究文字大小和位置對行銷活動表現的影響,或正確放置其他圖形元件。 

按文字區域、大小和可信度分數進行篩選可為您提供更大的靈活性來控製文字偵測輸出。透過使用 ROI,您可以輕鬆地將文字偵測限制在與您相關的區域,例如,螢幕圖形的底部第三區域或足球遊戲中讀取記分牌的左上角。字邊界框大小篩選器可用於避免產生嘈雜或無關緊要的小背景文字。最後,文字可信度篩選器讓您可以消除因朦朧或模糊而導致的不可靠結果。 

Amazon Rekognition 支援的所有 AWS 區域現在都提供用於影片和文字篩選的文字偵測。若要開始使用,您可以下載最新的 AWS SDK,並參閱我們的文字,獲取更多詳細資訊。