Amazon SageMaker Ground Truth Plus

專家人力

使用 Amazon SageMaker Ground Truth Plus,由在機器學習 (ML) 任務上訓練的專家人力完成標記,可以協助滿足您的資料安全、隱私權和合規要求。例如,如果您需要標記音訊檔案熟練的人工,則可以在您提供給 SageMaker Ground Truth Plus 的指引中指定此要求,服務會自動選取具有這些技能的標記人員。

端對端資料標記管理

使用 Amazon SageMaker Ground Truth Plus,您可以輕鬆建立高品質訓練資料集,而無需建置標記應用程式或自行管理標記人力。您可以將資料與 Amazon S3 中的標記要求一起上傳。上傳資料後,SageMaker Ground Truth Plus 會負責設定資料標記工作流程並代表您操作工作流程。

機器學習 (ML) 標記技術

Amazon SageMaker Ground Truth Plus 使用機器學習 (ML) 技術,包括主動學習、預先標記和機器驗證,提升了輸出資料集的品質並降低了資料標記成本。多步驟標記工作流程包括主動學習的機器學習 (ML) 模型,允許 Ground Truth Plus 選取要標記的物件 (可以是影像、音訊記錄、一段文字等) 和機器學習 (ML) 模型來預先標記可減少人力投入的所需資料,從而降低成本。Ground Truth Plus 使用機器驗證來識別潛在錯誤,而這些錯誤會傳送用於另一輪的人工審查。透過捕捉人工錯誤,很大程度改進了標籤品質。此外,為了減少資料標記任務所需的時間,同時改善其品質,Ground Truth Plus 還會透過直覺式使用者介面使用輔助標記功能,例如:「自動 3D 長方體貼齊」、「預測影片中的下一個標記」和「自動區隔」。

互動式儀表板

SageMaker Ground Truth Plus 提供互動式儀表板和使用者介面,因此您可以跨多個專案監控訓練資料集的進度、追蹤專案指標 (每日輸送量)、檢查品質標籤,並為標記的資料提供意見回饋。

Amazon SageMaker Ground Truth

3D 點雲

一般最常使用光學雷達 (LIDAR) 裝置擷取三維 (3D) 點雲,以產生單一時間點的實體空間 3D 理解。SageMaker Ground Truth 支援 3D 點雲資料的內建標記工作流程,包括物件偵測、物件追蹤和語義分割。

物件偵測

透過物件偵測工作流程,您可以識別和標記 3D 點雲端內的相關物件。例如,在自駕車使用案例中,您可以準確地標記車輛、車道和行人。

Amazon SageMaker Ground Truth 物件偵測

物件追蹤

透過物件追蹤工作流程,您可以追蹤相關物件的軌跡。例如,自動駕駛汽車需要追蹤其他車輛、車道和行人的動作。Ground Truth 讓您透過一系列的 3D 點雲資料追蹤這些物件的軌跡。

Amazon SageMaker Ground Truth 物件追蹤

語義分割

透過語義分割工作流程,您可以將 3D 點雲的多個點劃分為不同的預先指定類別。以自動駕駛汽車為例,Ground Truth 可以針對街道、樹葉和建築物進行分類。

Amazon SageMaker Ground Truth 語義分割

影片

SageMaker Ground Truth 透過內建工作流程支援常見的影片標記使用案例,包括影片物件偵測、影片物件追蹤和影片剪輯分類。

影片物件偵測

透過影片物件偵測工作流程,您可以識別一系列影片畫面內的相關物件。 例如,在為自動駕駛汽車建置感知系統時,您可以在場景偵測車輛周圍的其他車輛。

Amazon SageMaker Ground Truth 影片物件偵測

影片物件追蹤

透過影片物件追蹤工作流程,您可以追蹤一系列影片畫面中的相關物件。例如,在體育遊戲使用案例中,您可以在整個遊戲過程中準確地標記玩家。

Amazon SageMaker Ground Truth 影片物件追蹤

影片剪輯分類

透過影片剪輯分類工作流程,您可以將影片檔案分類為預先指定的類別。例如,您可以選取最準確描述影片的預先指定類別,例如體育轉播或繁忙路口的交通擁堵。

Amazon SageMaker Ground Truth 影片剪輯分類

影像

SageMaker Ground Truth 為您的影像資料提供內建標記工作流程,包括影像分類、物件偵測和語義分割。

影像分類

影像分類是根據真實世界呈現的樣貌識別影像的程序。此程序根據一組預先定義的標籤對影像進行分類。影像分類很適合用於需要考量完整影像脈絡的場景偵測模型。例如,我們可以針對自駕車建置影像分類模型,以偵測各種真實世界的物件,例如其他車輛、行人、交通號誌和標誌。

Amazon SageMaker Ground Truth 影像分類

物件偵測

您可以使用物件偵測工作流程識別和標記影像中的相關物件 (例如車輛、行人、狗、貓)。標記任務包含在影像中的相關物件周圍繪製二維 (2D) 週框方塊。透過標記的週框方塊從影像訓練而來的電腦視覺模型會學習該方塊內對應到指定物件的像素。

Amazon SageMaker Ground Truth 物件偵測

語義分割

您可以使用語義分割工作流程標記出影像完全符合的部分,即對應到模型需要學習的標籤。因為標記了個別像素,所以能夠提供非常精準的訓練資料。例如,透過語義分割可以準確地擷取影像中不規則的車輛形狀。

Amazon SageMaker Ground Truth 語義分割

文字

SageMaker Ground Truth 為您的文字資料提供內建標記工作流程,包含文字分類和命名實體辨識。

文字分類

文字分類根據一組預先定義的標籤對文字字串進行分類。將文字分類成不同的標籤通常用於自然語言處理 (NLP) 模型,以識別主題 (如產品描述、電影評論) 或情緒等項目。

Amazon SageMaker Ground Truth 文字分類

命名實體辨識

命名實體 (NER) 包含仔細檢查文字資料以找出稱為命名實體的片語,以及使用標籤 (例如「人員」、「組織」或「品牌」) 對每個片語進行分類。 因此,在「我最近訂閱了 Amazon Prime」的陳述式中,“Amazon Prime” 就是命名實體,可以歸類為「品牌」。

Amazon SageMaker Ground Truth 命名實體辨識

自訂工作流程

您可以在 Ground Truth 建立自己的標記工作流程。自訂工作流程包含三個元件:(1) UI 範本,該範本為標籤人員提供完成標記任務所需的所有指示和工具,(2) 封裝在 AWS Lambda 函數中的任何預處理邏輯,以及 (3) 封裝在 AWS Lambda 函數中的任何後處理邏輯。您可以選擇多種 UI 範本,也可以上傳自己的 Javascript/HTML 範本。預處理 Lambda 函數可供要標記的資料使用以及為標籤人員新增任何其他內容,而後處理 Lambda 函數可用於插入準確性改善演算法。該演算法可評估人工註釋的品質,也可以在相同資料提供給多個標籤人員時找出對「正確」的共識。您可以使用 SageMaker Ground Truth 主控台上傳這三個元件。

在 Ground Truth 建立您的自訂工作流程

人力

SageMaker Ground Truth 支援多種人力標記資料的選項,(1) 您自己的員工,(2) 透過 AWS Marketplace 提供的第三方資料標記服務供應商,以及 (3) 透過 Amazon Mechanical Turk 進行群眾外包人力。

Mechanical Turk
Mechanical Turk
私有
私有
廠商
廠商

綜合資料產生

Amazon SageMaker Ground Truth 支援綜合資料產生。SageMaker Ground Truth 可以產生數十萬張已標記的綜合影像,有助於提高標記準確性,且無需手動標記資料。首先,您可指定綜合影像要求或提供 3D 資產和基準影像,例如電腦輔助設計 (CAD) 影像。接著,AWS 數位藝術家建立可模仿物件的姿勢和位置的影像,並包括物件或場景變化。此外,AWS 數位藝術家可選擇性地新增特定的內容,來建立通常未包含在訓練資料集中的影像。
綜合資料產生影像
Amazon SageMaker Ground Truth 定價
進一步了解 Amazon SageMaker Data Labeling 定價

開始使用 Amazon SageMaker Data Labeling,沒有前期承諾,也不用簽訂長期合約。

進一步了解 
註冊 AWS 帳戶
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
開始在主控台進行建置
開始在主控台進行建置

利用 AWS 管理主控台中的 Amazon SageMaker Data Labeling 開始建置。

登入