Amazon SageMaker Ground Truth

輕鬆大規模標記用於機器學習的訓練資料

Amazon SageMaker Ground Truth 是一項全受管資料標記服務,可讓您輕鬆建置用於機器學習的高準確性培訓資料集。透過 SageMaker Ground Truth 主控台,使用自訂或內建資料標記工作流程,在幾分鐘內開始標記您的資料。這些工作流程支援各種使用案例,包含 3D Point Cloud、影片、影像及文字。作為工作流程的一部份,標記器可以存取輔助標記功能,例如:自動 3D 長方體貼合、2D 影像中的失真移除和自動區隔工具,減少標記資料集所需的時間。除此之外,Ground Truth 還提供自動資料標記功能,該功能會使用機器學習模型標記您的資料。

運作方式

Amazon SageMaker Ground Truth 的運作方式

優勢

提升資料標記準確度

SageMaker Ground Truth 透過註解整合和稽核工作流程協助改善標記品質。註解整合是從兩個或多個資料標記器收集標記輸入並將其結合,為您的機器學習模型建立單一資料標籤的過程。透過內建稽核和審查工作流程,工作者可以執行標籤驗證並進行調整以提升準確度。

易於使用

為了減少資料標記任務所需的時間,同時改善其品質,SageMaker Ground Truth 透過直覺式使用者界面提供自動標記功能,例如:「自動區隔」、「自動 3D 長方體貼合」和「使用 2D 影片畫面的感應器融合」。 若要進行語意區隔,工作者必須在影像中標記物件。使用自動區隔功能,相較於本來需要按幾百下,工作者只須按幾下即可擷取物件。

減少最多 70% 的成本

SageMaker Ground Truth 提供自動資料標記功能。使用主動學習模型,資料將被標記,並且僅在模型沒有足夠可信度進行標記時,才會傳送給人員進行人工標記。然後會使用人工標記的資料來訓練機器學習模型,以提升模型的準確度。因此,在進行下一輪標記時傳送給人員的資料將會減少,這將資料標記的成本降低了最多 70%。

選擇您的人力

SageMaker Ground Truth 提供了使用組織內外標記器的選項。使用 SageMaker Ground Truth,您可以輕鬆將標記任務傳送給自己的標記器,或您也可以存取超過 500,000 名獨立承包商,他們都已使用 Amazon Mechanical Turk 執行機器學習相關任務。 若您的資料需要保密或特殊技能,則可使用由 AWS 針對品質和安全規程進行預先篩選的供應商,包括 iVision、CapeStart Inc.、Cogito 和 iMerit。

Amazon SageMaker Ground Truth