Amazon SageMaker Data Labeling

建立用於訓練機器學習模型的高品質資料集

Amazon SageMaker 提供兩種資料標記產品,即 Amazon SageMaker Ground Truth Plus 和 Amazon SageMaker Ground Truth。這兩個選項都可讓您識別原始資料 (例如影像、文字檔案和影片),並新增資訊類標籤來為您的機器學習模型建立高品質的訓練資料集。

Amazon SageMaker Ground Truth Plus

使用 SageMaker Ground Truth Plus,您可以輕鬆建立高品質訓練資料集,而無需建置標記應用程式或自行管理標記人力。Amazon SageMaker Ground Truth Plus 協助將資料標記成本降低最高 40%。Amazon SageMaker Ground Truth Plus 提供在機器學習 (ML) 任務上訓練的專家人力,可以協助滿足您的資料安全、隱私權和合規要求。您只需上傳資料,Amazon SageMaker Ground Truth Plus 便會建立資料標記工作流程,並代表您管理工作流程。

Amazon SageMaker Ground Truth

如果想要靈活建置和管理資料標記工作流程,並管理自己的資料標記人力,則您可以使用 Amazon SageMaker Ground Truth。SageMaker Ground Truth 是資料標記服務,可以輕鬆標記資料,並為您提供透過 Amazon Mechanical Turk、第三方廠商或您自己的私有人力使用人工標註工具的選項。

運作方式

  • 使用 SageMaker Ground Truth Plus 標記資料
  • 使用 SageMaker Ground Truth 標記資料
  • 功能比較
  • 使用 SageMaker Ground Truth Plus 標記資料
  • Amazon SageMaker Ground Truth Plus 協助您建立高品質訓練資料集,而無需建置標記應用程式或管理標記人力。

    Amazon SageMaker Ground Truth Plus 的運作方式
  • 使用 SageMaker Ground Truth 標記資料
  • Amazon SageMaker Ground Truth 協助您建置和管理自己的資料標記工作流程和資料標記人力。

    Amazon SageMaker Ground Truth 的運作方式
  • 功能比較
  • 類別 Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    資料標記工作流程 為文字、影像、影片和 3D 點雲端自訂或 30+ 內建工作流程。您管理資料標記工作流程和資料標記品質 AWS 專家設定工作流程,並根據您的品質和返回時間要求代表您管理工作流程。
    使用者 資料科學家和機器學習 (ML) 工程師 資料科學家、機器學習 (ML) 工程師、資料操作經理和程式經理
    人力 您的選擇:第三方廠商,Amazon Mechanical Turk 或您自己的私有人力 可協助滿足您資料安全、隱私權和合規要求的專家人力 
    機器學習 (ML) 標記技術  主動學習  主動學習,預先標記和機器驗證 

優勢

提升訓練資料集的品質

Amazon SageMaker 資料標記產品和服務提供機器學習 (ML) 標記技術,不易於出現人工錯誤,並協助提升訓練資料集的品質。Amazon SageMaker Ground Truth Plus 擁有多步驟標記工作流程,包括預先標記的機器學習 (ML) 模型、偵測錯誤和低品質標籤之人工標記的機器驗證,以及輔助標記功能 (例如,3D 長方體貼齊、預測影片中的下一個標記和自動區隔工具)。如果您正在管理自己的資料標記工作流程,則 SageMaker Ground Truth 會提供自動標記功能,例如自動區隔、自動 3D 長方體貼齊以及與 2D 影片影格的感應器融合。  此外,SageMaker Ground Truth 還提供自動資料標記,使用主動學習,並僅在模型沒有信心標記資料的情形下將標記的資料路由至人工。

選擇您的資料標記人力

使用 Amazon SageMaker 資料標記產品和服務,您可以選擇資料標記人力。使用 SageMaker Ground Truth Plus,在機器學習 (ML) 任務上訓練的專家人力會根據您的品質和返回時間要求標記您的資料。使用 SageMaker Ground Truth,您擁有了使用組織內外標記器的選項。您可以輕鬆將標記任務傳送給自己的標記器,或您也可以存取超過 500,000 名獨立承包商的人力,他們都已使用 Amazon Mechanical Turk 執行機器學習 (ML) 相關任務。如果您的資料需要保密或特殊技能,則也可使用由 AWS 針對品質和安全規程進行預先篩選的廠商。

提升資料標記操作的可見性

Amazon SageMaker 資料標記產品和服務讓您清楚了解資料標記操作和品質管理,以便您可以確認是否滿足了您的品質要求。SageMaker Ground Truth Plus 提供互動式儀表板和使用者介面,因此您可以跨多個專案監控訓練資料集的進度、追蹤專案指標 (每日輸送量)、檢查品質標籤,並為標記的資料提供意見回饋。

快速接收高品質的已標記資料

使用 Amazon SageMaker 資料標記產品和服務,您可以快速接收高品質的已標記資料。使用 SageMaker Ground Truth Plus,您只需上傳 Amazon S3 中的資料以及您的安全、隱私權和合規要求。AWS 專家之後會設定資料標記工作流程,專家人力會完成您的標記任務。

開始使用 Amazon SageMaker Ground Truth Plus