Amazon SageMaker 資料標記

建立用於訓練機器學習模型的高品質資料集

Amazon SageMaker 讓您能夠識別原始資料,如影像、文字檔案和影片;新增資訊標籤;並產生標記的綜合資料,為您的機器學習 (ML) 模型建立高品質的訓練資料集。SageMaker 提供兩個選項,即 Amazon SageMaker Ground Truth Plus 和 Amazon SageMaker Ground Truth,讓您可以靈活地使用專家團隊,代表您建立和管理資料標記工作流程,或管理您自己的資料標記工作流程。

Amazon SageMaker Ground Truth Plus

使用 SageMaker Ground Truth Plus,您可以建立高品質訓練資料集,而無需建置標記應用程式或自行管理標記人力。SageMaker Ground Truth Plus 協助將資料標記成本降低最高 40%。SageMaker Ground Truth Plus 提供在機器學習 (ML) 任務上訓練的專家人力,可以協助滿足您的資料安全、隱私權和合規要求。您只需上傳資料,然後 SageMaker Ground Truth Plus 會代表您建立和管理資料標記工作流程和人力。

Amazon SageMaker Ground Truth

如果想要靈活建置和管理自己的資料標記工作流程和人力,您可以使用 SageMaker Ground Truth。SageMaker Ground Truth 是資料標記服務,可以輕鬆標記資料,並為您提供透過 Amazon Mechanical Turk、第三方廠商或您自己的私有人力使用人工標註工具的選項。

您還可以產生標記的綜合資料,而無需手動收集或標記真實資料。SageMaker Ground Truth 可以代表您產生數十萬張自動標記的綜合影像。

運作方式

  • 使用 SageMaker Ground Truth Plus 標記資料
  • 使用 SageMaker Ground Truth 標記資料
  • 產生標記的綜合資料
  • 功能比較
  • 使用 SageMaker Ground Truth Plus 標記資料
  • Amazon SageMaker Ground Truth Plus 協助您建立高品質訓練資料集,而無需建置標記應用程式或管理標記人力。

    Amazon SageMaker Ground Truth Plus 的運作方式
  • 使用 SageMaker Ground Truth 標記資料
  • Amazon SageMaker Ground Truth 協助您建置和管理自己的資料標記工作流程和資料標記人力。

    Amazon SageMaker Ground Truth 的運作方式
  • 產生標記的綜合資料
  • Amazon SageMaker Ground Truth 可協助您產生標記的綜合資料。

    產生標記的綜合資料
  • 功能比較
  • 類別 Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    資料標記工作流程 為文字、影像、影片和 3D 點雲端自訂或 30+ 內建工作流程。您管理資料標記工作流程和資料標記品質 為文字、影像、影片和 3D 點雲端自訂或 30+ 內建工作流程。您管理資料標記工作流程和資料標記品質
    使用者 資料科學家和機器學習 (ML) 工程師 資料科學家、機器學習 (ML) 工程師、資料操作經理和程式經理
    人力 您的選擇:第三方廠商,Amazon Mechanical Turk 或您自己的私有人力 可協助滿足您資料安全、隱私權和合規要求的專家人力 
    機器學習 (ML) 標記技術  主動學習 主動學習,預先標記和機器驗證 
    綜合資料產生 支援 支援

優勢

提升訓練資料集的品質

Amazon SageMaker 資料標記產品和服務提供機器學習 (ML) 標記技術,不易於出現人工錯誤,包括綜合資料產生,並協助提升訓練資料集的品質。Amazon SageMaker Ground Truth Plus 擁有多步驟標記工作流程,包括預先標記的機器學習 (ML) 模型、偵測錯誤和低品質標籤之人工標記的機器驗證,以及輔助標記功能 (例如,3D 長方體貼齊、預測影片中的下一個標記和自動區隔工具)。如果您正在管理自己的資料標記工作流程,則 SageMaker Ground Truth 會提供自動標記功能,例如自動區隔、自動 3D 長方體貼齊以及與 2D 影片影格的感應器融合。此外,SageMaker Ground Truth 還提供自動資料標記,使用主動學習,並僅在模型沒有信心標記資料的情形下將標記的資料路由至人工。

選擇您的資料標記人力

藉助 Amazon SageMaker 資料標記產品,您有兩個選項來標記資料。首先,使用 SageMaker Ground Truth Plus,在機器學習 (ML) 任務上訓練的專家人力會根據您的品質和返回時間要求標記您的資料。其次,使用 SageMaker Ground Truth,您可以建置和管理資料標記工作流程。您擁有使用組織內外標記器的選項。例如,您可以將標記任務傳送給自己的標記器,或您也可以存取超過 500,000 名獨立承包商的人力,他們都已使用 Amazon Mechanical Turk 執行機器學習 (ML) 相關任務。如果您的資料需要保密或特殊技能,則也可使用由 AWS 針對品質和安全規程進行預先篩選的廠商。如果您需要存取綜合資料,以使您的訓練資料集更完整地用於訓練 ML 模型,AWS 數位藝術家可使用客戶提供的資產和影像來產生代表您自動標記的綜合資料。

提升資料標記操作的可見性

Amazon SageMaker 資料標記產品和服務讓您清楚了解資料標記操作和品質管理,以便您可以確認是否滿足了您的品質要求。SageMaker Ground Truth Plus 提供互動式儀表板和使用者介面,因此您可以跨多個專案監控訓練資料集的進度、追蹤專案指標 (每日輸送量)、檢查品質標籤,並為標記的資料提供意見回饋。

快速接收高品質的已標記資料

使用 Amazon SageMaker 資料標記產品和服務,您可以快速接收高品質的已標記資料。使用 SageMaker Ground Truth Plus,您可以上傳 Amazon S3 中的資料,以及您的安全、隱私權和合規要求。AWS 專家之後會設定資料標記工作流程,專家人力會完成您的標記任務。如果您需要存取綜合資料,您可以指定影像要求或提供 3D 資產和基線影像,而 SageMaker Ground Truth 則可為 ML 模型訓練產生高度準確的標記綜合資料。

Amazon SageMaker Ground Truth 定價
有問題?

瀏覽 Amazon SageMaker Data Labeling 常見問答集頁面。

進一步了解 
註冊 AWS 帳戶
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
開始在主控台進行建置
開始在主控台進行建置

利用 AWS 管理主控台中的 Amazon SageMaker Data Labeling 開始建置。

登入