Pelabelan Data Amazon SageMaker

Buat set data berkualitas tinggi untuk melatih model machine learning

Amazon SageMaker menyediakan dua penawaran pelabelan data, Amazon SageMaker Ground Truth Plus dan Amazon SageMaker Ground Truth. Kedua opsi ini memungkinkan Anda untuk mengidentifikasi data mentah, seperti gambar, file teks, dan video, dan menambahkan label informatif untuk membuat set data pelatihan berkualitas tinggi untuk model machine learning Anda.

Amazon SageMaker Ground Truth Plus

Dengan SageMaker Ground Truth Plus, Anda dapat membuat set data pelatihan berkualitas tinggi dengan mudah tanpa perlu membangun aplikasi pelabelan atau mengelola tenaga kerja pelabelan Anda sendiri. Amazon SageMaker Ground Truth Plus membantu mengurangi biaya pelabelan data hingga 40%. Amazon SageMaker Ground Truth Plus menyediakan tenaga kerja ahli yang terlatih dalam tugas ML, dan dapat membantu memenuhi persyaratan keamanan data, privasi, dan kepatuhan Anda. Anda cukup mengunggah data Anda, dan Amazon SageMaker Ground Truth Plus kemudian membuat alur kerja pelabelan data dan mengelola alur kerja atas nama Anda.

Amazon SageMaker Ground Truth

Jika Anda menginginkan fleksibilitas untuk membangun dan mengelola alur kerja pelabelan data dan mengelola tenaga kerja pelabelan data Anda sendiri, Anda dapat menggunakan Amazon SageMaker Ground Truth. SageMaker Ground Truth adalah layanan pelabelan data yang memudahkan dalam melabelkan data dan memberikan opsi untuk menggunakan annotator manusia melalui Amazon Mechanical Turk, vendor pihak ketiga, atau tenaga kerja pribadi Anda sendiri.

Cara kerjanya

  • Melabelkan data dengan SageMaker Ground Truth Plus
  • Melabelkan data dengan SageMaker Ground Truth
  • Perbandingan fitur
  • Melabelkan data dengan SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth Plus membantu Anda membuat set data pelatihan berkualitas tinggi tanpa perlu membangun aplikasi pelabelan atau mengelola tenaga kerja pelabelan.

    Cara kerja Amazon SageMaker Ground Truth Plus
  • Melabelkan data dengan SageMaker Ground Truth
  • Amazon SageMaker Ground Truth membantu Anda membangun dan mengelola alur kerja pelabelan data dan tenaga kerja pelabelan data.

    Cara kerja Amazon SageMaker Ground Truth
  • Perbandingan fitur
  • Kategori Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    Alur Kerja Pelabelan Data Alur kerja kustom atau lebih dari 30 alur kerja bawaan dengan teks, gambar, video, dan cloud titik 3D. Anda mengelola alur kerja pelabelan data dan kualitas pelabelan data Pakar AWS menyiapkan alur kerja dan mengelolanya atas nama Anda sesuai dengan kualitas dan persyaratan waktu penyelesaian Anda.
    Pengguna Ilmuwan Data dan Rekayasawan ML Ilmuwan Data, Rekayasawan ML, Manajer Pengoperasian Data, dan Manajer Program
    Tenaga Kerja Pilihan Anda: vendor pihak ketiga, Amazon Mechanical Turk, atau tenaga kerja pribadi Anda. Tenaga kerja ahli yang dapat memenuhi persyaratan keamanan data, privasi, dan kepatuhan Anda 
    Teknik Pelabelan ML  Pembelajaran aktif  Pembelajaran aktif, prapelabelan, dan validasi mesin 

Keuntungan

Meningkatkan kualitas set data pelatihan

Penawaran pelabelan data Amazon SageMaker menyediakan teknik pelabelan ML yang kurang rentan terhadap kesalahan manual dan membantu meningkatkan kualitas set data pelatihan. Amazon SageMaker Ground Truth Plus memiliki alur kerja pelabelan multilangkah yang menyertakan model ML untuk prapelabelan, validasi mesin untuk pelabelan manusia guna mendeteksi kesalahan dan label berkualitas rendah, dan fitur pelabelan bantu (misalnya, pelekatan kubus 3D, prediksi-berikutnya dalam pelabelan video, dan alat segmen otomatis). Jika Anda mengelola alur kerja pelabelan data Anda sendiri, SageMaker Ground Truth menyediakan fitur pelabelan otomatis seperti segmen otomatis, pelekatan kubus 3D otomatis, dan fusi sensor dengan bingkai video 2D.  Selain itu, SageMaker Ground Truth memberikan pelabelan data otomatis yang menggunakan pembelajaran aktif dan hanya merutekan data yang dilabeli untuk manusia jika model tidak memiliki keyakinan untuk melabelkan.

Pilih tenaga kerja pelabelan data

Dengan penawaran pelabelan data Amazon SageMaker, Anda dapat memilih tenaga kerja pelabelan data. Dengan SageMaker Ground Truth Plus, tenaga kerja ahli yang dilatih untuk tugas ML melabelkan data Anda sesuai dengan kualitas dan persyaratan waktu penyelesaian Anda. SageMaker Ground Truth memberikan opsi untuk bekerja dengan pemberi label di dalam dan di luar organisasi Anda. Anda dapat dengan mudah mengirim pekerjaan pelabelan ke pemberi label Anda sendiri, atau Anda dapat mengakses tenaga kerja lebih dari 500.000 kontraktor independen yang sudah melakukan tugas terkait ML melalui Amazon Mechanical Turk. Jika data Anda memerlukan kerahasiaan atau keahlian khusus, Anda juga dapat menggunakan vendor yang telah diseleksi sebelumnya oleh AWS untuk prosedur kualitas dan keamanan.

Meningkatkan visibilitas operasi pelabelan data

Penawaran pelabelan data Amazon SageMaker memungkinkan Anda mendapatkan transparansi dalam operasi pelabelan data dan manajemen kualitas sehingga Anda dapat memverifikasi bahwa persyaratan kualitas Anda terpenuhi. SageMaker Ground Truth Plus menyediakan dasbor interaktif dan antarmuka pengguna, sehingga Anda dapat memantau kemajuan set data pelatihan di beberapa proyek, melacak metrik proyek seperti throughput harian, memeriksa kualitas label, dan memberikan umpan balik pada data berlabel.

Menerima data berlabel berkualitas tinggi dengan cepat

Dengan penawaran pelabelan data Amazon SageMaker, Anda bisa menerima data berlabel berkualitas tinggi dengan cepat. Dengan SageMaker Ground Truth Plus, Anda cukup mengunggah data di Amazon S3 dengan persyaratan keamanan, privasi, dan kepatuhan. Pakar AWS kemudian akan menyiapkan alur kerja pelabelan data dan tenaga kerja ahli akan menyelesaikan tugas pelabelan Anda.

Mulai menggunakan Amazon SageMaker Ground Truth Plus