Amazon SageMaker

Membuat, melatih, dan menerapkan model machine learning sesuai skala

Amazon SageMaker merupakan platform yang dikelola secara penuh yang memungkinkan pengembang dan ilmuwan data membangun, melatih, dan menerapkan model machine learning dengan cepat dan mudah berapa pun jumlahnya. Amazon SageMaker menghapus semua barier yang umumnya memperlambat pengembang yang ingin menggunakan machine learning.

Machine learning seringkali terasa jauh lebih sulit dari seharusnya bagi kebanyakan pengembang karena proses untuk membuat dan melatih model, dan kemudian menerapkannya ke dalam produksi terlalu rumit dan terlalu lambat. Pertama, perlu mengumpulkan dan menyiapkan data pelatihan Anda untuk menemukan elemen penting dari kumpulan data. Kemudian, Anda perlu memilih algoritme dan kerangka kerja mana yang akan Anda gunakan. Setelah memutuskan pendekatan, Anda perlu mengajarkan model bagaimana membuat prediksi dengan pelatihan, yang membutuhkan banyak komputasi. Kemudian, Anda perlu menyesuaikan model sehingga memberikan prediksi terbaik, yang seringkali merupakan upaya yang menjemukan dan manual. Setelah mengembangkan model yang terlatih sepenuhnya, Anda perlu mengintegrasikan model dengan aplikasi dan menerapkan aplikasi ini pada infrastruktur yang akan diskalakan. Semua ini membutuhkan banyak keahlian khusus, akses ke sejumlah besar komputasi dan penyimpanan, dan banyak waktu untuk bereksperimen dan mengoptimalkan setiap bagian dari proses. Pada akhirnya, tidak mengherankan bahwa semuanya terasa di luar jangkauan bagi sebagian besar pengembang.

Amazon SageMaker menghilangkan kerumitan yang menghambat keberhasilan pengembang dengan setiap langkah ini. Amazon SageMaker meliputi modul yang dapat digunakan bersama atau secara terpisah untuk membuat, melatih, dan menerapkan model machine learning Anda.

Memperkenalkan Amazon SageMaker

Cara Kerjanya

Pembuatan

Amazon SageMaker memudahkan pembuatan model ML dan menyiapkannya untuk pelatihan dengan menyediakan semua yang Anda butuhkan untuk terhubung dengan cepat ke data pelatihan Anda, dan untuk memilih dan mengoptimalkan algoritme dan kerangka kerja terbaik untuk aplikasi Anda. Amazon SageMaker meliputi buku catatan Jupyter yang di-host yang memudahkan untuk mengeksplorasi dan memvisualisasikan data pelatihan Anda yang disimpan di Amazon S3. Anda dapat terhubung langsung ke data di S3, atau menggunakan AWS Glue untuk memindahkan data dari Amazon RDS, Amazon DynamoDB, dan Amazon Redshift ke S3 untuk analisis di buku catatan Anda.

Untuk membantu Anda memilih algoritme, Amazon SageMaker menyertakan algoritme machine learning yang paling umum yang telah terpasang sebelumnya dan dioptimalkan untuk menghasilkan kinerja hingga 10 kali lipat yang Anda akan temukan mampu menjalankan algoritme ini di tempat lain. Amazon SageMaker juga dilengkapi pra-konfigurasi untuk menjalankan TensorFlow, Apache MXNet, dan Chainer dalam kontainer Docker. Anda juga dapat mengunduh kontainer sumber terbuka ini ke lingkungan lokal Anda dan menggunakan SDK Python Amazon SageMaker untuk menguji skrip Anda dalam mode lokal sebelum menggunakan Amazon SageMaker untuk pelatihan atau hosting model Anda dalam produksi. Anda juga memiliki opsi untuk menggunakan kerangka kerja Anda sendiri.

Pelatihan

Anda dapat mulai melatih model Anda dengan satu klik di konsol Amazon SageMaker. Amazon SageMaker mengelola semua infrastruktur yang mendasarinya untuk Anda dan dapat dengan mudah menskalakan untuk melatih model dalam skala petabyte. Untuk membuat proses pelatihan lebih cepat dan mudah, Amazon SageMaker dapat secara otomatis menyesuaikan model Anda untuk mencapai akurasi setinggi mungkin.

Penerapan

Setelah model Anda dilatih dan disesuaikan, Amazon SageMaker memudahkan penerapan dalam produksi sehingga Anda dapat mulai membuat prediksi (proses yang disebut inferensi) untuk data batch atau real-time. Amazon SageMaker menerapkan model Anda pada klaster penskalaan otomatis dari instans ML Amazon SageMaker yang tersebar di beberapa availability zone untuk menghasilkan kinerja dan ketersediaan tinggi. Amazon SageMaker juga menyertakan kemampuan pengujian A/B bawaan untuk membantu Anda menguji model dan bereksperimen dengan berbagai versi untuk mencapai hasil yang terbaik.

Amazon SageMaker menghilangkan beban berat machine learning, sehingga Anda dapat membuat, melatih, dan menerapkan model machine learning dengan cepat dan mudah.

Keuntungan

Lakukan Produksi Menggunakan Machine Learning dengan Cepat

Amazon SageMaker secara signifikan mengurangi jumlah waktu yang dibutuhkan untuk melatih, menyesuaikan, dan menerapkan model machine learning. Amazon SageMaker mengelola dan mengotomatiskan semua teknik pelatihan dan penyesuaian yang canggih sehingga Anda dapat memasukkan model ke dalam produksi dengan cepat.

Pilih Kerangka Kerja atau Algoritme Apa Pun

Amazon SageMaker mendukung semua algoritme dan kerangka kerja mesin sehingga Anda dapat menggunakan teknologi yang sudah Anda kenal. Apache MXNet, TensorFlow, dan Chainer sudah terinstal sebelumnya, dan Amazon SageMaker menawarkan berbagai algoritme machine learning bawaan berkinerja tinggi. Jika ingin melatih dengan kerangka kerja atau algoritme alternatif, Anda dapat membawa milik Anda sendiri dalam kontainer Docker.

Pelatihan dan Penerapan dengan Satu Klik

Amazon SageMaker memungkinkan Anda mulai melatih model Anda dengan satu klik di konsol atau dengan panggilan API sederhana. Saat pelatihan selesai, dan Anda siap untuk menerapkan model Anda, Anda dapat meluncurkannya dengan satu klik di konsol Amazon SageMaker.

Integrasikan dengan Alur Kerja Anda yang Ada dengan Mudah

Amazon SageMaker dirancang dalam tiga modul yang dapat digunakan bersama atau secara terpisah sebagai bagian dari alur kerja ML yang ada yang mungkin sudah Anda miliki.

Akses yang Mudah ke Model Terlatih

Amazon SageMaker memudahkan untuk mengintegrasikan model machine learning ke aplikasi Anda dengan menyediakan titik akhir HTTPS yang dapat dipanggil dari aplikasi apa pun.

Dioptimalkan untuk Kecepatan

Amazon SageMaker telah dikonfigurasi sebelumnya dengan versi terbaru TensorFlow, Apache MXNet, dan Chainer, dengan dukungan perpustakaan CUDA9 untuk kinerja maksimal dengan GPU NVIDIA. Dengan instans Amazon SageMaker P3 yang menjalankan GPU NVIDIA Volta V100, Amazon SageMaker memungkinkan Anda melatih model deep learning dengan kecepatan yang tak tertandingi.

Pelanggan SageMaker

Latih dengan Kerangka Kerja Deep Learning

Dengan Amazon SageMaker, Anda dapat menggunakan kerangka kerja deep learning pilihan Anda untuk pelatihan model. Cukup bawa kontainer Docker Anda sendiri dengan kerangka kerja dan perpustakaan pilihan Anda – seperti Caffe2, PyTorch, Microsoft Cognitive Toolkit (CNTK), Chainer, atau Torch -- dan Amazon SageMaker akan mengelola infrastruktur yang mendasarinya untuk melatih model Anda.

TensorFlow
Caffe2
Apache MXNet
Chainer
Keras
Torch
Gluon
Microsoft Cognitive Toolkit
PyTorch

Kasus Penggunaan

Penargetan Iklan

Menggunakan Amazon SageMaker yang dikombinasikan dengan produk AWS lainnya akan membantu mengoptimalkan keuntungan atas pengeluaran untuk iklan Anda. Amazon SageMaker dapat dengan mudah melatih dan menerapkan model machine learning yang dapat lebih efektif menargetkan iklan online, menyediakan keterlibatan dan konversi pelanggan yang lebih baik. Sistem rekomendasi, prediksi klik-tayang, segmentasi pelanggan, dan model peningkatan nilai masa pakai semuanya dapat dilatih di lingkungan Amazon SageMaker yang tanpa server dan terdistribusi. Setelah dibuat, model dapat di-hosting dengan mudah di titik akhir dengan latensi rendah dan penskalaan otomatis, atau diteruskan ke sistem tawar-menawar secara real-time lainnya.

Prediksi Default Kredit

Amazon SageMaker memudahkan dalam memprediksi kemungkinan default kredit, yaitu masalah umum machine learning. Amazon SageMaker terintegrasi erat dengan kerangka kerja analisis yang ada seperti Amazon Redshift, Amazon EMR, dan AWS Glue, memungkinkan Anda memublikasikan kumpulan data yang besar dan beragam ke dalam data lake Amazon S3, kemudian mentransformasikannya dengan cepat, membuat model machine learning, dan langsung meng-hosting-nya untuk prediksi online.

IoT Industri dan Machine Learning

IoT industri dan machine learning dapat mengaktifkan prediksi secara real-time untuk mengantisipasi kesalahan mesin atau penjadwalan pemeliharaan, untuk mencapai tingkat efisiensi yang lebih tinggi.  Kembaran digital, atau replika, dari aset fisik, proses, atau sistem, dapat dihasilkan sebagai model untuk memprediksi pemeliharaan preventif atau untuk mengoptimalkan output dari mesin yang kompleks atau proses industri. Model ini dapat terus diperbarui untuk 'belajar' secara mendekati real-time untuk setiap perubahan yang mungkin terjadi.

Perkiraan Rantai Pasokan dan Permintaan

Amazon SageMaker menyediakan infrastruktur dan algoritme yang diperlukan untuk mengembangkan perkiraan penjualan individu untuk setiap produk di pengaturan e-commerce terbesar. Dengan deret waktu dan data kategori produk saja, Amazon SageMaker memanfaatkan kemiripan musiman, tren, dan produk untuk menghasilkan perkiraan yang akurat, bahkan untuk item baru.

Prediksi Klik-tayang

Amazon SageMaker menyediakan baik implementasi mesin tunggal maupun CPU terdistribusi dari algoritme XGboost, yang berguna dalam kasus penggunaan banyak klasifikasi, regresi, dan peringkat, seperti prediksi rasio klik-tayang iklan. Sistem prediksi klik sangat penting bagi sebagian besar sistem periklanan online, karena sangat penting untuk memprediksi rasio klik-tayang (RKT) seakurat mungkin untuk memastikan konsumen mendapatkan pengalaman terbaik. Dengan menggunakan algoritme XGBoost, Anda dapat menjalankan prediktor secara real-time dan mengembalikan hasil prediksi yang diperoleh. Anda kemudian dapat menentukan apakah akan menayangkan iklan dari pengiklan tertentu dan meningkatkan prediksi RKT Anda di iklan bergambar atau tidak.

Memprediksi Kualitas Konten

Amazon SageMaker memiliki sejumlah alat untuk pra-pemrosesan dan menemukan struktur dalam teks, menggunakan informasi tersebut untuk memprediksi kualitas konten. Anda dapat menghasilkan pelekatan kata (word embedding) untuk menemukan kata-kata semantik dan sintaksis serupa dalam volume teks yang besar, dan mengelompokkan kata-kata serupa secara bersama untuk menghindari kejarangan. Kemudian, secara terpisah mengelompokkan dokumen serupa dengan model topik lanjutan Amazon SageMaker. Terakhir, membuat model klasifikasi independen berdasarkan klaster pada data kata terkelompok dimensi yang dikurangi untuk menentukan apakah dokumen perlu dimoderasi atau tidak.

Pelajari selengkapnya tentang Amazon SageMaker

Kunjungi halaman fitur