Apa itu Machine Learning?

Q: Apa itu Machine Learning?

Machine learning adalah tipe kecerdasan buatan yang melakukan tugas analisis data tanpa instruksi eksplisit. Teknologi machine learning dapat memproses data historis dalam jumlah yang besar, mengidentifikasi pola, dan memprediksi hubungan baru antara data yang sebelumnya tidak diketahui. Anda dapat melakukan tugas klasifikasi dan prediksi pada dokumen, gambar, angka, dan tipe data lainnya. Misalnya, organisasi keuangan dapat melatih sistem machine learning untuk mengklasifikasikan transaksi palsu dan asli. Sistem tersebut mengidentifikasi pola dalam data yang diketahui untuk menebak atau memprediksi secara akurat apakah transaksi baru itu asli atau tidak.

Q: Apa itu machine learning dalam penjelasan sederhana?

ML adalah kependekan dari Machine Learning yang merupakan cabang dari kecerdasan buatan (AI) dan ilmu komputer yang memanfaatkan data dan algoritma untuk memungkinkan sistem AI belajar dan berkembang dengan cara yang mirip dengan manusia, yang secara progresif meningkatkan keakuratannya dari waktu ke waktu.

Q: Apa perbedaan antara machine learning dan kecerdasan buatan?

Meskipun istilah machine learning dan kecerdasan buatan (AI) dapat digunakan secara bergantian, keduanya tidaklah sama. Machine learning adalah salah satu dari banyak cabang AI. Walaupun machine learning adalah AI, tidak semua aktivitas AI dapat disebut dengan machine learning . Kecerdasan buatan adalah istilah payung untuk berbagai strategi dan teknik, yang digunakan untuk membuat mesin menjadi lebih mirip manusia. AI mencakup semua hal mulai dari asisten cerdas seperti Alexa, chatbot , generator gambar, hingga penyedot debu robotik dan mobil otonom. Sebaliknya, model machine learning melakukan tugas analisis data yang lebih spesifik—seperti mengklasifikasikan dokumen, melabeli gambar, atau memprediksi jadwal pemeliharaan peralatan pabrik. Teknologi machine learning utamanya didasarkan pada matematika dan statistik, sementara jenis AI lainnya lebih kompleks. Pelajari selengkapnya tentang machine learning dan kecerdasan buatan

Q: Apa perbedaan antara machine learning dan deep learning?

Deep learning adalah bentuk khusus machine learning yang menggunakan jaringan neural buatan untuk meniru otak manusia. Deep learning adalah teknik canggih untuk menangani tugas-tugas kompleks, seperti pengenalan gambar dan ucapan. Deep learning menjadi dasar bagi kemajuan dalam kecerdasan buatan generatif .

Q: Apakah model machine learning bersifat deterministik?

Jika sebuah output sistem dapat diprediksi, maka output sistem ini dapat dikatakan deterministik. Sebagian besar aplikasi perangkat lunak merespons tindakan pengguna dengan cara yang dapat diprediksi, sehingga Anda dapat berkata: “Jika pengguna melakukan ini, maka dia akan mendapatkan itu.” Namun, algoritme machine learning belajar melalui pengamatan beserta dengan pengalaman. Oleh karena itu, algoritme ini bersifat probabilistik. Pernyataan sekarang berubah menjadi: “Jika pengguna melakukan ini, ada kemungkinan X% hal itu terjadi.” Dalam machine learning , determinisme adalah strategi yang digunakan saat menerapkan metode pembelajaran yang dijelaskan di atas. Salah satu metode pelatihan yang diawasi, tidak diawasi, dan metode pelatihan lainnya dapat dibuat deterministik tergantung pada hasil yang diinginkan bisnis. Rumusan masalah, pengambilan data, struktur, dan keputusan penyimpanan akan menentukan apakah strategi deterministik atau non-deterministik diadopsi. Pendekatan deterministik vs. probabilistik Pendekatan deterministik berfokus pada akurasi dan jumlah data yang dikumpulkan, sehingga efisiensi lebih diprioritaskan daripada ketidakpastian. Di sisi lain, proses non-deterministik (atau probabilistik) didesain untuk mengelola faktor peluang. Alat bawaan diintegrasikan ke dalam algoritma machine learning untuk membantu menghitung, mengidentifikasi, dan mengukur ketidakpastian selama pembelajaran serta observasi.

Q: Apa itu pelatihan machine learning untuk pemula?

Machine learning membutuhkan dasar yang kuat dalam matematika, statistik, pengodean, dan teknologi data. Mereka yang ingin mahir dalam machine learning harus mempertimbangkan untuk menyelesaikan gelar master dalam bidang kecerdasan buatan atau ilmu data. Program ini biasanya melibatkan topik-topik, seperti jaringan neural, pemrosesan bahasa alami, dan penglihatan komputer secara mendalam. Namun, pendidikan formal bukanlah satu-satunya jalan. Anda dapat mengikuti kursus online untuk belajar sesuai dengan ritme Anda sendiri dan menguasai keterampilan tertentu. Pelatihan machine learning di AWS mencakup sertifikasi oleh ahli AWS mengenai topik-topik seperti: Machine learning sangat penting bagi pengambil keputusan teknis dan bisnis Pengantar Amazon SageMaker Machine learning - Paket pembelajaran untuk developer

Q: Bagaimana machine learning AWS dapat membantu?

AWS menempatkan machine learning di tangan setiap developer, ilmuwan data, dan pengguna bisnis. Layanan AWS Machine Learning menyediakan infrastruktur beperforma tinggi, hemat biaya, dan dapat diskalakan untuk memenuhi kebutuhan bisnis. Baru memulai? Pelajari machine learning dengan perangkat pembelajaran interaktif kami seperti AWS DeepRacer dan AWS DeepComposer . Sudah memiliki arsip data? Gunakan Amazon SageMaker Ground Truth untuk alur kerja pelabelan data bawaan yang mendukung video, gambar, dan teks. Sudah memiliki sistem Machine Learning ? Gunakan Amazon SageMaker Clarify untuk mendeteksi bias dan Amazon SageMaker Model Training untuk memantau serta mengoptimalkan performa. Ingin menerapkan deep learning ? Gunakan Pelatihan Model Amazon SageMaker untuk melatih model deep learning yang besar secara otomatis. Mulai machine learning di AWS dengan membuat akun gratis sekarang juga!

Machine learning adalah tipe kecerdasan buatan yang melakukan tugas analisis data tanpa instruksi eksplisit. Teknologi machine learning dapat memproses data historis dalam jumlah yang besar, mengidentifikasi pola, dan memprediksi hubungan baru antara data yang sebelumnya tidak diketahui. Anda dapat melakukan tugas klasifikasi dan prediksi pada dokumen, gambar, angka, dan tipe data lainnya.

Misalnya, organisasi keuangan dapat melatih sistem machine learning untuk mengklasifikasikan transaksi palsu dan asli. Sistem tersebut mengidentifikasi pola dalam data yang diketahui untuk menebak atau memprediksi secara akurat apakah transaksi baru itu asli atau tidak.

Apa itu machine learning dalam penjelasan sederhana?

ML adalah kependekan dari Machine Learning yang merupakan cabang dari kecerdasan buatan (AI) dan ilmu komputer yang memanfaatkan data dan algoritma untuk memungkinkan sistem AI belajar dan berkembang dengan cara yang mirip dengan manusia, yang secara progresif meningkatkan keakuratannya dari waktu ke waktu.

Apa perbedaan antara machine learning dan kecerdasan buatan?

Meskipun istilah machine learning dan kecerdasan buatan (AI) dapat digunakan secara bergantian, keduanya tidaklah sama. Machine learning adalah salah satu dari banyak cabang AI. Walaupun machine learning adalah AI, tidak semua aktivitas AI dapat disebut dengan machine learning.

Kecerdasan buatan adalah istilah payung untuk berbagai strategi dan teknik, yang digunakan untuk membuat mesin menjadi lebih mirip manusia. AI mencakup semua hal mulai dari asisten cerdas seperti Alexa, chatbot, generator gambar, hingga penyedot debu robotik dan mobil otonom.

Sebaliknya, model machine learning melakukan tugas analisis data yang lebih spesifik—seperti mengklasifikasikan dokumen, melabeli gambar, atau memprediksi jadwal pemeliharaan peralatan pabrik. Teknologi machine learning utamanya didasarkan pada matematika dan statistik, sementara jenis AI lainnya lebih kompleks.

Pelajari selengkapnya tentang machine learning dan kecerdasan buatan

Apa perbedaan antara machine learning dan deep learning?

Deep learning adalah bentuk khusus machine learning yang menggunakan jaringan neural buatan untuk meniru otak manusia. Deep learning adalah teknik canggih untuk menangani tugas-tugas kompleks, seperti pengenalan gambar dan ucapan. Deep learning menjadi dasar bagi kemajuan dalam kecerdasan buatan generatif.

Bagaimana cara kerja machine learning?

Gagasan utama di balik machine learning adalah hubungan matematis yang ada antara semua kombinasi data input dan output. Model machine learning tidak mengetahui hubungan ini sebelumnya, tetapi dapat menebak jika diberi contoh yang cukup dari set data input dan output. Hal ini berarti setiap algoritma machine learning dibangun di seputar fungsi matematika yang dapat dimodifikasi. Prinsip yang mendasarinya dapat dipahami seperti ini:

Kami “melatih” algoritme tersebut dengan memberinya kombinasi input/output (i,o) berikut – (2,10), (5,19), dan (9,31)
Algoritme tersebut mengomputasi hubungan antara input dan output menjadi: o=3*i+4
Selanjutnya, kami memberinya input 7 dan memintanya untuk memprediksi output. Algoritma tersebut dapat secara otomatis menentukan output-nya menjadi 25.

Meskipun ini adalah pemahaman dasar, machine learning berfokus pada prinsip bahwa sistem komputer dapat menghubungkan semua titik data kompleks secara matematis selama sistem komputer tersebut memiliki data dan daya komputasi yang cukup untuk memprosesnya. Oleh karena itu, keakuratan output tersebut secara langsung berkorelasi dengan besarnya input yang diberikan. Berikut adalah fase machine learning.

Prapemrosesan data

Data mentah dibersihkan dan ditransformasikan untuk melatih model machine learning. Fase ini melibatkan tugas-tugas seperti menangani nilai yang hilang, menormalkan data ke skala umum, atau mengodekan data teks ke dalam format numerik. Data juga dapat ditambah atau dimanipulasi untuk meningkatkan penanganan model dari kasus penggunaan yang diberikan. Prapemrosesan memastikan data yang dimasukkan ke dalam model relevan dan terstruktur dengan tepat.

Melatih model

Data yang telah diproses sebelumnya digunakan untuk melatih algoritma machine learning. Algoritma mencoba untuk secara iteratif mengidentifikasi korelasi matematis antara input dan output yang diharapkan dari data pelatihan. Model mempelajari pola dan hubungan dalam data, lalu merangkum pengetahuan ini dalam parameternya. Model menyesuaikan parameter untuk meminimalkan perbedaan antara prediksi dan hasil aktual yang diketahui dalam data pelatihan.

Mengevaluasi model

Tujuannya adalah untuk memastikan model dapat melakukan generalisasi di luar set data pelatihan. Set data terpisah yang disebut set validasi digunakan untuk tujuan ini. Output model diukur menggunakan metrik dan tolok ukur yang berbeda. Misalnya, pertimbangkan model yang dilatih untuk mengidentifikasi gambar buah-buahan seperti apel dan pisang yang disimpan di keranjang. Evaluasi memeriksa apakah model dapat mengidentifikasi buah yang sama dengan benar dari gambar yang menunjukkan buah yang diletakkan di atas meja atau di tangan seseorang.

Optimisasi

Optimisasi melibatkan penyempurnaan model untuk meningkatkan performanya. Tergantung pada tipe model, ilmuwan data dapat mengonfigurasi ulang proses pembelajaran atau melakukan rekayasa fitur, yang menciptakan fitur input baru dari data yang ada. Tujuannya adalah untuk meningkatkan akurasi, efisiensi, dan kemampuan model untuk melakukan generalisasi dengan baik ke data baru.

Apa manfaat machine learning?

Data adalah faktor pendorong utama dalam pengambilan keputusan bisnis. Organisasi modern menghasilkan data dari ribuan sumber, termasuk sensor pintar, portal pelanggan, media sosial, dan log aplikasi. Machine learning mengotomatiskan dan mengoptimalkan proses pengumpulan, klasifikasi, dan analisis data. Bisnis dapat mendorong pertumbuhan, membuka aliran pendapatan baru, dan memecahkan masalah yang menantang lebih cepat.

Manfaat machine learning meliputi:

Pengambilan keputusan yang lebih ditingkatkan

Sistem machine learning dapat memproses dan menganalisis volume data besar dengan cepat dan akurat. Sistem machine learning dapat mengidentifikasi pola yang tidak terduga dalam data dinamis dan kompleks secara waktu nyata. Organisasi dapat membuat keputusan berbasis data saat runtime dan merespons dengan lebih efektif terhadap perubahan kondisi. Mereka dapat mengoptimalkan operasi dan mengurangi risiko dengan percaya diri.

Otomatisasi tugas rutin

Algoritma machine learning dapat memfilter, mengurutkan, dan mengklasifikasikan data tanpa campur tangan manusia. Algoritma machine learning dapat meringkas laporan, memindai dokumen, menyalin audio, dan menandai konten—tugas-tugas yang melelahkan dan memakan waktu bagi manusia. Mengotomatiskan tugas rutin dan berulang membuat produktivitas meningkat dan biaya berkurang secara substantial. Anda juga mendapatkan peningkatan akurasi dan efisiensi.

Peningkatan pengalaman pelanggan

Machine learning mengubah pengalaman pelanggan melalui personalisasi. Misalnya, pengecer merekomendasikan produk kepada pelanggan berdasarkan pembelian sebelumnya, riwayat penelusuran, dan pola pencarian. Layanan streaming menyesuaikan rekomendasi tampilan di industri hiburan. Pendekatan yang dipersonalisasi meningkatkan retensi pelanggan dan loyalitas merek.

Manajemen sumber daya proaktif

Organisasi menggunakan machine learning untuk memprakirakan tren dan perilaku dengan presisi tinggi. Misalnya, analitik prediktif dapat mengantisipasi kebutuhan inventaris dan mengoptimalkan tingkat stok untuk mengurangi biaya tambahan. Wawasan prediktif sangat penting untuk perencanaan dan alokasi sumber daya sehingga organisasi lebih proaktif, bukan reaktif.

Peningkatan berkelanjutan

Keunggulan yang menonjol dari machine learning adalah kemampuannya yang makin meningkat seiring banyaknya data yang diproses. Sistem machine learning beradaptasi dan belajar dari data baru. Sistem machine learning menyesuaikan dan meningkatkan performanya agar tetap efektif dan relevan dari waktu ke waktu.

Apa saja kasus penggunaan machine learning?

Mari perhatikan aplikasi machine learning di beberapa industri kunci:

Manufaktur

Machine learning dapat mendukung pemeliharaan prediktif, kontrol kualitas, dan riset inovatif dalam sektor manufaktur. Machine learning juga membantu perusahaan meningkatkan solusi logistik, termasuk aset, rantai pasokan, dan manajemen inventaris. Misalnya, raksasa manufaktur 3M menggunakan machine learning untuk berinovasi pada amplas. Algoritma machine learning memungkinkan para peneliti 3M untuk menganalisis bagaimana perubahan kecil dalam bentuk, ukuran, dan arah penempatan butiran dapat meningkatkan sifat abrasif serta daya tahan. Saran-saran tersebut menginformasikan proses manufaktur.

Layanan kesehatan dan ilmu hayati

Perkembangan sensor dan perangkat sandangan telah menghasilkan data kesehatan yang signifikan. Program machine learning menganalisis informasi ini dan mendukung para dokter dalam diagnosis serta perawatan secara waktu nyata. Para peneliti machine learning sedang mengembangkan solusi yang mendeteksi tumor kanker dan mendiagnosis penyakit mata, yang memengaruhi hasil kondisi kesehatan manusia secara signifikan. Misalnya, Solusi Kesehatan Cambia menggunakan machine learning untuk mengotomatiskan dan menyesuaikan perawatan untuk wanita hamil.

Layanan keuangan

Proyek machine learning keuangan meningkatkan analitik dan regulasi risiko. Teknologi machine learning memungkinkan para investor untuk mengidentifikasi peluang baru dengan cara menganalisis pergerakan pasar saham, mengevaluasi pengelola investasi global, atau melakukan kalibrasi portofolio keuangan. Selain itu, teknologi machine learning dapat membantu mengidentifikasi klien pinjaman berisiko tinggi dan memitigasi tanda-tanda penipuan. Misalnya, NerdWallet, perusahaan pembiayaan pribadi, yang menggunakan machine learning untuk membandingkan produk keuangan, seperti kartu kredit, perbankan, dan pinjaman.

Ritel

Ritel dapat menggunakan machine learning untuk meningkatkan layanan pelanggan, manajemen stok, strategi upselling, dan pemasaran lintas saluran. Misalnya, Amazon Fulfillment (AFT) memotong biaya infrastruktur hingga 40 persen menggunakan model machine learning untuk mengidentifikasi inventaris yang salah tempat. Hal ini membantu mereka, sesuai janji Amazon, untuk memastikan bahwa item akan tersedia bagi para pelanggan dan tiba tepat waktu, kendati mereka perlu memproses jutaan pengiriman global setiap tahun.

Media dan hiburan

Perusahaan hiburan beralih ke machine learning untuk lebih memahami audiens target mereka dan memberikan konten yang imersif, terpersonalisasi, dan sesuai permintaan. Algoritma machine learning di-deploy untuk mendesain trailer serta iklan lainnya, memberikan rekomendasi konten yang dipersonalisasi kepada konsumen, dan bahkan menyederhanakan produksi.

Misalnya, Disney menggunakan machine learning untuk mengarsipkan pustaka medianya. Alat machine learning secara otomatis menandai, mendeskripsikan, dan menyortir konten media sehingga memungkinkan penulis dan animator Disney untuk mencari dan membiasakan diri dengan karakter Disney secara cepat.

Penglihatan komputer

Penglihatan komputer adalah teknologi yang secara otomatis mengenali dan menjelaskan gambar secara akurat dan efisien. Saat ini, sistem komputer dapat mengakses banyak gambar dan video dari ponsel pintar, kamera lalu lintas, sistem keamanan, dan perangkat lainnya. Aplikasi penglihatan komputer menggunakan machine learning guna memproses data ini secara akurat untuk identifikasi objek dan pengenalan wajah, serta klasifikasi, rekomendasi, pemantauan, dan deteksi.

Misalnya, CampSite adalah platform perangkat lunak terkemuka untuk kamp musim panas. Kamp mereka mengunggah ribuan gambar setiap hari agar para orang tua dapat melihat aktivitas anak mereka selama di kamp. Dulu, bagi para orang tua, mencari foto anak mereka saat perkemahan sering kali memakan banyak waktu dan terasa melelahkan. CampSite menggunakan machine learning untuk secara otomatis mengidentifikasi gambar dan memberi tahu orang tua ketika foto baru anak mereka diunggah.

Apa saja tipe algoritma machine learning?

Algoritma machine learning dapat dikelompokkan dalam empat gaya pembelajaran yang berbeda tergantung pada output yang diperkirakan dan tipe input.

Machine learning yang diawasi

Ilmuwan data memasok algoritme dengan data pelatihan yang diberi label dan ditentukan untuk menilai korelasi. Sampel data menentukan baik input maupun output algoritma. Pelabelan data mengategorikan data input dengan nilai output yang ditentukan dengan sesuai. Misalnya, jutaan gambar apel dan pisang perlu ditandai dengan kata “apel” atau “pisang.” Kemudian, aplikasi machine learning dapat menggunakan data pelatihan ini untuk menebak nama buah ketika diberi gambar buah.

Kelebihan pembelajaran yang diawasi adalah kesederhananaan dan kemudahan desainnya. Sistem pembelajaran ini sangat berguna saat memprediksi kemungkinan set hasil yang terbatas, membagi data ke dalam kategori, atau mengombinasikan hasil dari dua algoritme machine learning lainnya. Namun, melabeli jutaan set data tidak berlabel adalah hal yang menantang.

Machine learning tanpa pengawasan

Algoritma pembelajaran tanpa pengawasan melatih data tidak berlabel. Algoritma ini memindai data baru, yang membangun hubungan penting antara input dan output yang telah ditentukan. Algoritma ini dapat menemukan pola dan mengategorikan data. Misalnya, algoritme yang tidak diawasi dapat mengelompokkan artikel berita dari situs berita yang berbeda ke dalam kategori umum seperti olahraga, kriminal, dll. Algoritma ini dapat menggunakan pemrosesan bahasa alami untuk memahami makna dan emosi dalam artikel tersebut. Dalam sektor ritel, pembelajaran tanpa pengawasan dapat mendeteksi pola pembelian pelanggan dan memberikan hasil analisis data. Misalnya, pelanggan kemungkinan besar akan membeli roti jika mereka juga membeli mentega.

Pembelajaran tanpa pengawasan berguna untuk mengenali pola, mendeteksi anomali, dan mengelompokkan data secara otomatis ke dalam beberapa kategori. Karena data pelatihan tidak memerlukan pelabelan, penyiapannya menjadi mudah. Algoritma ini juga dapat digunakan untuk membersihkan dan memproses data untuk pemodelan otomatis. Keterbatasan metode ini adalah tidak dapat memberikan prediksi yang benar-benar akurat dan tidak mampu secara mandiri mengidentifikasi hasil data tertentu.

Pembelajaran semidiawasi

Seperti namanya, metode ini menggabungkan pembelajaran yang diawasi dan yang tidak diawasi. Teknik ini mengandalkan penggunaan data berlabel dalam jumlah kecil dan data tidak berlabel dalam jumlah besar untuk melatih sistem. Pertama, data berlabel digunakan untuk melatih algoritma machine-learning secara parsial. Setelah itu, algoritma yang dilatih secara parsial melabeli data yang tidak berlabel. Proses ini disebut pelabelan semu. Model tersebut kemudian dilatih ulang pada kombinasi data yang dihasilkan tanpa harus diprogram secara eksplisit.

Keunggulan metode ini adalah tidak memerlukan data berlabel dalam jumlah besar. Metode ini berguna saat bekerja menggunakan data seperti dokumen panjang yang terlalu memakan waktu jika harus dibaca dan dilabeli secara manual oleh manusia.

Pembelajaran penguatan

Pembelajaran penguatan adalah metode yang menggunakan nilai hadiah pada setiap langkah yang harus dijalani algoritma. Jadi, tujuan model ini adalah untuk mengakumulasi poin hadiah sebanyak mungkin dan pada akhirnya mencapai tujuan akhir. Dalam sepuluh tahun terakhir, sebagian besar penerapan praktis pembelajaran penguatan ditemukan pada video game. Algoritma pembelajaran penguatan yang canggih telah mencapai hasil yang mengesankan dalam game klasik dan modern, yang sering kali secara signifikan mengalahkan lawan manusia mereka.

Tantangan terkait pembelajaran penguatan adalah bahwa lingkungan dunia nyata sering kali berubah secara signifikan dan dengan sedikit peringatan. Hal tersebut dapat membuat algoritma lebih sulit diterapkan secara efektif. Bias developer juga dapat memengaruhi hasil. Saat ilmuwan data merancang sistem hadiah, mereka dapat memengaruhi hasilnya.

Deep learning

Deep learning adalah jenis teknik machine learning yang dimodelkan berdasarkan cara kerja otak manusia. Algoritma deep learning menganalisis data dengan struktur logika yang mirip dengan yang digunakan oleh manusia. Algoritma ini menggunakan jaringan neural buatan untuk memproses informasi berlapis-lapis. Jaringan neural buatan (ANN) terbuat dari simpul perangkat lunak yang disebut neuron buatan yang memproses data secara kolektif. Data mengalir dari lapisan input neuron melalui beberapa lapisan jaringan neural tersembunyi yang “dalam” sebelum muncul ke lapisan output. Lapisan tersembunyi tambahan mendukung pembelajaran yang jauh lebih canggih dibandingkan model machine learning standar.

Pelajari selengkapnya tentang jaringan neural

Pelajari selengkapnya tentang machine learning vs. deep learning

Apakah model machine learning bersifat deterministik?

Jika sebuah output sistem dapat diprediksi, maka output sistem ini dapat dikatakan deterministik. Sebagian besar aplikasi perangkat lunak merespons tindakan pengguna dengan cara yang dapat diprediksi, sehingga Anda dapat berkata: “Jika pengguna melakukan ini, maka dia akan mendapatkan itu.” Namun, algoritme machine learning belajar melalui pengamatan beserta dengan pengalaman. Oleh karena itu, algoritme ini bersifat probabilistik. Pernyataan sekarang berubah menjadi: “Jika pengguna melakukan ini, ada kemungkinan X% hal itu terjadi.”

Dalam machine learning, determinisme adalah strategi yang digunakan saat menerapkan metode pembelajaran yang dijelaskan di atas. Salah satu metode pelatihan yang diawasi, tidak diawasi, dan metode pelatihan lainnya dapat dibuat deterministik tergantung pada hasil yang diinginkan bisnis. Rumusan masalah, pengambilan data, struktur, dan keputusan penyimpanan akan menentukan apakah strategi deterministik atau non-deterministik diadopsi.

Pendekatan deterministik vs. probabilistik

Pendekatan deterministik berfokus pada akurasi dan jumlah data yang dikumpulkan, sehingga efisiensi lebih diprioritaskan daripada ketidakpastian. Di sisi lain, proses non-deterministik (atau probabilistik) didesain untuk mengelola faktor peluang. Alat bawaan diintegrasikan ke dalam algoritma machine learning untuk membantu menghitung, mengidentifikasi, dan mengukur ketidakpastian selama pembelajaran serta observasi.

Bagaimana cara menerapkan machine learning di organisasi Anda?

Memulai machine learning membutuhkan penerapan siklus hidup machine learning. Siklus hidup ini meliputi fase berikut.

Tujuan bisnis

Sebuah organisasi yang mempertimbangkan machine learning harus terlebih dahulu mengidentifikasi masalah yang ingin dipecahkan. Identifikasi nilai bisnis yang Anda peroleh menggunakan machine learning dalam pemecahan masalah. Dapatkah Anda mengukur nilai bisnis menggunakan kriteria keberhasilan tertentu untuk tujuan bisnis? Pendekatan yang berorientasi pada tujuan membantu Anda mempertanggungjawabkan pengeluaran dan meyakinkan pemangku kepentingan utama.

Perumusan masalah

Selanjutnya, merumuskan masalah bisnis sebagai masalah machine learning. Identifikasi apa yang diamati dan apa yang harus diprediksi. Langkah utama dalam fase ini adalah menentukan apa yang harus diprediksi serta cara mengoptimalkan performa terkait dan metrik kesalahan.

Pemrosesan data

Pemrosesan data mengubah data menjadi format yang dapat digunakan menggunakan algoritma machine learning. Proses ini termasuk mengidentifikasi, mengumpulkan, dan memproses data bersama dengan rekayasa fitur. Anda membuat, mentransformasi, mengekstraksi, dan memilih variabel machine learning dari data Anda.

Pengembangan dan deployment model

Ini adalah proses inti pelatihan, penyetelan, dan evaluasi model Anda, seperti yang dijelaskan di bagian sebelumnya. Ini termasuk membangun MLOps. Operasi machine learning (MLOps) adalah serangkaian praktik yang mengotomatiskan serta menyederhanakan alur kerja dan deployment machine learning (ML). Praktik ini menyatukan pengembangan ML dengan deployment dan operasi. Misalnya, Anda membuat pipeline CI/CD yang mengotomatiskan pembuatan, pelatihan, dan perilisan ke lingkungan staging dan produksi.

Pemantauan

Sistem pemantauan model memastikan model Anda mempertahankan tingkat performa yang diinginkan melalui deteksi dini dan mitigasi. Hal ini termasuk mengumpulkan umpan balik pengguna untuk mempertahankan dan meningkatkan model sehingga tetap relevan dari waktu ke waktu.

Apa tantangan dalam implementasi machine learning?

Berikut adalah tantangan dalam implementasi machine learning.

Kualitas data

Performa model machine learning tergantung pada kualitas data yang digunakan untuk pelatihan. Masalah seperti nilai yang hilang, entri data yang tidak konsisten, dan derau dapat secara signifikan menurunkan akurasi model. Selain itu, kurangnya set data yang cukup besar dapat mencegah model belajar secara efektif. Memastikan integritas data dan meningkatkan pengumpulan data tanpa mengorbankan kualitas adalah tantangan berkelanjutan.

Overfitting dan underfitting

Overfitting adalah kondisi ketika model machine learning terlalu menyesuaikan diri dengan detail dan derau pada data pelatihan sehingga menurunkan performa model pada data baru. Model menangkap pola yang tidak digeneralisasi ke set data lain. Di sisi lain, underfitting terjadi ketika model tidak dapat mempelajari pola yang mendasari data, yang mengakibatkan performa yang buruk pada data pelatihan dan pengujian. Menyeimbangkan kompleksitas model dan kemampuannya untuk melakukan generalisasi adalah tantangan kritis.

Bias

Dalam banyak kasus nyata, data bisa tidak seimbang, yaitu ketika sebagian kelas jauh lebih sering muncul daripada yang lain. Ketidakseimbangan ini dapat membuat proses pelatihan menjadi bias sehingga menyebabkan model beperforma baik pada kelas mayoritas, tetapi gagal memprediksi kelas minoritas secara akurat. Misalnya, jika data historis memprioritaskan demografi tertentu, algoritma machine learning yang digunakan dalam aplikasi sumber daya manusia dapat terus memprioritaskan demografi tersebut. Teknik seperti pengambilan sampel ulang data, yang menggunakan metrik evaluasi yang berbeda, atau menerapkan algoritma deteksi anomali mengurangi masalah sampai batas tertentu.

Keterjelasan model

Seiring model machine learning, terutama model deep learning, menjadi lebih kompleks, keputusan mereka menjadi kurang dapat ditafsirkan. Mengembangkan metode untuk membuat model lebih dapat ditafsirkan tanpa mengorbankan performa merupakan tantangan penting. Hal ini memengaruhi kegunaan, kepercayaan, dan pertimbangan etis penerapan sistem machine learning.

Skalabilitas

Model machine learning, terutama yang melibatkan set data besar atau algoritma kompleks seperti deep learning, memerlukan sumber daya komputasi yang signifikan. Melatih model-model ini bisa memakan waktu lama dan biaya yang mahal. Mengoptimalkan algoritma untuk mengurangi tuntutan komputasi melibatkan tantangan dalam desain algoritma. Layanan berbasis cloud AWS dapat mendukung implementasi hemat biaya dalam skala besar.

Apa itu pelatihan machine learning untuk pemula?

Machine learning membutuhkan dasar yang kuat dalam matematika, statistik, pengodean, dan teknologi data. Mereka yang ingin mahir dalam machine learning harus mempertimbangkan untuk menyelesaikan gelar master dalam bidang kecerdasan buatan atau ilmu data. Program ini biasanya melibatkan topik-topik, seperti jaringan neural, pemrosesan bahasa alami, dan penglihatan komputer secara mendalam.

Namun, pendidikan formal bukanlah satu-satunya jalan. Anda dapat mengikuti kursus online untuk belajar sesuai dengan ritme Anda sendiri dan menguasai keterampilan tertentu. Pelatihan machine learning di AWS mencakup sertifikasi oleh ahli AWS mengenai topik-topik seperti:

Bagaimana machine learning AWS dapat membantu?

AWS menempatkan machine learning di tangan setiap developer, ilmuwan data, dan pengguna bisnis. Layanan AWS Machine Learning menyediakan infrastruktur beperforma tinggi, hemat biaya, dan dapat diskalakan untuk memenuhi kebutuhan bisnis.

Baru memulai? Pelajari machine learning dengan perangkat pembelajaran interaktif kami seperti AWS DeepRacer dan AWS DeepComposer.
Sudah memiliki arsip data? Gunakan Amazon SageMaker Ground Truth untuk alur kerja pelabelan data bawaan yang mendukung video, gambar, dan teks.
Sudah memiliki sistem Machine Learning? Gunakan Amazon SageMaker Clarify untuk mendeteksi bias dan Amazon SageMaker Model Training untuk memantau serta mengoptimalkan performa.
Ingin menerapkan deep learning? Gunakan Pelatihan Model Amazon SageMaker untuk melatih model deep learning yang besar secara otomatis.

Mulai machine learning di AWS dengan membuat akun gratis sekarang juga!

Apa itu Machine Learning?

Apa itu Machine Learning?

Apa itu machine learning dalam penjelasan sederhana?

Apa perbedaan antara machine learning dan kecerdasan buatan?

Apa perbedaan antara machine learning dan deep learning?

Bagaimana cara kerja machine learning?

Prapemrosesan data

Melatih model

Mengevaluasi model

Optimisasi

Apa manfaat machine learning?

Pengambilan keputusan yang lebih ditingkatkan

Otomatisasi tugas rutin

Peningkatan pengalaman pelanggan

Manajemen sumber daya proaktif

Peningkatan berkelanjutan

Apa saja kasus penggunaan machine learning?

Manufaktur

Layanan kesehatan dan ilmu hayati

Layanan keuangan

Ritel

Media dan hiburan

Penglihatan komputer

Apa saja tipe algoritma machine learning?

Machine learning yang diawasi

Machine learning tanpa pengawasan

Pembelajaran semidiawasi

Pembelajaran penguatan

Deep learning

Apakah model machine learning bersifat deterministik?

Pendekatan deterministik vs. probabilistik

Bagaimana cara menerapkan machine learning di organisasi Anda?

Tujuan bisnis

Perumusan masalah

Pemrosesan data

Pengembangan dan deployment model

Pemantauan

Apa tantangan dalam implementasi machine learning?

Kualitas data

Overfitting dan underfitting

Bias

Keterjelasan model

Skalabilitas

Apa itu pelatihan machine learning untuk pemula?

Bagaimana machine learning AWS dapat membantu?

Langkah berikutnya di AWS

Lihat sumber daya tambahan terkait dengan produk

Daftar untuk akun gratis

Mulai membangun di konsol

Pelajari

Sumber Daya

Developer

Bantuan