Layanan Machine Learning – Harga Amazon SageMaker

Amazon SageMaker membantu ilmuwan data dan developer menyiapkan, membangun, melatih, serta melakukan deployment model machine learning (ML) berkualitas tinggi secara cepat dengan menggabungkan set kemampuan luas yang dibangun dengan tujuan khusus untuk ML. SageMaker mendukung kerangka kerja, kit alat, dan bahasa pemrograman ML yang terkemuka.

Dengan SageMaker, Anda hanya membayar apa yang Anda gunakan. Anda memiliki dua pilihan pembayaran, yaitu: pertama, Harga Sesuai Permintaan tanpa biaya minimum serta komitmen di muka dan kedua, SageMaker Savings Plans yang menawarkan model harga berbasis penggunaan yang fleksibel sebagai ganti dari komitmen untuk jumlah penggunaan yang konsisten.

Amazon SageMaker Tingkat Gratis

Amazon SageMaker dapat dicoba secara gratis. Sebagai bagian dari AWS Tingkat Gratis, Anda dapat memulai Amazon SageMaker secara gratis. Tingkat gratis Anda dimulai dari bulan pertama saat Anda membuat sumber daya SageMaker pertama Anda. Detail dari tingkat gratis untuk Amazon SageMaker ada di tabel berikut ini.

Kapabilitas Amazon SageMaker	Penggunaan Tingkat Gratis per bulan untuk 2 bulan pertama
Notebook studio, dan instans notebook	250 jam instans ml.t3.medium pada notebook Studio ATAU 250 jam instans ml.t2 atau instans ml.t3.medium pada instans notebook
RStudio di SageMaker	250 jam instans ml.t3.medium di aplikasi RSession DAN gratis instans ml.t3.medium untuk aplikasi RStudioServerPro
Data Wrangler	25 jam instans ml.m5.4xlarge
Tempat Penyimpanan Fitur	10 juta unit tulis, 10 juta unit baca, 25 GB penyimpanan (penyimpanan online standar)
Pelatihan	50 jam instans m4.xlarge atau m5.xlarge
Amazon SageMaker dengan TensorBoard	300 jam instans ml.r5.large
Inferensi Waktu Nyata	125 jam instans m4.xlarge atau m5.xlarge
Inferensi Nirserver	150.000 detik durasi inferensi sesuai permintaan
Canvas	160 jam/bulan untuk waktu sesi
HyperPod	50 jam instans m5.xlarge
	Penggunaan Tingkat Gratis per bulan selama 6 bulan pertama
Experiments	100.000 catatan metrik diserap per bulan, 1 juta catatan metrik diambil per bulan, dan 100.000 catatan metrik disimpan per bulan

Kalkulator Harga AWS

Hitung biaya Amazon SageMaker dan arsitektur Anda dalam satu perkiraan.

Buat perkiraan kustom Anda sekarang »

Harga Sesuai Permintaan

Studio Classic
Amazon SageMaker Studio Classic
Studio Classic menawarkan notebook Jupyter satu langkah dalam pengalaman IDE warisan kami. Sumber daya komputasi dasarnya sepenuhnya elastis dan notebook dapat dengan mudah dibagikan dengan orang lain sehingga memungkinkan adanya kolaborasi tanpa hambatan. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
JupyterLab
Amazon SageMaker JupyterLab
Luncurkan JupyterLab terkelola penuh dalam hitungan detik. Gunakan lingkungan pengembangan interaktif berbasis web terbaru untuk notebook, kode, dan data. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
Code Editor
Amazon SageMaker Code Editor
Code Editor, berdasarkan Code-OSS (Kode Studio Visual – Sumber Terbuka), memungkinkan Anda untuk menulis, menguji, melakukan debug, serta menjalankan analitik dan kode ML Anda. Code Editor sepenuhnya terintegrasi dengan SageMaker Studio dan mendukung ekstensi IDE yang tersedia di registri ekstensi Open VSX.
RStudio
RStudio
RStudio menawarkan sumber daya komputasi cloud sesuai permintaan untuk mempercepat pengembangan model dan meningkatkan produktivitas. Anda dikenai biaya untuk tipe instans yang Anda pilih untuk menjalankan aplikasi RStudio Session dan aplikasi RStudio Server Pro.

Aplikasi RStudioServerPro
Instans Notebook
Instans Notebook
Instans notebook adalah instans komputasi yang menjalankan aplikasi notebook Jupyter. Anda dikenakan biaya untuk jenis instans yang Anda pilih, berdasarkan durasi penggunaan.
Pemrosesan
Amazon SageMaker Processing
Amazon SageMaker Processing memungkinkan Anda menjalankan beban kerja prapemrosesan, pascapemrosesan, dan evaluasi model dengan mudah pada infrastruktur terkelola penuh. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
TensorBoard
Amazon SageMaker dengan TensorBoard
Amazon SageMaker dengan TensorBoard memberikan pengalaman TensorBoard yang di-hosting untuk memvisualisasikan dan men-debug masalah konvergensi model untuk pekerjaan pelatihan Amazon SageMaker.
Data Wrangler
Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler mengurangi waktu pengumpulan dan penyiapan data untuk machine learning dari minggu ke menit. Cukup bayar atas waktu yang digunakan untuk membersihkan, menjelajahi, dan memvisualisasikan data. Harga di bawah ini berlaku bagi pelanggan yang menjalankan instans SageMaker Data Wrangler.* Harga SageMaker Canvas berlaku bagi Pelanggan yang menjalankan SageMaker Data Wrangler di instans ruang kerja SageMaker Canvas. Lihat halaman harga SageMaker Canvas untuk detail selengkapnya.

Tugas Amazon SageMaker Data Wrangler

Tugas Amazon SageMaker Data Wrangler dibuat saat aliran data diekspor dari SageMaker Data Wrangler. Dengan tugas SageMaker Data Wrangler, Anda dapat mengotomatiskan alur kerja persiapan data Anda. Tugas SageMaker Data Wrangler membantu Anda menerapkan kembali alur kerja persiapan data pada set data baru untuk membantu menghemat waktu, dengan biaya per detik.
Tempat Penyimpanan Fitur
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store adalah repositori pusat untuk menyerap, menyimpan, dan melayani fitur-fitur machine learning. Anda dikenai biaya atas penulisan, pembacaan, dan penyimpanan data grup di SageMaker Feature Store, dengan harga yang berbeda untuk penyimpanan online standar dan penyimpanan online dalam memori.

Untuk penyimpanan online standar, penyimpanan data dikenakan biaya per GB per bulan. Untuk throughput, Anda dapat memilih antara mode kapasitas sesuai permintaan atau disediakan. Untuk sesuai permintaan, penulisan dikenakan biaya sebagai unit permintaan tulis per KB dan pembacaan dikenakan biaya sebagai unit permintaan baca per 4 KB. Untuk mode kapasitas yang disediakan, Anda menentukan kapasitas baca dan tulis yang menurut Anda diperlukan oleh aplikasi. Sagemaker Feature Store mengenakan biaya satu WCU untuk setiap penulisan per detik (hingga 1 KB) dan satu RCU untuk setiap pembacaan per detik (hingga 4 KB). Anda akan dikenai biaya untuk kapasitas throughput (baca dan tulis) yang Anda sediakan untuk grup fitur, meskipun Anda tidak sepenuhnya memanfaatkan kapasitas yang disediakan.

Untuk penyimpanan online dalam memori, penulisan dikenakan biaya sebagai unit permintaan tulis per KB dengan minimum 1 unit per penulisan, pembacaan dikenakan biaya sebagai unit permintaan baca per KB dengan minimum 1 unit per pembacaan, dan penyimpanan data dikenakan biaya per GB per jam. Ada biaya penyimpanan data minimum sebesar 5 GiB (5,37 GB) per jam untuk penyimpanan online dalam memori.
Pelatihan
Pelatihan Amazon SageMaker
Amazon SageMaker memudahkan pelatihan model machine learning (ML) dengan menyediakan semua yang Anda butuhkan untuk melatih, menyetel, dan men-debug model. Anda akan ditagih atas penggunaan jenis instans yang Anda pilih. Saat Anda menggunakan Amazon SageMaker Debugger untuk men-debug masalah dan memantau sumber daya selama pelatihan, Anda dapat menggunakan aturan bawaan untuk men-debug tugas pelatihan Anda atau menulis aturan kustom Anda sendiri. Penggunaan aturan bawaan untuk men-debug tugas pelatihan Anda tidak dikenakan biaya. Untuk aturan kustom, Anda akan dikenakan biaya atas tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
Experiments

Amazon SageMaker Experiments
Amazon SageMaker Experiments memungkinkan Anda mengelola, melacak, dan membandingkan eksperimen ML Anda. Anda dikenai biaya untuk penyerapan, pengambilan, dan penyimpanan catatan metrik. Data metrik adalah pasangan kunci/nilai dari data metrik. Penyerapan dan pengambilan dikenai biaya berdasarkan jumlah catatan metrik. Penyimpanan dikenakan biaya berdasarkan jumlah catatan metrik yang disimpan per bulan. Anda dapat menggunakan SageMaker Studio untuk memvisualisasikan eksperimen Anda tanpa biaya tambahan.

Jenis Penagihan	Harga
Penyerapan	1,25 USD per juta catatan metrik
Pengambilan	0,25 USD per juta catatan metrik
Penyimpanan	0,25 USD per juta catatan metrik - bulan

Inferensi Waktu Nyata
Hosting Amazon SageMaker: Inferensi Waktu Nyata
Amazon SageMaker memberikan inferensi waktu nyata untuk kasus penggunaan Anda yang memerlukan prediksi waktu nyata. Anda akan ditagih atas penggunaan jenis instans yang Anda pilih. Bila Anda menggunakan Amazon SageMaker Model Monitor untuk mempertahankan model akurasi tinggi yang menyediakan inferensi waktu nyata, Anda dapat menggunakan aturan bawaan untuk memantau model Anda atau menulis aturan kustom Anda sendiri. Untuk aturan internal, Anda mendapatkan hingga 30 jam pemantauan tanpa biaya. Biaya tambahan akan dihitung sesuai durasi penggunaan. Ada biaya terpisah bila menggunakan aturan kustom Anda sendiri.
Inferensi Asinkron
Inferensi Asinkron Amazon SageMaker:
Inferensi Asinkron Amazon SageMaker merupakan opsi inferensi mendekati waktu nyata yang mengantrekan permintaan masuk dan memprosesnya secara asinkron. Gunakan opsi ini saat Anda perlu memproses muatan besar ketika data datang atau menjalankan model yang memiliki waktu pemrosesan inferensi yang lama dan tidak memiliki persyaratan latensi sub-detik. Anda dikenakan biaya untuk jenis instans yang Anda pilih.
Batch Transform
Batch Transform Amazon SageMaker
Dengan Batch Transform Amazon SageMaker, Anda tidak perlu merinci set data menjadi beberapa bagian atau mengelola titik akhir waktu nyata. Batch Transform SageMaker memungkinkan Anda menjalankan prediksi pada set data batch besar atau kecil. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
Inferensi Nirserver
Amazon SageMaker Serverless Inference
Inferensi Nirserver Amazon SageMaker memungkinkan Anda melakukan deployment model machine learning untuk inferensi tanpa mengonfigurasi atau mengelola infrastruktur apa pun yang mendasarinya. Anda dapat menggunakan Inferensi Nirserver sesuai permintaan atau menambahkan Konkurensi yang Disediakan ke titik akhir Anda untuk performa yang dapat diprediksi.

Dengan Inferensi Nirserver sesuai permintaan, Anda hanya membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Biaya komputasi bergantung pada konfigurasi memori yang Anda pilih.

Konkurensi yang Disediakan

Secara opsional, Anda juga dapat mengaktifkan Konkurensi yang Disediakan untuk titik akhir nirserver. Konkurensi yang Disediakan memungkinkan Anda melakukan deployment model pada titik akhir nirserver dengan performa yang dapat diprediksi, dan skalabilitas tinggi dengan menjaga titik akhir Anda tetap hangat untuk sejumlah permintaan bersamaan dan waktu tertentu. Seperti pada Inferensi Nirserver sesuai permintaan, saat Konkurensi yang Disediakan diaktifkan, Anda membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Anda juga membayar penggunaan Konkurensi yang Disediakan, berdasarkan memori yang dikonfigurasi, durasi yang disediakan, dan jumlah konkurensi yang diaktifkan.
JumpStart
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart membantu Anda memulai dengan cepat dan mudah dengan machine learning menggunakan akses satu klik ke koleksi model populer (dikenal juga dengan “model zoo”). Jumpstart juga menawarkan solusi end-to-end yang akan menyelesaikan kasus penggunaan ML umum, yang dapat dikustomisasi sesuai kebutuhan Anda. Tidak ada biaya tambahan untuk penggunaan model atau solusi JumpStart. Anda akan dikenai biaya untuk penggunaan jam instans Pelatihan dan Inferensi dasar sama dengan apabila Anda membuatnya secara manual.
Profiler
Amazon SageMaker Profiler mengumpulkan data tingkat sistem untuk visualisasi plot jejak CPU dan GPU resolusi tinggi. Alat ini didesain untuk membantu ilmuwan dan rekayasawan data mengidentifikasi hambatan performa terkait perangkat keras dalam model deep learning mereka, sehingga dapat menghemat waktu dan biaya pelatihan secara keseluruhan. Saat ini SageMaker Profiler hanya mendukung pembuatan profil pekerjaan pelatihan yang memanfaatkan tipe instans komputasi pelatihan ml.g4dn.12xlarge, ml.p3dn.24xlarge, dan ml.p4d.24xlarge.

Wilayah: AS Timur (Ohio), AS Timur (Virginia Utara), AS Barat (Oregon), Eropa (Frankfurt), Eropa (Irlandia), dan Israel (Tel Aviv).

Amazon SageMaker Profiler saat ini dalam versi pratinjau dan tersedia tanpa biaya bagi pelanggan di wilayah yang didukung.
HyperPod
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod dibuat khusus untuk mempercepat pengembangan model fondasi (FM). Agar pelatihan FM lebih tangguh, alat ini terus memantau kondisi klaster, memperbaiki dan mengganti simpul yang rusak dengan cepat, dan sering menyimpan titik pemeriksaan untuk melanjutkan pelatihan secara otomatis tanpa kehilangan progres. SageMaker HyperPod telah dikonfigurasi sebelumnya dengan pustaka pelatihan terdistribusi SageMaker yang memungkinkan Anda meningkatkan performa pelatihan FM sekaligus sepenuhnya memanfaatkan infrastruktur komputasi dan jaringan klaster

Detail instans

Detail produk instans P5 Amazon SageMaker

Ukuran Instans	vCPU	Memori Instans (TiB)	Model GPU	GPU	Total memori GPU (GB)	Memori per GPU (GB)	Bandwidth Jaringan (Gbps)	RDMA GPUDirect	Peer to Peer GPU	Penyimpanan Instans (TB)	Bandwidth EBS (Gbps)
ml.p5.48xlarge	192	2	NVIDIA H100	8	640 HBM3	80	3200 EFAv2	Ya	900 GB/s NVSwitch	8x3.84 NVMe SSD	80

Detail produk instans P4d Amazon SageMaker

Ukuran Instans	vCPU	Memori Instans (GiB)	Model GPU	GPU	Total memori GPU (GB)	Memori per GPU (GB)	Bandwidth Jaringan (Gbps)	RDMA GPUDirect	Peer to Peer GPU	Penyimpanan Instans (GB)	Bandwidth EBS (Gbps)
ml.p4d.24xlarge	96	1152	NVIDIA A100	8	320 HBM 2	40	400 ENA DAN EFA	Ya	600 GB/s NVSwitch	8x1000 NVMe SSD	19
ml.p4de.24xlarge	96	1152	NVIDIA A100	8	640 HNM2e	80	400 ENA dan EFA	Ya	600 GB/s NVSwitch	8X1000 NVMe SSD	19

Detail produk instans P3 Amazon SageMaker

Ukuran Instans	vCPU	Memori Instans (GiB)	Model GPU	GPU	Total memori GPU (GB)	Memori per GPU (GB)	Bandwidth Jaringan (Gbps)	Peer to Peer GPU	Penyimpanan Instans (GB)	Bandwidth EBS (Gbps)
ml.p3.2xlarge	8	61	NVIDIA V100	1	16	16	Hingga 10	N/A	Hanya EBS	1,5
ml.p3.8xlarge	32	244	NVIDIA V100	4	64	16	10	NVLink	Hanya EBS	7
ml.p3.16xlarge	64	488	NVIDIA V100	8	128	16	25	NVLink	Hanya EBS	14
ml.p3dn.24xlarge	96	768	NVIDIA V100	8	256	32	100	NVLink	2 x 900 NVMeSSD	19

Detail produk instans P2 Amazon SageMaker

Ukuran Instans	vCPU	Memori Instans (GiB)	Model GPU	GPU	Total memori GPU (GB)	Memori per GPU (GB)	Bandwidth Jaringan (Gbps)	Bandwidth EBS (Gbps)
ml.p2.xlarge	4	61	NVIDIA K80	1	12	12	Hingga 10	Tinggi
ml.p2.8xlarge	32	488	NVIDIA K80	8	96	12	10	10
ml.p2.16xlarge	64	732	NVIDIA K80	16	192	12	25	20

Detail produk instans G4 Amazon SageMaker

Ukuran Instans	vCPU	Memori Instans (GiB)	Model GPU	GPU	Total memori GPU (GB)	Memori per GPU (GB)	Bandwidth Jaringan (Gbps)	Penyimpanan Instans (GB)	Bandwidth EBS (Gbps)
ml.g4dn.xlarge	4	16	NVIDIA T4	1	16	16	Hingga 25	1 x 125 NVMe SSD	Hingga 3,5
ml.g4dn.2xlarge	8	32	NVIDIA T4	1	16	16	Hingga 25	1 x 125 NVMe SSD	Hingga 3,5
ml.g4dn.4xlarge	16	64	NVIDIA T4	1	16	16	Hingga 25	1 x 125 NVMe SSD	4,75
ml.g4dn.8xlarge	32	128	NVIDIA T4	1	16	16	50	1 x 900 NVMe SSD	9,5
ml.g4dn.16xlarge	64	256	NVIDIA T4	1	16	16	50	1 x 900 NVMe SSD	9,5
ml.g4dn.12xlarge	48	192	NVIDIA T4	4	64	16	50	1 x 900 NVMe SSD	9,5

Detail produk instans G5 Amazon SageMaker

Ukuran Instans	vCPU	Memori Instans (GiB)	Model GPU	GPU	Total Memori GPU (GB)	Memori per GPU (GB)	Bandwidth Jaringan (Gbps)	Bandwidth EBS (Gbps)	Penyimpanan Instans (GB)
ml.g5n.xlarge	4	16	NVIDIA A10G	1	24	24	Hingga 10	Hingga 3,5	1x250
ml.g5.2xlarge	8	32	NVIDIA A10G	1	24	24	Hingga 10	Hingga 3,5	1x450
ml.g5.4xlarge	16	64	NVIDIA A10G	1	24	24	Hingga 25	8	1x600
ml.g5.8xlarge	32	128	NVIDIA A10G	1	24	24	25	16	1x900
ml.g5.16xlarge	64	256	NVIDIA A10G	1	24	24	25	16	1x1900
ml.g5.12xlarge	48	192	NVIDIA A10G	4	96	24	40	16	1x3800
ml.g5.24xlarge	96	384	NVIDIA A10G	4	96	24	50	19	1x3800
ml.g5.48xlarge	192	768	NVIDIA A10G	8	192	24	100	19	2x3800

Detail produk instans Trn1 Amazon SageMaker

Ukuran Instans	vCPU	Memori (GiB)	Akselerator Trainium	Total Memori Akselerator (GB)	Memori per Akselerator (GB)	Penyimpanan Instans (GB)	Bandwidth Jaringan (Gbps)	Bandwidth EBS (Gbps)
ml.trn1.2xlarge	8	32	1	32	32	1 x 500 NVMe SSD	Hingga 12,5	Hingga 20
ml.trn1.32xlarge	128	512	16	512	32	4 x 2000 NVMe SSD	800	80

Detail produk instans Inf1 Amazon SageMaker

Ukuran Instans	vCPU	Memori (GiB)	Akselerator Inferentia	Total Memori Akselerator (GB)	Memori per Akselerator (GB)	Penyimpanan Instans	Interkoneksi antar akselerator	Bandwidth Jaringan (Gbps)	Bandwidth EBS (Gbps)
ml.inf1.xlarge	4	8	1	8	8	Hanya EBS	N/A	Hingga 25	Hingga 4,75
ml.inf1.2xlarge	8	16	1	8	8	Hanya EBS	N/A	Hingga 25	Hingga 4,75
ml.inf1.6xlarge	24	48	4	32	8	Hanya EBS	Ya	25	4,75
ml.inf1.24xlarge	96	192	16	128	8	Hanya EBS	ya	100	19

Detail produk instans Inf2 Amazon SageMaker

Ukuran Instans	vCPU	Memori (GiB)	Akselerator Inferentia	Total Memori Akselerator (GB)	Memori per Akselerator (GB)	Penyimpanan Instans	Interkoneksi antar akselerator	Bandwidth Jaringan (Gbps)	Bandwidth EBS (Gbps)
ml.inf2.xlarge	4	16	1	32	32	Hanya EBS	N/A	Hingga 25	Hingga 10
ml.inf2.8xlarge	32	128	1	32	32	Hanya EBS	N/A	Hingga 25	10
ml.inf2.24xlarge	96	384	6	196	32	Hanya EBS	Ya	50	30
ml.inf2.48xlarge	192	768	12	384	32	Hanya EBS	Ya	100	60

Amazon SageMaker Studio

Amazon SageMaker Studio adalah antarmuka berbasis web tunggal untuk pengembangan ML lengkap, yang menawarkan pilihan lingkungan pengembangan terintegrasi (IDE) yang terkelola penuh dan alat yang dibuat khusus. Anda dapat mengakses SageMaker Studio secara gratis. Anda hanya akan dikenai biaya untuk komputasi dan penyimpanan dasar yang digunakan untuk IDE dan alat ML yang berbeda dalam SageMaker Studio.

Anda dapat menggunakan banyak layanan dari SageMaker Studio, AWS SDK for Python (Boto3), atau AWS Command Line Interface (AWS CLI), termasuk yang berikut ini:

IDE di SageMaker Studio untuk melakukan pengembangan ML lengkap dengan rangkaian IDE yang terkelola penuh, termasuk JupyterLab, Code Editor berdasarkan Code-OSS (Kode Studio Visual – Sumber Terbuka), dan RStudio
SageMaker Pipelines untuk mengotomatiskan dan mengelola alur kerja ML
SageMaker Autopilot untuk membuat model ML dengan visibilitas penuh secara otomatis
SageMaker Experiments untuk mengatur dan melacak tugas dan versi pelatihan Anda
SageMaker Debugger untuk melakukan debug anomali selama pelatihan
SageMaker Model Monitor untuk menjaga model agar tetap berkualitas tinggi
SageMaker Clarify untuk menjelaskan model ML Anda dan mendeteksi bias dengan lebih baik
SageMaker JumpStart untuk melakukan deployment solusi ML dengan mudah untuk banyak kasus penggunaan. Anda mungkin akan dikenai biaya untuk layanan AWS lain yang digunakan dalam solusi untuk panggilan API dasar yang dilakukan oleh Amazon SageMaker atas nama Anda.
SageMaker Inference Recommender untuk mendapatkan rekomendasi konfigurasi titik akhir yang tepat

Anda hanya membayar untuk sumber daya komputasi dan penyimpanan yang mendasari dalam SageMaker atau layanan AWS lainnya, berdasarkan penggunaan Anda.

Evaluasi model dasar

SageMaker Clarify mendukung evaluasi model dasar dengan metode evaluasi otomatis dan berbasis manusia. Masing-masing memiliki harga yang berbeda. Jika Anda mengevaluasi model dasar dari Amazon SageMaker JumpStart yang belum dilakukan deployment ke akun Anda, SageMaker akan melakukan deployment model JumpStart untuk sementara di instans SageMaker selama inferensi berlangsung. Instans spesifik akan sesuai dengan rekomendasi instans yang disediakan oleh JumpStart untuk model tersebut.

Evaluasi otomatis:
Evaluasi model dasar dijalankan sebagai tugas pemrosesan SageMaker. Pekerjaan evaluasi akan menginvokasi Inferensi SageMaker. Pelanggan dikenakan biaya untuk inferensi dan pekerjaan evaluasi. Pelanggan hanya dikenakan biaya selama pekerjaan evaluasi berlangsung. Biaya pekerjaan evaluasi adalah jumlah biaya per jam dari instans evaluasi dan jumlah biaya per jam dari instans hosting.

Evaluasi berbasis manusia:
Saat Anda menggunakan fitur evaluasi berbasis manusia tempat Anda membawa tenaga kerja Anda sendiri, Anda dikenakan biaya untuk tiga item: 1) instans SageMaker yang digunakan untuk inferensi, 2) instans yang digunakan untuk menjalankan Pekerjaan Pemrosesan SageMaker yang meng-host evaluasi manusia, dan 3 ) biaya sebesar 0,21 USD per tugas evaluasi manusia yang diselesaikan. Tugas manusia didefinisikan sebagai kejadian ketika pekerja manusia mengirimkan evaluasi atas satu perintah dan respons inferensi terkait di antarmuka pengguna evaluasi manusia. Harganya tetap sama baik Anda memiliki 1 maupun 2 model dalam pekerjaan evaluasi Anda atau Anda membawa inferensi Anda sendiri dan juga sama terlepas dari berapa banyak dimensi evaluasi dan metode penilaian yang Anda sertakan. Harga sebesar 0,21 USD per tugas sama untuk semua wilayah AWS. Tidak ada biaya terpisah untuk tenaga kerja, karena tenaga kerja tersebut disediakan oleh Anda.

Evaluasi yang dikelola AWS:
Untuk evaluasi ahli yang dikelola AWS, harga disesuaikan dengan kebutuhan evaluasi Anda dalam keterlibatan pribadi saat bekerja dengan tim evaluasi ahli AWS.

Amazon SageMaker Studio Lab

Anda dapat membuat dan melatih model ML menggunakan Amazon SageMaker Studio Lab secara gratis. SageMaker Studio Lab menawarkan developer, akademisi, dan ilmuwan data lingkungan pengembangan tanpa konfigurasi untuk belajar dan bereksperimen dengan ML tanpa biaya tambahan.

Amazon SageMaker Canvas

Amazon SageMaker Canvas memperluas akses ML dengan memberi analis bisnis kemampuan untuk menghasilkan prediksi ML yang akurat dengan menggunakan antarmuka point-and-click visual—tidak ada pengkodean atau pengalaman ML yang diperlukan.

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling memberikan dua penawaran pelabelan data, yaitu Amazon SageMaker Ground Truth Plus dan Amazon SageMaker Ground Truth. Anda dapat mempelajari selengkapnya mengenai Amazon SageMaker Data Labeling, sebuah layanan pelabelan data terkelola penuh yang memudahkan pembangunan set data pelatihan yang sangat akurat untuk ML.

Pengujian bayangan Amazon SageMaker

SageMaker membantu Anda menjalankan pengujian bayangan untuk mengevaluasi model ML baru sebelum perilisan produk dengan menguji performanya melalui model yang dilakukan deployment baru-baru ini. Pengujian bayangan SageMaker tidak dikenakan biaya tambahan selain penggunaan biaya untuk instans ML dan penyimpanan ML yang disediakan untuk meng-hosting model bayangan. Harga instans ML dan dimensi penyimpanan ML sama seperti opsi inferensi waktu nyata yang ditentukan di tabel harga sebelumnya. Tidak ada biaya tambahan untuk data yang diproses masuk dan keluar dari deployment bayangan.

Amazon SageMaker Edge

Pelajari selengkapnya tentang harga Amazon SageMaker Edge untuk mengoptimalkan, menjalankan, dan memantau model ML di armada perangkat edge.

Amazon SageMaker Savings Plans

Savings Plans Amazon SageMaker membantu mengurangi biaya Anda hingga 64%. Paket secara otomatis berlaku untuk penggunaan instans SageMaker ML yang memenuhi syarat, termasuk notebook SageMaker Studio, instans notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference, dan SageMaker Batch Transform terlepas dari keluarga instans, ukuran, atau Wilayah. Misalnya, Anda dapat mengubah penggunaan dari instans CPU ml.c5.xlarge yang berjalan di AS Timur (Ohio) ke instans ml.Inf1 di AS Barat (Oregon) untuk beban kerja inferensi kapan saja dan secara otomatis terus membayar harga Savings Plans .

Pelajari selengkapnya »

Total biaya kepemilikan (TCO) dengan Amazon SageMaker

Amazon SageMaker menawarkan total biaya kepemilikan (TCO) setidaknya 54% lebih rendah selama periode tiga tahun dibandingkan dengan solusi yang dikelola sendiri dan berbasis cloud lainnya. Pelajari selengkapnya tentang Analisis TCO untuk Amazon SageMaker.

Contoh harga

Contoh harga #1: JupyterLab

Sebagai ilmuwan data, Anda menghabiskan 20 hari menggunakan JupyterLab untuk eksperimen cepat pada notebook, kode, dan data selama 6 jam per hari pada instans ml.g4dn.xlarge. Anda membuat, lalu menjalankan ruang JupyterLab untuk mengakses IDE JupyterLab. Komputasi hanya dikenakan biaya untuk instans yang digunakan saat ruang JupyterLab sedang berjalan. Biaya penyimpanan untuk ruang JupyterLab akan terus bertambah hingga ruang tersebut dihapus.

Komputasi

Instans	Durasi	Hari	Durasi total	Biaya per jam	Total
ml.g4dn.xlarge	6 jam	20	6 * 20 = 120 jam	0,7364 USD	88,368 USD

Penyimpanan

Anda akan menggunakan penyimpanan Tujuan Umum SSD selama 480 jam (24 jam * 20 hari). Di Wilayah yang mengenakan biaya sebesar 0,1125 USD per GB-bulan:
0,112 USD per GB-bulan * 5 GB * 480 / (24 jam/hari * 30 hari kalender) = 0,373 USD

Contoh harga #2: Code Editor

Sebagai rekayasawan ML, Anda menghabiskan 20 hari menggunakan Code Editor untuk mengedit, mengeksekusi, dan melakukan debug kode produksi ML selama 6 jam per hari pada instans ml.g4dn.xlarge. Anda membuat, lalu menjalankan ruang Code Editor untuk mengakses IDE Code Editor. Komputasi hanya dikenakan biaya untuk instans yang digunakan saat ruang Code Editor sedang berjalan. Biaya penyimpanan untuk ruang Code Editor akan terus bertambah hingga ruang tersebut dihapus.

Komputasi

Instans	Durasi	Hari	Durasi total	Biaya per jam	Total
ml.g4dn.xlarge	6 jam	20	6 * 20 = 120 jam	0,7364 USD	88,368 USD

Penyimpanan

Contoh harga #3: Studio Classic

Seorang ilmuwan data akan melakukan urutan tindakan berikut saat menggunakan notebook di Amazon SageMaker Studio Classic.

Membuka notebook 1 di kernel TensorFlow di instans ml.c5.xlarge, lalu bekerja di notebook ini selama 1 jam.
Membuka notebook 2 di instans ml.c5.xlarge. Ini akan secara otomatis terbuka di instans ml.c5.xlarge yang sama yang menjalankan notebook 1.
Bekerja di notebook 1 dan notebook 2 sekaligus selama 1 jam.
Ilmuwan data akan ditagih untuk total dua (2) jam penggunaan ml.c5.xlarge. Untuk waktu tumpang tindih saat ia bekerja di notebook 1 dan notebook 2 secara bersamaan, tiap-tiap aplikasi kernel akan dihitung selama 0,5 jam dan ia akan dikenai tagihan untuk 1 jam.

Aplikasi kernel	Instans notebook	Jam	Biaya per jam	Total
TensorFlow	ml.c5.xlarge	1	0,204 USD	0,204 USD
TensorFlow	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Ilmu Data	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Contoh harga #4: RStudio

Seorang ilmuwan data menjalankan urutan tindakan berikut saat menggunakan RStudio:

Meluncurkan RSession 1 pada instans ml.c5.xlarge, lalu bekerja di notebook ini selama 1 jam.
Meluncurkan RSession 2 pada instans ml.c5.xlarge. Ini akan secara otomatis terbuka di instans ml.c5.xlarge yang sama yang menjalankan RSession 1.
Bekerja pada RSesssion 1 dan RSession 2 secara bersamaan selama 1 jam.
Ilmuwan data akan ditagih untuk total dua (2) jam penggunaan ml.c5.xlarge. Untuk jam yang tumpang tindih saat ia mengerjakan RSession 1 dan RSession 2 secara bersamaan, tiap-tiap aplikasi RSession akan diukur selama 0,5 jam dan ia akan dikenai biaya untuk 1 jam.

Sementara itu, RServer berjalan selama 24/7 terlepas dari apakah ada RSessions yang sedang berjalan atau tidak. Jika admin memilih “Kecil” (ml.t3.medium), maka tidak dikenai biaya. Jika admin memilih “Sedang” (ml.c5.4xlarge) atau “Besar” (ml.c5.9xlarge), maka biayanya akan dibebankan per jam sejauh RStudio diaktifkan untuk Domain SageMaker.

Aplikasi RSession	Instans RSession	Jam	Biaya per jam	Total
Base R	ml.c5.xlarge	1	0,204 USD	0,204 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Contoh harga #5: Processing

Amazon SageMaker Processing hanya mengenakan biaya untuk instans yang digunakan saat tugas Anda sedang berjalan. Ketika Anda menyediakan data input untuk pemrosesan di Amazon S3, Amazon SageMaker akan mengunduh data dari Amazon S3 ke penyimpanan file lokal di awal tugas pemrosesan.

Analis data akan menjalankan tugas pemrosesan untuk memproses dan memvalidasi data di dua instans ml.m5.4xlarge dengan durasi tugas selama 10 menit. Ia mengunggah set data sebesar 100 GB di S3 sebagai input untuk tugas pemrosesan, dan data output (yang ukurannya kurang lebih sama) akan disimpan kembali di S3.

Jam	Instans pemrosesan	Biaya per jam	Total
1 * 2 * 0,167 = 0,334	ml.m5.4xlarge	0,922 USD	0,308 USD

Penyimpanan Tujuan Umum (SSD) (GB)	Biaya per jam	Total
100 GB * 2 = 200	0,14 USD	0,0032 USD

Subtotal untuk tugas Pemrosesan Amazon SageMaker = 0,308 USD.
Subtotal untuk 200 GB penyimpanan SSD tujuan umum = 0,0032 USD.
Total harga untuk contoh ini menjadi 0,3112 USD.

Contoh harga #6: Data Wrangler

Dari tabel tersebut, Anda menggunakan Amazon SageMaker Data Wrangler selama total 18 jam dalam 3 hari untuk menyiapkan data Anda. Selain itu, Anda membuat tugas SageMaker Data Wrangler untuk menyiapkan data yang diperbarui setiap minggu. Setiap tugas berlangsung selama 40 menit, dan tugas dijalankan setiap minggu selama satu bulan.

Total biaya bulanan atas penggunaan Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

Aplikasi	Instans SageMaker Studio	Hari	Durasi	Durasi total	Biaya per jam	Subtotal biaya
SageMaker Data Wrangler	ml.m5.4xlarge	3	6 jam	18 jam	0,922 USD	16,596 USD
Tugas SageMaker Data Wrangler	ml.m5.4xlarge	-	40 menit	2,67 jam	0,922 USD	2,461 USD

Sebagai ilmuwan data, Anda memerlukan waktu tiga hari menggunakan Amazon SageMaker Data Wrangler untuk membersihkan, menjelajahi, dan memvisualisasikan data Anda dengan durasi selama 6 jam per hari. Untuk menjalankan pipeline persiapan data, Anda kemudian memulai tugas SageMaker Data Wrangler yang dijadwalkan berjalan setiap minggu.

Tabel di bawah ini merangkum total penggunaan Anda untuk bulan tersebut dan biaya terkait untuk menggunakan Amazon SageMaker Data Wrangler.

Contoh harga #7: Feature Store

++ Semua pecahan unit baca dibulatkan ke bilangan bulat berikutnya

Penyimpanan data
Total data yang disimpan = 31,5 GB
Biaya bulanan atas penyimpanan data = 31,5 GB * 0,45 USD = 14,175 USD

Total biaya bulanan atas Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

Hari dalam bulan	Total Tulis	Total unit tulis	Total Baca	Total unit baca
Hari 1 s/d 10	100.000 tulis (10.000 tulis * 10 hari)	2.500.000 (100.000 * 25 KB)	100.000 (10.000 * 10 hari)	700.000 ++ (100.000 * 25/4 KB)

Hari 11	200.000 tulis	5.000.000 (200.000 * 25 KB)	200.000 baca	1.400.000 ++ (200.000 * 25/4KB)

Hari 12 s/d 30	1.520.000 tulis (80.000 * 19 hari)	38.000.000 (1.520.000 * 25 KB)	1.520.000 tulis (80.000 * 19 hari)	10.640.000++ (1.520.000 * 25/4KB)

Total unit yang dikenakan biaya		45.500.000 unit tulis		12.740.000 unit baca
Biaya bulanan untuk tulis dan baca		56,875 USD (45,5 juta unit tulis * 1,25 USD per juta tulis)		3,185 USD (12,74 juta unit baca * 0,25 USD per juta baca)

Anda memiliki aplikasi web yang menerbitkan baca dan tulis, masing-masing sebesar 25 KB ke Amazon SageMaker Feature Store. Selama 10 hari pertama dalam sebulan, Anda akan menerima lalu lintas yang sedikit pada aplikasi, yang menghasilkan 10.000 tulis dan 10.000 baca setiap hari ke Tempat Penyimpanan Fitur SageMaker. Namun, pada hari ke-11 di bulan itu aplikasi Anda mencuri perhatian di media sosial, dan lalu lintas aplikasi melonjak menjadi 200.000 baca dan 200.000 tulis hari itu. Aplikasi Anda pun perlahan memiliki pola lalu lintas yang lebih teratur, rata-rata 80.000 baca dan 80.000 tulis setiap hari hingga akhir bulan.

Tabel di bawah ini merangkum total penggunaan Anda selama bulan tersebut dan biaya penggunaan Amazon SageMaker Feature Store.

Contoh harga #8: Pelatihan

Total biaya untuk pelatihan dan melakukan debug dalam contoh ini adalah 2,38 USD. Instans komputasi dan volume penyimpanan tujuan umum yang digunakan oleh aturan bawaan Amazon SageMaker Debugger tidak dikenakan biaya tambahan.

	Penyimpanan tujuan umum (SSD) untuk pelatihan (GB)	*Penyimpanan tujuan umum (SSD) untuk aturan bawaan debugger* (GB)**	*Penyimpanan tujuan umum (SSD) untuk aturan kustom debugger* (GB)**	Biaya per GB-bulan	Subtotal
Kapasitas yang digunakan	3	2	1
Biaya	0 USD	Tidak ada biaya tambahan untuk volume penyimpanan aturan bawaan	0 USD	0,10 USD	0 USD

Jam	Instans pelatihan	Instans debug	Biaya per jam	Subtotal
4 * 0,5 = 2,00	ml.m4.4xlarge	n/a	0,96 USD	1,92 USD
4 * 0,5 * 2 = 4	n/a	Tidak ada biaya tambahan untuk instans aturan built-in	0 USD	0 USD
4 * 0,5 = 2	ml.m5.xlarge	n/a	0,23 USD	0,46 USD
				-------
				2,38 USD

Seorang ilmuwan data telah menghabiskan waktu seminggu mengerjakan model untuk sebuah ide baru. Ia melatih model 4 kali di sebuah ml.m4.4xlarge selama 30 menit per pelatihan dengan Amazon SageMaker Debugger diaktifkan menggunakan 2 aturan built-in dan 1 aturan kustom yang ia tulis. Untuk aturan kustom, ia menentukan instans ml. m5.xlarge. Ia melatih menggunakan data pelatihan 3 GB di Amazon S3, dan menekan output model 1 GB ke dalam Amazon S3. SageMaker membuat volume SSD tujuan umum (gp2) untuk setiap instans pelatihan. SageMaker juga membuat volume SSD tujuan umum (gp2) untuk setiap aturan yang ditentukan. Dalam contoh ini, total 4 volume SSD tujuan umum (gp2) akan dibuat. SageMaker Debugger mengeluarkan 1 GB data debug ke bucket Amazon S3 pelanggan.

Contoh harga #9: Eksperimen

	Biaya	Total unit	Biaya bulanan
Penyerapan	1,25 USD per juta catatan metrik	1 juta (=1.000 ilmuwan data x 10 kali x 20 epoch x 5 metrik) catatan metrik yang diserap	1,25 USD (= 1,25 x 1)
Penggunaan SageMaker Studio	0 USD		0 USD
Pengambilan	0,25 USD per juta catatan metrik	10 juta (= 1 juta metrik yang diserap * 10 pengambilan per metrik yang diserap) catatan metrik yang diambil	2,5 USD (= 0,25 * 10)
Penyimpanan	0,25 USD per juta catatan metrik - bulan	1 juta catatan metrik yang tersimpan	0,25 USD (= 0,25 x 1)
Total biaya bulanan			4 USD

Anda memiliki workbench ML yang digunakan oleh 1.000 ilmuwan data. Mereka melakukan eksperimen dengan melatih model mereka dengan parameter dan set data yang berbeda. Setiap ilmuwan data melatih model sepuluh kali dalam sebulan selama 20 epoch dan menangkap lima metrik khusus. Workbench menggunakan API pengambilan untuk mendapatkan data eksperimen dari SageMaker Experiments untuk analisis kustom. Ilmuwan data membandingkan data rekaman mereka di sepuluh iterasi pelatihan yang berbeda untuk menemukan model kandidat terbaik. Dalam contoh ini, biayanya adalah sebagai berikut:

	Biaya	Total unit	Biaya bulanan
Penyerapan	1,25 USD per juta catatan metrik	100.000 (=100 ilmuwan data x 10 kali x 20 epoch x 5 metrik) catatan metrik yang diserap	0,125 USD (= 1,25 x 100.000/1.000.000)
Penggunaan SageMaker Studio	0 USD		0 USD
Pengambilan	0,25 USD per juta catatan metrik	0	0 USD
Penyimpanan	0,25 USD per juta catatan metrik - bulan	100.000 catatan metrik yang tersimpan	0,025 USD (= 0,25 x 100.000/1.000.000)
Total biaya bulanan			0,15 USD

Sebuah tim yang terdiri dari 100 ilmuwan data sedang mengerjakan sebuah proyek untuk ide baru. Mereka melakukan eksperimen dengan melatih model mereka dengan parameter dan set data yang berbeda. Rata-rata, setiap ilmuwan data melatih model sepuluh kali dalam sebulan selama 20 epoch dan menangkap lima metrik khusus. Ilmuwan data menggunakan SageMaker Studio untuk menganalisis eksperimen mereka. Dalam contoh ini, biayanya adalah sebagai berikut:

Contoh harga #10: Inferensi waktu nyata

Subtotal untuk pelatihan, hosting, dan pemantauan = 305,827 USD. Subtotal untuk 3.100 MB data yang diproses Masuk dan 310 MB data yang diproses Keluar untuk Hosting per bulan = 0.054 USD. Total biaya untuk contoh ini adalah 305,881 USD per bulan.

Catatan, untuk aturan bawaan dengan instans ml.m5.xlarge, Anda akan mendapatkan hingga 30 jam pemantauan yang digabungkan di seluruh titik akhir setiap bulan, tanpa biaya.

Data Masuk per bulan - hosting	Data Keluar per bulan - hosting	Biaya per GB Masuk atau Keluar	Total
100 MB * 31 = 3.100 MB		0,016 USD	0,0496 USD
	10 MB * 31 = 310 MB	0,016 USD	0,00496 USD

Jam per bulan	Instans hosting	Instans Model Monitor	Biaya per jam	Total
24 * 31 * 2 = 1488	ml.c5.xlarge		0,204 USD	303,522 USD
31*0,08 = 2,5		ml.m5.4xlarge	0,922 USD	2,305 USD

Model dalam contoh #5 kemudian dilakukan deployment ke produksi pada dua (2) instans ml.c5.xlarge untuk melakukan host multi-AZ yang andal. Amazon SageMaker Model Monitor diaktifkan dengan satu (1) instans ml.m5.4xlarge dan tugas pemantauan dijadwalkan sekali per hari. Setiap tugas pemantauan memerlukan waktu 5 menit. Model akan menerima 100 MB data per hari, dan inferensi sebesar 1/10 dari ukuran data input.

Contoh harga #11: Asynchronous Inference

Subtotal untuk SageMaker Asynchronous Inference = 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Total biaya Inferensi Asinkron untuk contoh ini menjadi 16,38 USD per bulan.

Data Masuk per bulan	Data Keluar per bulan	Biaya per GB Masuk atau Keluar	Total
10 KB * 1.024 * 31 = 310 MB	10 KB * 1.024 * 31 = 310 MB	0,02 USD	0,0048
	10 KB * 1.024 * 31 = 310 MB	0,02 USD	0,0048

Penyimpanan Tujuan Umum (SSD) (GB)	Biaya per Gb-bulan	Total
4	0,14 USD	0,56 USD

Jam per bulan	Instans hosting	Biaya per jam	Total
2,5 * 31 * 1 = 77,5	ml.c5.xlarge	0,20 USD	15,81 USD

Amazon SageMaker Asynchronous Inference mengenakan biaya untuk instans yang digunakan oleh titik akhir Anda. Saat sedang tidak secara aktif memproses permintaan, Anda dapat mengonfigurasi penskalaan otomatis untuk menskalakan jumlah instans ke nol guna menghemat biaya. Untuk muatan input di Amazon S3, tidak ada biaya untuk membaca data input dari Amazon S3 dan menulis data output ke S3 di Wilayah yang sama.

Model dalam Contoh #5 digunakan untuk menjalankan titik akhir Inferensi Asinkron SageMaker. Titik akhir dikonfigurasi untuk dijalankan pada 1 instans ml.c5.xlarge dan menurunkan skala jumlah instansnya ke nol saat tidak memproses permintaan secara aktif. Instans ml.c5.xlarge di titik akhir memiliki 4 GB penyimpanan tujuan umum (SSD) yang terpasang. Dalam contoh ini, titik akhir akan mempertahankan jumlah instans 1 selama 2 jam per hari dan memiliki periode pendinginan selama 30 menit setelah diskalakan turun ke jumlah instans nol untuk sisa hari itu. Oleh karena itu, Anda dikenai biaya penggunaan sebesar 2,5 jam per hari.

Titik akhir memproses 1.024 permintaan per hari. Ukuran untuk setiap isi permintaan/respons pemanggilan adalah 10 KB dan ukuran untuk setiap muatan permintaan inferensi di Amazon S3 adalah 100 MB. Output inferensi adalah sebesar 1/10 dari ukuran data input yang disimpan kembali di Amazon S3 di Wilayah yang sama. Dalam contoh ini, biaya pemrosesan data berlaku untuk isi permintaan dan respons, tetapi tidak untuk data yang ditransfer ke/dari Amazon S3.

Contoh harga #12: Transformasi Batch

Total biaya untuk inferensi dalam contoh ini adalah 2,88 USD.

Jam	Instans hosting	Biaya per jam	Total
3 * 0,25 * 4 = 3 jam	ml.m4.4xlarge	0,96 USD	2,88 USD

Model dalam contoh #5 digunakan untuk menjalankan SageMaker Batch Transform. Ilmuwan data menjalankan empat tugas Batch Transform SageMaker yang berbeda di 3 ml.m4.4xlarge selama 15 menit per tugas yang dijalankan. Ia mengunggah set data evaluasi sebesar 1 GB di S3 untuk setiap proses, dan inferensi sebesar 1/10 dari ukuran data input yang disimpan kembali di S3.

Contoh harga #13: Inferensi Nirserver Sesuai Permintaan

Biaya proses data bulanan

Pemrosesan data (GB)	Biaya per GB Masuk atau Keluar	Biaya pemrosesan data bulanan
10 GB	0,016 USD	0,16 USD

Subtotal untuk biaya durasi Inferensi Nirserver SageMaker sesuai permintaan = 40 USD. Subtotal untuk biaya pemrosesan data 10 GB = 0,16 USD. Total biaya untuk contoh ini adalah 40,16 USD.

Biaya komputasi bulanan

Jumlah permintaan	Durasi setiap permintaan	Durasi total inferensi (detik)	Biaya per detik	Biaya durasi inferensi bulanan
10 Juta	100 ms	1 Juta	0,00004 USD	40 USD

Dengan Inferensi Nirserver sesuai permintaan, Anda hanya membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Biaya komputasi bergantung pada konfigurasi memori yang Anda pilih.

Jika Anda mengalokasikan memori sebesar 2 GB untuk titik akhir, menjalankannya 10 juta kali dalam satu bulan dan berjalan selama 100 milidetik setiap waktu, serta memproses total 10 GB Data Masuk/Keluar, biaya Anda akan dihitung sebagai berikut:

Contoh harga #14: Konkurensi yang Disediakan di Inferensi Nirserver

Asumsikan Anda menjalankan layanan chat-bot untuk perusahaan pemrosesan penggajian. Anda memperkirakan lonjakan pertanyaan pelanggan pada akhir Maret, sebelum batas waktu pengajuan pajak. Namun, untuk sisa bulan ini, lalu lintas diperkirakan akan rendah. Jadi, Anda melakukan deployment titik akhir nirserver dengan memori 2 GB dan menambahkan Konkurensi yang Tersedia sebanyak 100 selama 5 hari terakhir dalam sebulan pada pukul 9 pagi - 5 sore (8 jam), tempat titik akhir Anda memproses 10 juta permintaan dan total 10 GB Data Masuk/Keluar. Selama sisa bulan ini, chatbot berjalan pada Inferensi Nirserver sesuai permintaan dan memproses 3 juta permintaan dan 3 GB Data Masuk/Keluar. Misalnya, durasi setiap permintaan adalah 100 milidetik.

Biaya Konkurensi yang Tersedia (PC)
Harga PC adalah 0,000010 USD/detik
Durasi penggunaan PC (detik) = 5 hari x 100 PC x 8 jam x 3.600 detik = 14.400.000 detik
Biaya penggunaan PC = 14.400.000 detik x 0,000010 USD/detik = 144 USD.

Biaya durasi inferensi untuk lalu lintas yang dilayani oleh Konkurensi yang Tersedia
Harga durasi inferensi adalah 0,000023 USD/detik
Total durasi Inferensi untuk PC (detik) = 10 juta x (100 milidetik) /1.000 = 1 juta detik.
Biaya durasi inferensi untuk PC = 1.000.000 detik x 0,000023 USD/detik = 23 USD

Biaya durasi inferensi sesuai permintaan
Harga komputasi bulanan adalah 0,00004 USD/detik dan tingkat gratis menyediakan 150 ribu detik.
Total komputasi (detik) = (3) juta x (100 milidetik) /1.000 = 0,3 juta detik.
Total komputasi – Komputasi tingkat gratis = Komputasi tertagih bulanan dalam satuan detik
0,3 juta detik – 150 ribu detik = 150 ribu detik
Biaya komputasi bulanan = 150 ribu x 0,00004 USD = 6 USD

Pemrosesan Data
Biaya/GB Data Diproses Masuk/Keluar = 0,016 USD
Total GB yang diproses = 10+3 = 13
Total Biaya = 0,016 USD x 13 = 0,208 USD

Total biaya untuk bulan Maret
Total biaya = Biaya Konkurensi yang Tersedia + Durasi inferensi untuk Konkurensi yang Tersedia + Durasi inferensi untuk komputasi sesuai permintaan + Biaya Pemrosesan Data
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

Contoh harga #15: Jumpstart

Pelanggan menggunakan JumpStart untuk melakukan deployment model BERT Base Uncased yang dilatih sebelumnya untuk mengklasifikasikan sentimen ulasan pelanggan sebagai positif atau negatif.

Pelanggan melakukan deployment model tersebut ke dua (2) instans ml.c5.xlarge untuk hosting multi-AZ yang tepercaya. Model akan menerima 100 MB data per hari, dan inferensi sebesar 1/10 dari ukuran data input.

Jam per bulan	Instans hosting	Biaya per jam	Total
24 * 31 * 2 = 1488	ml.c5.xlarge	0,204 USD	303,55 USD

Data Masuk per bulan - Hosting	Data Keluar per bulan - Hosting	Biaya per GB Masuk atau Keluar	Total
100 MB * 31 = 3.100 MB		0,02 USD	0,06 USD
	10 MB * 31 = 310 MB	0,02 USD	0,01 USD

Subtotal untuk pelatihan, hosting, dan pemantauan = 305,827 USD. Subtotal untuk 3.100 MB data yang diproses Masuk dan 310 MB data yang diproses Keluar untuk Hosting per bulan = 0,06 USD. Total biaya untuk contoh ini adalah 305,887 USD per bulan.

Contoh harga #16: HyperPod

Katakanlah Anda menginginkan klaster 64 p5 untuk digunakan secara terus menerus selama 3 bulan guna mendukung deployment model menyeluruh.

Jam	Instans pelatihan	Biaya per jam
3 bulan * 30 hari * 24 jam = 2.160 jam	ml.p5.48xlarge	113,07 USD

Total biaya untuk klaster dalam contoh ini adalah 244.321,20 USD

Contoh Harga #17: Evaluasi model dasar (evaluasi otomatis)

Evaluasi model dasar dengan SageMaker Clarify hanya membebankan biaya kepada Anda untuk instans yang digunakan saat tugas evaluasi otomatis Anda berjalan. Saat Anda memilih tugas dan set data evaluasi otomatis, SageMaker memuat set data perintah dari Amazon S3 ke instans evaluasi SageMaker.

Dalam contoh berikut, seorang rekayasawan ML menjalankan evaluasi model Llama2 7B di AS Timur (Virginia Utara) untuk akurasi tugas peringkasan. Tipe instans yang direkomendasikan untuk inferensi Llama 2 7B adalah ml.g5.2xlarge. Instans minimum yang direkomendasikan untuk evaluasi adalah ml.m5.2xlarge. Dalam contoh ini, pekerjaan berjalan selama 45 menit (bergantung pada ukuran set data). Dalam contoh ini, biayanya adalah 1,48 USD untuk pekerjaan evaluasi dan hasil terperinci.

Jam Kerja Pemrosesan (contoh)	Wilayah	Tipe Instans	Instans	Biaya per jam	Biaya
0,45	US-east-1	Hosting LLM	ml.g5.2xlarge	1,52 USD	1,14 USD
0,45	US-east-1	evaluasi	ml.m5.2xlarge	0,46 USD	0,35 USD
Total					1,48 USD

Dalam contoh berikutnya, rekayasawan yang sama di Virginia menjalankan pekerjaan evaluasi lain untuk akurasi tugas peringkasan, tetapi menggunakan versi Llama 2 7B yang disesuaikan yang dilakukan deployment ke akun mereka dan aktif serta berjalan. Dalam kasus ini, karena model telah dilakukan deployment ke akun mereka, satu-satunya biaya tambahan adalah untuk instans evaluasi.

Jam Kerja Pemrosesan	Wilayah	Tipe Instans	Instans	Biaya per jam	Biaya
0,45	US-east-1	evaluasi	ml.m5.2xlarge	0,46 USD	0,35 USD
Total					0,35 USD

Contoh Harga #18: Evaluasi model dasar (evaluasi berbasis manusia)

Dalam contoh berikut, seorang rekayasawan machine learning di AS Timur (Virginia Utara) menjalankan evaluasi Llama-2-7B berbasis manusia untuk akurasi tugas peringkasan dan menggunakan tenaga kerja privat mereka untuk melakukan evaluasi. Tipe instans yang direkomendasikan untuk Llama-2-7B adalah ml.g5.2xlarge. Instans minimum yang direkomendasikan untuk Pekerjaan Pemrosesan evaluasi berbasis manusia adalah ml.t3.medium. Inferensi di Llama-2-7B berjalan selama 45 menit (bergantung ukuran set data). Set data berisi 50 perintah, dan developer memerlukan 2 pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam evaluasi pembuatan tugas sebagai parameter “pekerja per perintah”). Akan ada 100 tugas dalam pekerjaan evaluasi ini (1 tugas untuk setiap pasangan respons perintah per setiap pekerja: 2 pekerja x 50 rangkaian respons perintah = 100 tugas manusia). Tenaga kerja manusia membutuhkan waktu satu hari (24 jam) untuk menyelesaikan 100 tugas evaluasi manusia dalam pekerjaan evaluasi (bergantung jumlah dan tingkat keterampilan pekerja, serta panjang/kompleksitas perintah dan respons inferensi).

Jam Komputasi	Tugas manusia	Wilayah	Tipe Instans	Instans	Biaya per jam	Biaya per tugas manusia	Total Biaya
0,45		AS Timur (Virginia Utara)	Hosting LLM	ml.g5.2xlarge	1,52 USD		1,14 USD
24		AS Timur (Virginia Utara)	Pekerjaan Pemrosesan	ml.t3.medium	0,05 USD		1,20 USD
	100	Apa saja				0,21 USD	21,00 USD
Total							23,34 USD

Pada contoh berikutnya, rekayasawan yang sama di AS Timur (Virginia Utara) menjalankan pekerjaan evaluasi yang sama, tetapi menggunakan Llama-2-7B yang sudah dilakukan deployment ke akun mereka dan aktif serta berjalan. Dalam hal ini, satu-satunya biaya tambahan adalah untuk pekerjaan pemrosesan evaluasi dan tugas manusia.

Jam Komputasi	Tugas manusia	Wilayah	Tipe Instans	Instans	Biaya per jam	Biaya per tugas manusia	Total Biaya
24		AS Timur (Virginia Utara)	Pekerjaan Pemrosesan	ml.t3.medium	0,05 USD		1,20 USD
	100	Apa saja				0,21 USD	21,00 USD
Total							22,20 USD

Langkah berikutnya

Feature Page

Temukan beragam fitur SageMaker

Pelajari selengkapnya

Console

Mulai membangun dengan SageMaker di Konsol Manajemen AWS

Daftar sekarang

Harga Amazon SageMaker