Harga Amazon SageMaker
Ikhtisar harga
Amazon SageMaker membantu ilmuwan data dan developer menyiapkan, membangun, melatih, dan men-deploy model machine learning (ML) berkualitas tinggi secara cepat dengan menggabungkan serangkaian kapabilitas yang dibuat khusus untuk ML. SageMaker mendukung kerangka kerja, kit alat, dan bahasa pemrograman ML yang terkemuka.
Dengan SageMaker, Anda hanya membayar apa yang Anda gunakan. Anda memiliki dua pilihan pembayaran, yaitu: pertama, Harga Sesuai Permintaan tanpa biaya minimum serta komitmen di muka dan kedua, SageMaker Savings Plans yang menawarkan model harga berbasis penggunaan yang fleksibel sebagai ganti dari komitmen untuk jumlah penggunaan yang konsisten.
Amazon SageMaker Tingkat Gratis
Amazon SageMaker dapat dicoba secara gratis. Sebagai bagian dari AWS Tingkat Gratis, Anda dapat memulai Amazon SageMaker secara gratis. Tingkat gratis Anda dimulai dari bulan pertama saat Anda membuat sumber daya SageMaker pertama Anda. Detail dari tingkat gratis untuk Amazon SageMaker ada di tabel berikut ini.
Kapabilitas Amazon SageMaker | Penggunaan Tingkat Gratis per bulan untuk 2 bulan pertama |
Notebook studio, dan instans notebook | 250 jam instans ml.t3.medium pada notebook Studio ATAU 250 jam instans ml.t2 atau instans ml.t3.medium pada instans notebook |
RStudio di SageMaker | 250 jam instans ml.t3.medium di aplikasi RSession DAN gratis instans ml.t3.medium untuk aplikasi RStudioServerPro |
Data Wrangler | 25 jam instans ml.m5.4xlarge |
Tempat Penyimpanan Fitur | 10 juta unit tulis, 10 juta unit baca, 25 GB penyimpanan (penyimpanan online standar) |
Pelatihan | 50 jam instans m4.xlarge atau m5.xlarge |
Amazon SageMaker dengan TensorBoard | 300 jam instans ml.r5.large |
Inferensi Waktu Nyata | 125 jam instans m4.xlarge atau m5.xlarge |
Inferensi Nirserver | 150.000 detik durasi inferensi sesuai permintaan |
Canvas | 160 jam/bulan untuk waktu sesi |
HyperPod | 50 jam instans m5.xlarge |
Harga Sesuai Permintaan
-
Studio Classic
-
JupyterLab
-
Code Editor
-
RStudio
-
Instans Notebook
-
Pemrosesan
-
TensorBoard
-
Data Wrangler
-
Tempat Penyimpanan Fitur
-
Pelatihan
-
MLflow
-
Inferensi Waktu Nyata
-
Inferensi Asinkron
-
Batch Transform
-
Inferensi Nirserver
-
JumpStart
-
Profiler
-
HyperPod
-
Optimisasi inferensi
-
Studio Classic
-
Amazon SageMaker Studio Classic
Studio Classic menawarkan notebook Jupyter satu langkah dalam pengalaman IDE warisan kami. Sumber daya komputasi dasarnya sepenuhnya elastis dan notebook dapat dengan mudah dibagikan dengan orang lain sehingga memungkinkan adanya kolaborasi tanpa hambatan. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan. -
JupyterLab
-
Amazon SageMaker JupyterLab
Luncurkan JupyterLab terkelola penuh dalam hitungan detik. Gunakan lingkungan pengembangan interaktif berbasis web terbaru untuk notebook, kode, dan data. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan. -
Code Editor
-
Amazon SageMaker Code Editor
Code Editor, berdasarkan Code-OSS (Kode Studio Visual – Sumber Terbuka), memungkinkan Anda untuk menulis, menguji, melakukan debug, serta menjalankan analitik dan kode ML Anda. Code Editor sepenuhnya terintegrasi dengan SageMaker Studio dan mendukung ekstensi IDE yang tersedia di registri ekstensi Open VSX. -
RStudio
-
RStudio
RStudio menawarkan sumber daya komputasi cloud sesuai permintaan untuk mempercepat pengembangan model dan meningkatkan produktivitas. Anda dikenai biaya untuk tipe instans yang Anda pilih untuk menjalankan aplikasi RStudio Session dan aplikasi RStudio Server Pro.
Aplikasi RStudioServerPro
-
Instans Notebook
-
Instans Notebook
Instans notebook adalah instans komputasi yang menjalankan aplikasi notebook Jupyter. Anda dikenakan biaya untuk jenis instans yang Anda pilih, berdasarkan durasi penggunaan.
-
Pemrosesan
-
Amazon SageMaker Processing
Amazon SageMaker Processing memungkinkan Anda menjalankan beban kerja prapemrosesan, pascapemrosesan, dan evaluasi model dengan mudah pada infrastruktur terkelola penuh. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
-
TensorBoard
-
Amazon SageMaker dengan TensorBoard
Amazon SageMaker dengan TensorBoard memberikan pengalaman TensorBoard yang di-hosting untuk memvisualisasikan dan men-debug masalah konvergensi model untuk pekerjaan pelatihan Amazon SageMaker.
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler mengurangi waktu pengumpulan dan penyiapan data untuk machine learning dari minggu ke menit. Cukup bayar atas waktu yang digunakan untuk membersihkan, menjelajahi, dan memvisualisasikan data. Harga di bawah ini berlaku bagi pelanggan yang menjalankan instans SageMaker Data Wrangler.* Harga SageMaker Canvas berlaku bagi Pelanggan yang menjalankan SageMaker Data Wrangler di instans ruang kerja SageMaker Canvas. Lihat halaman harga SageMaker Canvas untuk detail selengkapnya.
Tugas Amazon SageMaker Data Wrangler
Tugas Amazon SageMaker Data Wrangler dibuat saat aliran data diekspor dari SageMaker Data Wrangler. Dengan tugas SageMaker Data Wrangler, Anda dapat mengotomatiskan alur kerja persiapan data Anda. Tugas SageMaker Data Wrangler membantu Anda menerapkan kembali alur kerja persiapan data pada set data baru untuk membantu menghemat waktu, dengan biaya per detik.
-
Tempat Penyimpanan Fitur
-
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store adalah repositori pusat untuk menyerap, menyimpan, dan melayani fitur-fitur machine learning. Anda dikenai biaya atas penulisan, pembacaan, dan penyimpanan data grup di SageMaker Feature Store, dengan harga yang berbeda untuk penyimpanan online standar dan penyimpanan online dalam memori.Untuk penyimpanan online standar, penyimpanan data dikenakan biaya per GB per bulan. Untuk throughput, Anda dapat memilih antara mode kapasitas sesuai permintaan atau disediakan. Untuk sesuai permintaan, penulisan dikenakan biaya sebagai unit permintaan tulis per KB dan pembacaan dikenakan biaya sebagai unit permintaan baca per 4 KB. Untuk mode kapasitas yang disediakan, Anda menentukan kapasitas baca dan tulis yang menurut Anda diperlukan oleh aplikasi. Sagemaker Feature Store mengenakan biaya satu WCU untuk setiap penulisan per detik (hingga 1 KB) dan satu RCU untuk setiap pembacaan per detik (hingga 4 KB). Anda akan dikenai biaya untuk kapasitas throughput (baca dan tulis) yang Anda sediakan untuk grup fitur, meskipun Anda tidak sepenuhnya memanfaatkan kapasitas yang disediakan.
Untuk penyimpanan online dalam memori, penulisan dikenakan biaya sebagai unit permintaan tulis per KB dengan minimum 1 unit per penulisan, pembacaan dikenakan biaya sebagai unit permintaan baca per KB dengan minimum 1 unit per pembacaan, dan penyimpanan data dikenakan biaya per GB per jam. Ada biaya penyimpanan data minimum sebesar 5 GiB (5,37 GB) per jam untuk penyimpanan online dalam memori.
-
Pelatihan
-
Pelatihan Amazon SageMaker
Amazon SageMaker memudahkan pelatihan model machine learning (ML) dengan menyediakan semua yang Anda butuhkan untuk melatih, menyetel, dan men-debug model. Anda akan ditagih atas penggunaan jenis instans yang Anda pilih. Saat Anda menggunakan Amazon SageMaker Debugger untuk men-debug masalah dan memantau sumber daya selama pelatihan, Anda dapat menggunakan aturan bawaan untuk men-debug tugas pelatihan Anda atau menulis aturan kustom Anda sendiri. Penggunaan aturan bawaan untuk men-debug tugas pelatihan Anda tidak dikenakan biaya. Untuk aturan kustom, Anda akan dikenakan biaya atas tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
-
MLflow
-
Amazon SageMaker dengan MLflow
Amazon SageMaker dengan MLflow memungkinkan pelanggan membayar hanya untuk apa yang digunakan. Pelanggan membayar Server Pelacakan MLflow berdasarkan biaya komputasi dan penyimpanan.
Pelanggan akan membayar komputasi berdasarkan ukuran Server Pelacakan dan jumlah jam berjalan. Selain itu, pelanggan akan membayar metadata apa pun yang disimpan di Server Pelacakan MLflow.
-
Inferensi Waktu Nyata
-
Hosting Amazon SageMaker: Inferensi Waktu Nyata
Amazon SageMaker memberikan inferensi waktu nyata untuk kasus penggunaan Anda yang memerlukan prediksi waktu nyata. Anda akan ditagih atas penggunaan jenis instans yang Anda pilih. Bila Anda menggunakan Amazon SageMaker Model Monitor untuk mempertahankan model akurasi tinggi yang menyediakan inferensi waktu nyata, Anda dapat menggunakan aturan bawaan untuk memantau model Anda atau menulis aturan kustom Anda sendiri. Untuk aturan internal, Anda mendapatkan hingga 30 jam pemantauan tanpa biaya. Biaya tambahan akan dihitung sesuai durasi penggunaan. Ada biaya terpisah bila menggunakan aturan kustom Anda sendiri.
-
Inferensi Asinkron
-
Inferensi Asinkron Amazon SageMaker:
Inferensi Asinkron Amazon SageMaker merupakan opsi inferensi mendekati waktu nyata yang mengantrekan permintaan masuk dan memprosesnya secara asinkron. Gunakan opsi ini saat Anda perlu memproses muatan besar ketika data datang atau menjalankan model yang memiliki waktu pemrosesan inferensi yang lama dan tidak memiliki persyaratan latensi sub-detik. Anda dikenakan biaya untuk jenis instans yang Anda pilih. -
Batch Transform
-
Batch Transform Amazon SageMaker
Dengan Batch Transform Amazon SageMaker, Anda tidak perlu merinci set data menjadi beberapa bagian atau mengelola titik akhir waktu nyata. Batch Transform SageMaker memungkinkan Anda menjalankan prediksi pada set data batch besar atau kecil. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.
-
Inferensi Nirserver
-
Amazon SageMaker Serverless Inference
Inferensi Nirserver Amazon SageMaker memungkinkan Anda melakukan deployment model machine learning untuk inferensi tanpa mengonfigurasi atau mengelola infrastruktur apa pun yang mendasarinya. Anda dapat menggunakan Inferensi Nirserver sesuai permintaan atau menambahkan Konkurensi yang Disediakan ke titik akhir Anda untuk performa yang dapat diprediksi.Dengan Inferensi Nirserver sesuai permintaan, Anda hanya membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Biaya komputasi bergantung pada konfigurasi memori yang Anda pilih.
Konkurensi yang DisediakanSecara opsional, Anda juga dapat mengaktifkan Konkurensi yang Disediakan untuk titik akhir nirserver. Konkurensi yang Disediakan memungkinkan Anda melakukan deployment model pada titik akhir nirserver dengan performa yang dapat diprediksi, dan skalabilitas tinggi dengan menjaga titik akhir Anda tetap hangat untuk sejumlah permintaan bersamaan dan waktu tertentu. Seperti pada Inferensi Nirserver sesuai permintaan, saat Konkurensi yang Disediakan diaktifkan, Anda membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Anda juga membayar penggunaan Konkurensi yang Disediakan, berdasarkan memori yang dikonfigurasi, durasi yang disediakan, dan jumlah konkurensi yang diaktifkan.
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart membantu Anda memulai dengan cepat dan mudah dengan machine learning menggunakan akses satu klik ke koleksi model populer (dikenal juga dengan “model zoo”). Jumpstart juga menawarkan solusi end-to-end yang akan menyelesaikan kasus penggunaan ML umum, yang dapat dikustomisasi sesuai kebutuhan Anda. Tidak ada biaya tambahan untuk penggunaan model atau solusi JumpStart. Anda akan dikenai biaya untuk penggunaan jam instans Pelatihan dan Inferensi dasar sama dengan apabila Anda membuatnya secara manual.
-
Profiler
-
Amazon SageMaker Profiler mengumpulkan data tingkat sistem untuk visualisasi plot jejak CPU dan GPU resolusi tinggi. Alat ini didesain untuk membantu ilmuwan dan rekayasawan data mengidentifikasi hambatan performa terkait perangkat keras dalam model deep learning mereka, sehingga dapat menghemat waktu dan biaya pelatihan secara keseluruhan. Saat ini SageMaker Profiler hanya mendukung pembuatan profil pekerjaan pelatihan yang memanfaatkan tipe instans komputasi pelatihan ml.g4dn.12xlarge, ml.p3dn.24xlarge, dan ml.p4d.24xlarge.
Wilayah: AS Timur (Ohio), AS Timur (Virginia Utara), AS Barat (Oregon), Eropa (Frankfurt), Eropa (Irlandia), dan Israel (Tel Aviv).Amazon SageMaker Profiler saat ini dalam versi pratinjau dan tersedia tanpa biaya bagi pelanggan di wilayah yang didukung.
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod dibuat khusus untuk mempercepat pengembangan model fondasi (FM). Agar pelatihan FM lebih tangguh, alat ini terus memantau kondisi klaster, memperbaiki dan mengganti simpul yang rusak dengan cepat, dan sering menyimpan titik pemeriksaan untuk melanjutkan pelatihan secara otomatis tanpa kehilangan progres. SageMaker HyperPod telah dikonfigurasi sebelumnya dengan pustaka pelatihan terdistribusi SageMaker yang memungkinkan Anda meningkatkan performa pelatihan FM sekaligus sepenuhnya memanfaatkan infrastruktur komputasi dan jaringan klasterCatatan: Harga SageMaker HyperPod tidak mencakup biaya layanan yang terhubung ke klaster HyperPod, seperti Amazon EKS, Amazon FSx for Lustre, dan Amazon Simple Storage Service (Amazon S3).
-
Optimisasi inferensi
-
Toolkit optimisasi inferensi memudahkan Anda menerapkan teknik optimisasi inferensi terbaru untuk mencapai performa biaya tercanggih (SOTA) di Amazon SageMaker, sekaligus menghemat waktu developer selama berbulan-bulan. Anda dapat memilih dari menu teknik optimisasi populer yang disediakan oleh SageMaker dan menjalankan tugas optimisasi terlebih dahulu, melakukan tolok ukur model untuk metrik performa dan akurasi, lalu melakukan deployment model yang dioptimalkan ke titik akhir SageMaker untuk inferensi.
Detail instans
Detail produk instans P5 Amazon SageMaker
Ukuran Instans | vCPU | Memori Instans (TiB) | Model GPU | GPU | Total memori GPU (GB) | Memori per GPU (GB) | Bandwidth Jaringan (Gbps) | RDMA GPUDirect | Peer to Peer GPU | Penyimpanan Instans (TB) | Bandwidth EBS (Gbps) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | Ya | 900 GB/s NVSwitch | 8x3.84 NVMe SSD | 80 |
Detail produk instans P4d Amazon SageMaker
Ukuran Instans | vCPU | Memori Instans (GiB) | Model GPU | GPU | Total memori GPU (GB) | Memori per GPU (GB) | Bandwidth Jaringan (Gbps) | RDMA GPUDirect | Peer to Peer GPU | Penyimpanan Instans (GB) | Bandwidth EBS (Gbps) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA DAN EFA | Ya | 600 GB/s NVSwitch | 8x1000 NVMe SSD | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA dan EFA | Ya | 600 GB/s NVSwitch | 8X1000 NVMe SSD | 19 |
Detail produk instans P3 Amazon SageMaker
Ukuran Instans | vCPU | Memori Instans (GiB) | Model GPU | GPU | Total memori GPU (GB) | Memori per GPU (GB) | Bandwidth Jaringan (Gbps) | Peer to Peer GPU | Penyimpanan Instans (GB) | Bandwidth EBS (Gbps) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | Hingga 10 | N/A | Hanya EBS | 1,5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | Hanya EBS | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | Hanya EBS | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900 NVMeSSD | 19 |
Detail produk instans P2 Amazon SageMaker
Ukuran Instans | vCPU | Memori Instans (GiB) | Model GPU | GPU | Total memori GPU (GB) | Memori per GPU (GB) | Bandwidth Jaringan (Gbps) | Bandwidth EBS (Gbps) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | Hingga 10 | Tinggi |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Detail produk instans G4 Amazon SageMaker
Ukuran Instans | vCPU | Memori Instans (GiB) | Model GPU | GPU | Total memori GPU (GB) | Memori per GPU (GB) | Bandwidth Jaringan (Gbps) | Penyimpanan Instans (GB) | Bandwidth EBS (Gbps) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | Hingga 25 | 1 x 125 NVMe SSD | Hingga 3,5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | Hingga 25 | 1 x 125 NVMe SSD | Hingga 3,5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | Hingga 25 | 1 x 125 NVMe SSD | 4,75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 NVMe SSD | 9,5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 NVMe SSD | 9,5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 NVMe SSD | 9,5 |
Detail produk instans G5 Amazon SageMaker
Ukuran Instans | vCPU | Memori Instans (GiB) | Model GPU | GPU | Total Memori GPU (GB) | Memori per GPU (GB) | Bandwidth Jaringan (Gbps) | Bandwidth EBS (Gbps) | Penyimpanan Instans (GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | Hingga 10 | Hingga 3,5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | Hingga 10 | Hingga 3,5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | Hingga 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
Detail produk instans Trn1 Amazon SageMaker
Ukuran Instans | vCPU | Memori (GiB) | Akselerator Trainium | Total Memori Akselerator (GB) | Memori per Akselerator (GB) | Penyimpanan Instans (GB) | Bandwidth Jaringan (Gbps) | Bandwidth EBS (Gbps) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 NVMe SSD | Hingga 12,5 | Hingga 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 NVMe SSD | 800 | 80 |
Detail produk instans Inf1 Amazon SageMaker
Ukuran Instans | vCPU | Memori (GiB) | Akselerator Inferentia | Total Memori Akselerator (GB) | Memori per Akselerator (GB) | Penyimpanan Instans | Interkoneksi antar akselerator | Bandwidth Jaringan (Gbps) | Bandwidth EBS (Gbps) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | Hanya EBS | N/A | Hingga 25 | Hingga 4,75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | Hanya EBS | N/A | Hingga 25 | Hingga 4,75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | Hanya EBS | Ya | 25 | 4,75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | Hanya EBS | ya | 100 | 19 |
Detail produk instans Inf2 Amazon SageMaker
Ukuran Instans | vCPU | Memori (GiB) | Akselerator Inferentia | Total Memori Akselerator (GB) | Memori per Akselerator (GB) | Penyimpanan Instans | Interkoneksi antar akselerator | Bandwidth Jaringan (Gbps) | Bandwidth EBS (Gbps) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | Hanya EBS | N/A | Hingga 25 | Hingga 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | Hanya EBS | N/A | Hingga 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | Hanya EBS | Ya | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | Hanya EBS | Ya | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio adalah antarmuka berbasis web tunggal untuk pengembangan ML lengkap, yang menawarkan pilihan lingkungan pengembangan terintegrasi (IDE) yang terkelola penuh dan alat yang dibuat khusus. Anda dapat mengakses SageMaker Studio secara gratis. Anda hanya akan dikenai biaya untuk komputasi dan penyimpanan dasar yang digunakan untuk IDE dan alat ML yang berbeda dalam SageMaker Studio.
Anda dapat menggunakan banyak layanan dari SageMaker Studio, AWS SDK for Python (Boto3), atau AWS Command Line Interface (AWS CLI), termasuk yang berikut ini:
- IDE di SageMaker Studio untuk melakukan pengembangan ML lengkap dengan rangkaian IDE yang terkelola penuh, termasuk JupyterLab, Code Editor berdasarkan Code-OSS (Kode Studio Visual – Sumber Terbuka), dan RStudio
- SageMaker Pipelines untuk mengotomatiskan dan mengelola alur kerja ML
- SageMaker Autopilot untuk membuat model ML dengan visibilitas penuh secara otomatis
- SageMaker Experiments untuk mengatur dan melacak tugas dan versi pelatihan Anda
- SageMaker Debugger untuk melakukan debug anomali selama pelatihan
- SageMaker Model Monitor untuk menjaga model agar tetap berkualitas tinggi
- SageMaker Clarify untuk menjelaskan model ML Anda dan mendeteksi bias dengan lebih baik
- SageMaker JumpStart untuk melakukan deployment solusi ML dengan mudah untuk banyak kasus penggunaan. Anda mungkin akan dikenai biaya untuk layanan AWS lain yang digunakan dalam solusi untuk panggilan API dasar yang dilakukan oleh Amazon SageMaker atas nama Anda.
- SageMaker Inference Recommender untuk mendapatkan rekomendasi konfigurasi titik akhir yang tepat
Anda hanya perlu membayar untuk sumber daya komputasi dan penyimpanan yang mendasari dalam SageMaker atau layanan AWS lainnya, berdasarkan penggunaan Anda.
Untuk menggunakan Amazon Q Developer Tingkat Gratis di Jupyter Lab dan Code Editor, ikuti instruksinya di sini. Untuk menggunakan Amazon Q Developer Pro di Jupyter Lab, Anda harus berlangganan Amazon Q Developer. Harga Amazon Q Developer tersedia di sini.
Evaluasi model fondasi
SageMaker Clarify mendukung evaluasi model dasar dengan metode evaluasi otomatis dan berbasis manusia. Masing-masing memiliki harga yang berbeda. Jika Anda mengevaluasi model dasar dari Amazon SageMaker JumpStart yang belum dilakukan deployment ke akun Anda, SageMaker akan melakukan deployment model JumpStart untuk sementara di instans SageMaker selama inferensi berlangsung. Instans spesifik akan sesuai dengan rekomendasi instans yang disediakan oleh JumpStart untuk model tersebut.
Evaluasi otomatis:
Evaluasi model dasar dijalankan sebagai tugas pemrosesan SageMaker. Pekerjaan evaluasi akan menginvokasi Inferensi SageMaker. Pelanggan dikenakan biaya untuk inferensi dan pekerjaan evaluasi. Pelanggan hanya dikenakan biaya selama pekerjaan evaluasi berlangsung. Biaya pekerjaan evaluasi adalah jumlah biaya per jam dari instans evaluasi dan jumlah biaya per jam dari instans hosting.
Evaluasi berbasis manusia:
Saat Anda menggunakan fitur evaluasi berbasis manusia tempat Anda membawa tenaga kerja Anda sendiri, Anda dikenakan biaya untuk tiga item: 1) instans SageMaker yang digunakan untuk inferensi, 2) instans yang digunakan untuk menjalankan Pekerjaan Pemrosesan SageMaker yang meng-host evaluasi manusia, dan 3 ) biaya sebesar 0,21 USD per tugas evaluasi manusia yang diselesaikan. Tugas manusia didefinisikan sebagai kejadian ketika pekerja manusia mengirimkan evaluasi atas satu perintah dan respons inferensi terkait di antarmuka pengguna evaluasi manusia. Harganya tetap sama baik Anda memiliki 1 maupun 2 model dalam pekerjaan evaluasi Anda atau Anda membawa inferensi Anda sendiri dan juga sama terlepas dari berapa banyak dimensi evaluasi dan metode penilaian yang Anda sertakan. Harga sebesar 0,21 USD per tugas sama untuk semua wilayah AWS. Tidak ada biaya terpisah untuk tenaga kerja, karena tenaga kerja tersebut disediakan oleh Anda.
Evaluasi yang dikelola AWS:
Untuk evaluasi ahli yang dikelola AWS, harga disesuaikan dengan kebutuhan evaluasi Anda dalam keterlibatan pribadi saat bekerja dengan tim evaluasi ahli AWS.
Amazon SageMaker Studio Lab
Anda dapat membuat dan melatih model ML menggunakan Amazon SageMaker Studio Lab secara gratis. SageMaker Studio Lab menawarkan developer, akademisi, dan ilmuwan data lingkungan pengembangan tanpa konfigurasi untuk belajar dan bereksperimen dengan ML tanpa biaya tambahan.
Amazon SageMaker Canvas
Amazon SageMaker Canvas memperluas akses ML dengan memberi analis bisnis kemampuan untuk menghasilkan prediksi ML yang akurat dengan menggunakan antarmuka point-and-click visual—tidak ada pengkodean atau pengalaman ML yang diperlukan.
Amazon SageMaker Data Labeling
Amazon SageMaker Data Labeling memberikan dua penawaran pelabelan data, yaitu Amazon SageMaker Ground Truth Plus dan Amazon SageMaker Ground Truth. Anda dapat mempelajari selengkapnya mengenai Amazon SageMaker Data Labeling, sebuah layanan pelabelan data terkelola penuh yang memudahkan pembangunan set data pelatihan yang sangat akurat untuk ML.
Pengujian bayangan Amazon SageMaker
SageMaker membantu Anda menjalankan pengujian bayangan untuk mengevaluasi model ML baru sebelum perilisan produk dengan menguji performanya melalui model yang dilakukan deployment baru-baru ini. Pengujian bayangan SageMaker tidak dikenakan biaya tambahan selain penggunaan biaya untuk instans ML dan penyimpanan ML yang disediakan untuk meng-hosting model bayangan. Harga instans ML dan dimensi penyimpanan ML sama seperti opsi inferensi waktu nyata yang ditentukan di tabel harga sebelumnya. Tidak ada biaya tambahan untuk data yang diproses masuk dan keluar dari deployment bayangan.
Amazon SageMaker Edge
Pelajari selengkapnya tentang harga Amazon SageMaker Edge untuk mengoptimalkan, menjalankan, dan memantau model ML di armada perangkat edge.
Amazon SageMaker Savings Plans
Savings Plans Amazon SageMaker membantu mengurangi biaya Anda hingga 64%. Paket secara otomatis berlaku untuk penggunaan instans SageMaker ML yang memenuhi syarat, termasuk notebook SageMaker Studio, instans notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference, dan SageMaker Batch Transform terlepas dari keluarga instans, ukuran, atau Wilayah. Misalnya, Anda dapat mengubah penggunaan dari instans CPU ml.c5.xlarge yang berjalan di AS Timur (Ohio) ke instans ml.Inf1 di AS Barat (Oregon) untuk beban kerja inferensi kapan saja dan secara otomatis terus membayar harga Savings Plans.
Total biaya kepemilikan (TCO) dengan Amazon SageMaker
Amazon SageMaker menawarkan total biaya kepemilikan (TCO) setidaknya 54% lebih rendah selama periode tiga tahun dibandingkan dengan solusi yang dikelola sendiri dan berbasis cloud lainnya. Pelajari selengkapnya tentang Analisis TCO untuk Amazon SageMaker.
Contoh harga
-
Contoh harga #1: JupyterLab
Sebagai ilmuwan data, Anda menghabiskan 20 hari menggunakan JupyterLab untuk eksperimen cepat pada notebook, kode, dan data selama 6 jam per hari pada instans ml.g4dn.xlarge. Anda membuat, lalu menjalankan ruang JupyterLab untuk mengakses IDE JupyterLab. Komputasi hanya dikenakan biaya untuk instans yang digunakan saat ruang JupyterLab sedang berjalan. Biaya penyimpanan untuk ruang JupyterLab akan terus bertambah hingga ruang tersebut dihapus.Komputasi
Instans Durasi Hari Durasi total Biaya per jam Total ml.g4dn.xlarge 6 jam 20 6 * 20 = 120 jam 0,7364 USD 88,368 USD Penyimpanan
Anda akan menggunakan penyimpanan Tujuan Umum SSD selama 480 jam (24 jam * 20 hari). Di Wilayah yang mengenakan biaya sebesar 0,1125 USD per GB-bulan:
0,112 USD per GB-bulan * 5 GB * 480 / (24 jam/hari * 30 hari kalender) = 0,373 USD -
Contoh harga #2: Code Editor
Sebagai rekayasawan ML, Anda menghabiskan 20 hari menggunakan Code Editor untuk mengedit, mengeksekusi, dan melakukan debug kode produksi ML selama 6 jam per hari pada instans ml.g4dn.xlarge. Anda membuat, lalu menjalankan ruang Code Editor untuk mengakses IDE Code Editor. Komputasi hanya dikenakan biaya untuk instans yang digunakan saat ruang Code Editor sedang berjalan. Biaya penyimpanan untuk ruang Code Editor akan terus bertambah hingga ruang tersebut dihapus.Komputasi
Instans Durasi Hari Durasi total Biaya per jam Total ml.g4dn.xlarge 6 jam 20 6 * 20 = 120 jam 0,7364 USD 88,368 USD Penyimpanan
Anda akan menggunakan penyimpanan Tujuan Umum SSD selama 480 jam (24 jam * 20 hari). Di Wilayah yang mengenakan biaya sebesar 0,1125 USD per GB-bulan:
0,112 USD per GB-bulan * 5 GB * 480 / (24 jam/hari * 30 hari kalender) = 0,373 USD
-
Contoh harga #3: Studio Classic
Seorang ilmuwan data akan melakukan urutan tindakan berikut saat menggunakan notebook di Amazon SageMaker Studio Classic.
- Membuka notebook 1 di kernel TensorFlow di instans ml.c5.xlarge, lalu bekerja di notebook ini selama 1 jam.
- Membuka notebook 2 di instans ml.c5.xlarge. Ini akan secara otomatis terbuka di instans ml.c5.xlarge yang sama yang menjalankan notebook 1.
- Bekerja di notebook 1 dan notebook 2 sekaligus selama 1 jam.
- Ilmuwan data akan ditagih untuk total dua (2) jam penggunaan ml.c5.xlarge. Untuk waktu tumpang tindih saat ia bekerja di notebook 1 dan notebook 2 secara bersamaan, tiap-tiap aplikasi kernel akan dihitung selama 0,5 jam dan ia akan dikenai tagihan untuk 1 jam.
Aplikasi kernel Instans notebook Jam Biaya per jam Total TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD Ilmu Data ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Contoh harga #4: RStudio
Seorang ilmuwan data menjalankan urutan tindakan berikut saat menggunakan RStudio:
- Meluncurkan RSession 1 pada instans ml.c5.xlarge, lalu bekerja di notebook ini selama 1 jam.
- Meluncurkan RSession 2 pada instans ml.c5.xlarge. Ini akan secara otomatis terbuka di instans ml.c5.xlarge yang sama yang menjalankan RSession 1.
- Bekerja pada RSesssion 1 dan RSession 2 secara bersamaan selama 1 jam.
- Ilmuwan data akan ditagih untuk total dua (2) jam penggunaan ml.c5.xlarge. Untuk jam yang tumpang tindih saat ia mengerjakan RSession 1 dan RSession 2 secara bersamaan, tiap-tiap aplikasi RSession akan diukur selama 0,5 jam dan ia akan dikenai biaya untuk 1 jam.
Sementara itu, RServer berjalan selama 24/7 terlepas dari apakah ada RSessions yang sedang berjalan atau tidak. Jika admin memilih “Kecil” (ml.t3.medium), maka tidak dikenai biaya. Jika admin memilih “Sedang” (ml.c5.4xlarge) atau “Besar” (ml.c5.9xlarge), maka biayanya akan dibebankan per jam sejauh RStudio diaktifkan untuk Domain SageMaker.
Aplikasi RSession Instans RSession Jam Biaya per jam Total Base R ml.c5.xlarge 1 0,204 USD 0,204 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Contoh harga #5: Processing
Amazon SageMaker Processing hanya mengenakan biaya untuk instans yang digunakan saat tugas Anda sedang berjalan. Ketika Anda menyediakan data input untuk pemrosesan di Amazon S3, Amazon SageMaker akan mengunduh data dari Amazon S3 ke penyimpanan file lokal di awal tugas pemrosesan.
Analis data akan menjalankan tugas pemrosesan untuk memproses dan memvalidasi data di dua instans ml.m5.4xlarge dengan durasi tugas selama 10 menit. Ia mengunggah set data sebesar 100 GB di S3 sebagai input untuk tugas pemrosesan, dan data output (yang ukurannya kurang lebih sama) akan disimpan kembali di S3.
Jam Instans pemrosesan Biaya per jam Total 1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD Penyimpanan Tujuan Umum (SSD) (GB) Biaya per jam Total 100 GB * 2 = 200 0,14 USD 0,0032 USD Subtotal untuk tugas Pemrosesan Amazon SageMaker = 0,308 USD.
Subtotal untuk 200 GB penyimpanan SSD tujuan umum = 0,0032 USD.
Total harga untuk contoh ini menjadi 0,3112 USD.
-
Contoh harga #6: Data Wrangler
Dari tabel tersebut, Anda menggunakan Amazon SageMaker Data Wrangler selama total 18 jam dalam 3 hari untuk menyiapkan data Anda. Selain itu, Anda membuat tugas SageMaker Data Wrangler untuk menyiapkan data yang diperbarui setiap minggu. Setiap tugas berlangsung selama 40 menit, dan tugas dijalankan setiap minggu selama satu bulan.
Total biaya bulanan atas penggunaan Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD
Aplikasi Instans SageMaker Studio Hari Durasi Durasi total Biaya per jam Subtotal biaya SageMaker Data Wrangler ml.m5.4xlarge 3 6 jam 18 jam 0,922 USD 16,596 USD Tugas SageMaker Data Wrangler ml.m5.4xlarge - 40 menit 2,67 jam 0,922 USD 2,461 USD Sebagai ilmuwan data, Anda memerlukan waktu tiga hari menggunakan Amazon SageMaker Data Wrangler untuk membersihkan, menjelajahi, dan memvisualisasikan data Anda dengan durasi selama 6 jam per hari. Untuk menjalankan pipeline persiapan data, Anda kemudian memulai tugas SageMaker Data Wrangler yang dijadwalkan berjalan setiap minggu.
Tabel di bawah ini merangkum total penggunaan Anda untuk bulan tersebut dan biaya terkait untuk menggunakan Amazon SageMaker Data Wrangler.
-
Contoh harga #7: Feature Store
++ Semua pecahan unit baca dibulatkan ke bilangan bulat berikutnya
Penyimpanan data
Total data yang disimpan = 31,5 GB
Biaya bulanan atas penyimpanan data = 31,5 GB * 0,45 USD = 14,175 USDTotal biaya bulanan atas Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD
Hari dalam bulan Total Tulis Total unit tulis Total Baca Total unit baca Hari 1 s/d 10 100.000 tulis
(10.000 tulis * 10 hari)2.500.000
(100.000 * 25 KB)100.000
(10.000 * 10 hari)700.000 ++
(100.000 * 25/4 KB)Hari 11 200.000 tulis 5.000.000
(200.000 * 25 KB)200.000 baca 1.400.000 ++
(200.000 * 25/4KB)Hari 12 s/d 30 1.520.000 tulis
(80.000 * 19 hari)38.000.000
(1.520.000 * 25 KB)1.520.000 tulis
(80.000 * 19 hari)10.640.000++
(1.520.000 * 25/4KB)Total unit yang dikenakan biaya 45.500.000 unit tulis 12.740.000 unit baca Biaya bulanan untuk tulis dan baca 56,875 USD
(45,5 juta unit tulis * 1,25 USD per juta tulis)3,185 USD
(12,74 juta unit baca * 0,25 USD per juta baca)Anda memiliki aplikasi web yang menerbitkan baca dan tulis, masing-masing sebesar 25 KB ke Amazon SageMaker Feature Store. Selama 10 hari pertama dalam sebulan, Anda akan menerima lalu lintas yang sedikit pada aplikasi, yang menghasilkan 10.000 tulis dan 10.000 baca setiap hari ke Tempat Penyimpanan Fitur SageMaker. Namun, pada hari ke-11 di bulan itu aplikasi Anda mencuri perhatian di media sosial, dan lalu lintas aplikasi melonjak menjadi 200.000 baca dan 200.000 tulis hari itu. Aplikasi Anda pun perlahan memiliki pola lalu lintas yang lebih teratur, rata-rata 80.000 baca dan 80.000 tulis setiap hari hingga akhir bulan.
Tabel di bawah ini merangkum total penggunaan Anda selama bulan tersebut dan biaya penggunaan Amazon SageMaker Feature Store.
-
Contoh harga #8: Pelatihan
Total biaya untuk pelatihan dan melakukan debug dalam contoh ini adalah 2,38 USD. Instans komputasi dan volume penyimpanan tujuan umum yang digunakan oleh aturan bawaan Amazon SageMaker Debugger tidak dikenakan biaya tambahan.
Penyimpanan tujuan umum (SSD) untuk pelatihan (GB) Penyimpanan tujuan umum (SSD) untuk aturan bawaan debugger (GB) Penyimpanan tujuan umum (SSD) untuk aturan kustom debugger (GB) Biaya per GB-bulan Subtotal Kapasitas yang digunakan 3 2 1 Biaya 0 USD Tidak ada biaya tambahan untuk volume penyimpanan aturan bawaan 0 USD 0,10 USD 0 USD Jam Instans pelatihan Instans debug Biaya per jam Subtotal 4 * 0,5 = 2,00 ml.m4.4xlarge n/a 0,96 USD 1,92 USD 4 * 0,5 * 2 = 4 n/a Tidak ada biaya tambahan untuk instans aturan built-in 0 USD 0 USD 4 * 0,5 = 2 ml.m5.xlarge n/a 0,23 USD 0,46 USD ------- 2,38 USD Seorang ilmuwan data telah menghabiskan waktu seminggu mengerjakan model untuk sebuah ide baru. Ia melatih model 4 kali di sebuah ml.m4.4xlarge selama 30 menit per pelatihan dengan Amazon SageMaker Debugger diaktifkan menggunakan 2 aturan built-in dan 1 aturan kustom yang ia tulis. Untuk aturan kustom, ia menentukan instans ml. m5.xlarge. Ia melatih menggunakan data pelatihan 3 GB di Amazon S3, dan menekan output model 1 GB ke dalam Amazon S3. SageMaker membuat volume SSD tujuan umum (gp2) untuk setiap instans pelatihan. SageMaker juga membuat volume SSD tujuan umum (gp2) untuk setiap aturan yang ditentukan. Dalam contoh ini, total 4 volume SSD tujuan umum (gp2) akan dibuat. SageMaker Debugger mengeluarkan 1 GB data debug ke bucket Amazon S3 pelanggan.
-
Contoh harga #9: MLflow
Anda memiliki dua tim ilmuwan data. Satu tim berisi 10 ilmuwan data dan tim lainnya berisi 40 ilmuwan data. Untuk mengakomodasi kedua tim ini, Anda memilih untuk mengaktifkan dua Server Pelacakan MLflow yang berbeda: satu Kecil dan satu Sedang. Setiap tim sedang melakukan eksperimen machine learning (ML) dan perlu mencatat metrik, parameter, dan artefak yang dihasilkan dari upaya pelatihan mereka. Mereka ingin menggunakan Server Pelacakan MLflow selama 160 jam per bulan. Dengan asumsi setiap tim Ilmu Data menyimpan 1 GB metadata untuk melacak proses dalam eksperimen. Tagihan pada akhir bulan akan dihitung sebagai berikut:
Biaya komputasi untuk Instans Kecil: 160 * 0,60 USD = 96 USD
Biaya komputasi untuk Instans Sedang: 160 * 1,40 USD = 166,4 USD
Biaya penyimpanan untuk dua tim: 2 * 1 * 0,10 = 0,20 USDTotal = 262,60 USD
-
Contoh harga #10: Inferensi waktu nyata
Subtotal untuk pelatihan, hosting, dan pemantauan = 305,827 USD. Subtotal untuk 3.100 MB data yang diproses Masuk dan 310 MB data yang diproses Keluar untuk Hosting per bulan = 0.054 USD. Total biaya untuk contoh ini adalah 305,881 USD per bulan.
Catatan, untuk aturan bawaan dengan instans ml.m5.xlarge, Anda akan mendapatkan hingga 30 jam pemantauan yang digabungkan di seluruh titik akhir setiap bulan, tanpa biaya.
Data Masuk per bulan - hosting Data Keluar per bulan - hosting Biaya per GB Masuk atau Keluar Total 100 MB * 31 = 3.100 MB 0,016 USD 0,0496 USD 10 MB * 31 = 310 MB 0,016 USD 0,00496 USD Jam per bulan Instans hosting Instans Model Monitor Biaya per jam Total 24 * 31 * 2 = 1488 ml.c5.xlarge 0,204 USD 303,522 USD 31*0,08 = 2,5 ml.m5.4xlarge 0,922 USD 2,305 USD Model dalam contoh #5 kemudian dilakukan deployment ke produksi pada dua (2) instans ml.c5.xlarge untuk melakukan host multi-AZ yang andal. Amazon SageMaker Model Monitor diaktifkan dengan satu (1) instans ml.m5.4xlarge dan tugas pemantauan dijadwalkan sekali per hari. Setiap tugas pemantauan memerlukan waktu 5 menit. Model akan menerima 100 MB data per hari, dan inferensi sebesar 1/10 dari ukuran data input.
-
Contoh harga #11: Asynchronous Inference
Subtotal untuk SageMaker Asynchronous Inference = 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Total biaya Inferensi Asinkron untuk contoh ini menjadi 16,38 USD per bulan.
Data Masuk per bulan Data Keluar per bulan Biaya per GB Masuk atau Keluar Total 10 KB * 1.024 * 31 = 310 MB 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048 Penyimpanan Tujuan Umum (SSD) (GB) Biaya per Gb-bulan Total 4 0,14 USD 0,56 USD Jam per bulan Instans hosting Biaya per jam Total 2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD Amazon SageMaker Asynchronous Inference mengenakan biaya untuk instans yang digunakan oleh titik akhir Anda. Saat sedang tidak secara aktif memproses permintaan, Anda dapat mengonfigurasi penskalaan otomatis untuk menskalakan jumlah instans ke nol guna menghemat biaya. Untuk muatan input di Amazon S3, tidak ada biaya untuk membaca data input dari Amazon S3 dan menulis data output ke S3 di Wilayah yang sama.
Model dalam Contoh #5 digunakan untuk menjalankan titik akhir Inferensi Asinkron SageMaker. Titik akhir dikonfigurasi untuk dijalankan pada 1 instans ml.c5.xlarge dan menurunkan skala jumlah instansnya ke nol saat tidak memproses permintaan secara aktif. Instans ml.c5.xlarge di titik akhir memiliki 4 GB penyimpanan tujuan umum (SSD) yang terpasang. Dalam contoh ini, titik akhir akan mempertahankan jumlah instans 1 selama 2 jam per hari dan memiliki periode pendinginan selama 30 menit setelah diskalakan turun ke jumlah instans nol untuk sisa hari itu. Oleh karena itu, Anda dikenai biaya penggunaan sebesar 2,5 jam per hari.
Titik akhir memproses 1.024 permintaan per hari. Ukuran untuk setiap isi permintaan/respons pemanggilan adalah 10 KB dan ukuran untuk setiap muatan permintaan inferensi di Amazon S3 adalah 100 MB. Output inferensi adalah sebesar 1/10 dari ukuran data input yang disimpan kembali di Amazon S3 di Wilayah yang sama. Dalam contoh ini, biaya pemrosesan data berlaku untuk isi permintaan dan respons, tetapi tidak untuk data yang ditransfer ke/dari Amazon S3.
-
Contoh harga #12: Transformasi Batch
Total biaya untuk inferensi dalam contoh ini adalah 2,88 USD.
Jam Instans hosting Biaya per jam Total 3 * 0,25 * 4 = 3 jam ml.m4.4xlarge 0,96 USD 2,88 USD Model dalam contoh #5 digunakan untuk menjalankan SageMaker Batch Transform. Ilmuwan data menjalankan empat tugas Batch Transform SageMaker yang berbeda di 3 ml.m4.4xlarge selama 15 menit per tugas yang dijalankan. Ia mengunggah set data evaluasi sebesar 1 GB di S3 untuk setiap proses, dan inferensi sebesar 1/10 dari ukuran data input yang disimpan kembali di S3.
-
Contoh harga #13: Inferensi Nirserver Sesuai Permintaan
Biaya proses data bulanan
Pemrosesan data (GB) Biaya per GB Masuk atau Keluar Biaya pemrosesan data bulanan 10 GB 0,016 USD 0,16 USD Subtotal untuk biaya durasi Inferensi Nirserver SageMaker sesuai permintaan = 40 USD. Subtotal untuk biaya pemrosesan data 10 GB = 0,16 USD. Total biaya untuk contoh ini adalah 40,16 USD.
Biaya komputasi bulanan
Jumlah permintaan Durasi setiap permintaan Durasi total inferensi (detik) Biaya per detik Biaya durasi inferensi bulanan 10 Juta 100 ms 1 Juta 0,00004 USD 40 USD
Dengan Inferensi Nirserver sesuai permintaan, Anda hanya membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Biaya komputasi bergantung pada konfigurasi memori yang Anda pilih.
Jika Anda mengalokasikan memori sebesar 2 GB untuk titik akhir, menjalankannya 10 juta kali dalam satu bulan dan berjalan selama 100 milidetik setiap waktu, serta memproses total 10 GB Data Masuk/Keluar, biaya Anda akan dihitung sebagai berikut:
-
Contoh harga #14: Konkurensi yang Disediakan di Inferensi Nirserver
Asumsikan Anda menjalankan layanan chat-bot untuk perusahaan pemrosesan penggajian. Anda memperkirakan lonjakan pertanyaan pelanggan pada akhir Maret, sebelum batas waktu pengajuan pajak. Namun, untuk sisa bulan ini, lalu lintas diperkirakan akan rendah. Jadi, Anda melakukan deployment titik akhir nirserver dengan memori 2 GB dan menambahkan Konkurensi yang Tersedia sebanyak 100 selama 5 hari terakhir dalam sebulan pada pukul 9 pagi - 5 sore (8 jam), tempat titik akhir Anda memproses 10 juta permintaan dan total 10 GB Data Masuk/Keluar. Selama sisa bulan ini, chatbot berjalan pada Inferensi Nirserver sesuai permintaan dan memproses 3 juta permintaan dan 3 GB Data Masuk/Keluar. Misalnya, durasi setiap permintaan adalah 100 milidetik.
Biaya Konkurensi yang Tersedia (PC)
Harga PC adalah 0,000010 USD/detik
Durasi penggunaan PC (detik) = 5 hari x 100 PC x 8 jam x 3.600 detik = 14.400.000 detik
Biaya penggunaan PC = 14.400.000 detik x 0,000010 USD/detik = 144 USD.Biaya durasi inferensi untuk lalu lintas yang dilayani oleh Konkurensi yang Tersedia
Harga durasi inferensi adalah 0,000023 USD/detik
Total durasi Inferensi untuk PC (detik) = 10 juta x (100 milidetik) /1.000 = 1 juta detik.
Biaya durasi inferensi untuk PC = 1.000.000 detik x 0,000023 USD/detik = 23 USDBiaya durasi inferensi sesuai permintaan
Harga komputasi bulanan adalah 0,00004 USD/detik dan tingkat gratis menyediakan 150 ribu detik.
Total komputasi (detik) = (3) juta x (100 milidetik) /1.000 = 0,3 juta detik.
Total komputasi – Komputasi tingkat gratis = Komputasi tertagih bulanan dalam satuan detik
0,3 juta detik – 150 ribu detik = 150 ribu detik
Biaya komputasi bulanan = 150 ribu x 0,00004 USD = 6 USDPemrosesan Data
Biaya/GB Data Diproses Masuk/Keluar = 0,016 USD
Total GB yang diproses = 10+3 = 13
Total Biaya = 0,016 USD x 13 = 0,208 USD
Total biaya untuk bulan Maret
Total biaya = Biaya Konkurensi yang Tersedia + Durasi inferensi untuk Konkurensi yang Tersedia + Durasi inferensi untuk komputasi sesuai permintaan + Biaya Pemrosesan Data
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD -
Contoh harga #15: JumpStart
Pelanggan menggunakan JumpStart untuk melakukan deployment model BERT Base Uncased yang dilatih sebelumnya untuk mengklasifikasikan sentimen ulasan pelanggan sebagai positif atau negatif.
Pelanggan melakukan deployment model tersebut ke dua (2) instans ml.c5.xlarge untuk hosting multi-AZ yang tepercaya. Model akan menerima 100 MB data per hari, dan inferensi sebesar 1/10 dari ukuran data input.
Jam per bulan Instans hosting Biaya per jam Total 24 * 31 * 2 = 1488 ml.c5.xlarge 0,204 USD 303,55 USD Data Masuk per bulan - Hosting Data Keluar per bulan - Hosting Biaya per GB Masuk atau Keluar
Total
100 MB * 31 = 3.100 MB 0,02 USD 0,06 USD 10 MB * 31 = 310 MB 0,02 USD 0,01 USD Subtotal untuk pelatihan, hosting, dan pemantauan = 305,827 USD. Subtotal untuk 3.100 MB data yang diproses Masuk dan 310 MB data yang diproses Keluar untuk Hosting per bulan = 0,06 USD. Total biaya untuk contoh ini adalah 305,887 USD per bulan.
-
Contoh harga #16: Klaster HyperPod
Misalnya, Anda ingin menyediakan klaster 4 ml.g5.24xlarge selama 1 bulan (30 hari) dengan tambahan penyimpanan 100 GB per instans untuk mendukung pengembangan model. Total biaya untuk klaster dan penyimpanan tambahan dalam contoh ini adalah 29.374,40 USD.Komputasi
Instans Durasi Instans Biaya per jam Subtotal ml.g5.24xlarge 30 hari * 24 jam = 720 jam 4 10,18 USD 29.318,40 USD Penyimpanan
Penyimpanan tujuan umum (SSD) Durasi Instans Biaya per GB-bulan Subtotal 100 GB 30 hari * 24 jam = 720 jam 4 0,14 USD 56,00 USD -
Contoh Harga #17: Evaluasi model fondasi (evaluasi otomatis)
Evaluasi model dasar dengan SageMaker Clarify hanya membebankan biaya kepada Anda untuk instans yang digunakan saat tugas evaluasi otomatis Anda berjalan. Saat Anda memilih tugas dan set data evaluasi otomatis, SageMaker memuat set data perintah dari Amazon S3 ke instans evaluasi SageMaker.
Dalam contoh berikut, seorang rekayasawan ML menjalankan evaluasi model Llama2 7B di AS Timur (Virginia Utara) untuk akurasi tugas peringkasan. Tipe instans yang direkomendasikan untuk inferensi Llama 2 7B adalah ml.g5.2xlarge. Instans minimum yang direkomendasikan untuk evaluasi adalah ml.m5.2xlarge. Dalam contoh ini, pekerjaan berjalan selama 45 menit (bergantung pada ukuran set data). Dalam contoh ini, biayanya adalah 1,48 USD untuk pekerjaan evaluasi dan hasil terperinci.Jam Kerja Pemrosesan (contoh)
Wilayah
Tipe Instans
Instans
Biaya per jam
Biaya
0,45
US-east-1
Hosting LLM
ml.g5.2xlarge
1,52 USD
1,14 USD
0,45
US-east-1
evaluasi
ml.m5.2xlarge
0,46 USD
0,35 USD
Total
1,48 USD
Dalam contoh berikutnya, rekayasawan yang sama di Virginia menjalankan pekerjaan evaluasi lain untuk akurasi tugas peringkasan, tetapi menggunakan versi Llama 2 7B yang disesuaikan yang dilakukan deployment ke akun mereka dan aktif serta berjalan. Dalam kasus ini, karena model telah dilakukan deployment ke akun mereka, satu-satunya biaya tambahan adalah untuk instans evaluasi.
Jam Kerja Pemrosesan
Wilayah
Tipe Instans
Instans
Biaya per jam
Biaya
0,45
US-east-1
evaluasi
ml.m5.2xlarge
0,46 USD
0,35 USD
Total
0,35 USD
-
Contoh Harga #18: Evaluasi model dasar (evaluasi berbasis manusia)
Dalam contoh berikut, seorang rekayasawan machine learning di AS Timur (Virginia Utara) menjalankan evaluasi Llama-2-7B berbasis manusia untuk akurasi tugas peringkasan dan menggunakan tenaga kerja privat mereka untuk melakukan evaluasi. Tipe instans yang direkomendasikan untuk Llama-2-7B adalah ml.g5.2xlarge. Instans minimum yang direkomendasikan untuk Pekerjaan Pemrosesan evaluasi berbasis manusia adalah ml.t3.medium. Inferensi di Llama-2-7B berjalan selama 45 menit (bergantung ukuran set data). Set data berisi 50 perintah, dan developer memerlukan 2 pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam evaluasi pembuatan tugas sebagai parameter “pekerja per perintah”). Akan ada 100 tugas dalam pekerjaan evaluasi ini (1 tugas untuk setiap pasangan respons perintah per setiap pekerja: 2 pekerja x 50 rangkaian respons perintah = 100 tugas manusia). Tenaga kerja manusia membutuhkan waktu satu hari (24 jam) untuk menyelesaikan 100 tugas evaluasi manusia dalam pekerjaan evaluasi (bergantung jumlah dan tingkat keterampilan pekerja, serta panjang/kompleksitas perintah dan respons inferensi).
Jam Komputasi
Tugas manusia
Wilayah
Tipe Instans
Instans
Biaya per jam
Biaya per tugas manusia
Total Biaya
0,45
AS Timur (Virginia Utara)
Hosting LLM
ml.g5.2xlarge
1,52 USD
1,14 USD
24
AS Timur (Virginia Utara)
Pekerjaan Pemrosesan
ml.t3.medium
0,05 USD
1,20 USD
100
Apa saja
0,21 USD
21,00 USD
Total
23,34 USD
Pada contoh berikutnya, rekayasawan yang sama di AS Timur (Virginia Utara) menjalankan pekerjaan evaluasi yang sama, tetapi menggunakan Llama-2-7B yang sudah dilakukan deployment ke akun mereka dan aktif serta berjalan. Dalam hal ini, satu-satunya biaya tambahan adalah untuk pekerjaan pemrosesan evaluasi dan tugas manusia.
Jam Komputasi
Tugas manusia
Wilayah
Tipe Instans
Instans
Biaya per jam
Biaya per tugas manusia
Total Biaya
24
AS Timur (Virginia Utara)
Pekerjaan Pemrosesan
ml.t3.medium
0,05 USD
1,20 USD
100
Apa saja
0,21 USD
21,00 USD
Total
22,20 USD