Amazon SageMaker membantu ilmuwan data dan developer menyiapkan, membangun, melatih, serta melakukan deployment model machine learning (ML) berkualitas tinggi secara cepat dengan menggabungkan set kemampuan luas yang dibangun dengan tujuan khusus untuk ML. SageMaker mendukung kerangka kerja, kit alat, dan bahasa pemrograman ML yang terkemuka.

Dengan SageMaker, Anda hanya membayar apa yang Anda gunakan. Anda memiliki dua pilihan pembayaran, yaitu: pertama, Harga Sesuai Permintaan tanpa biaya minimum serta komitmen di muka dan kedua, SageMaker Savings Plans yang menawarkan model harga berbasis penggunaan yang fleksibel sebagai ganti dari komitmen untuk jumlah penggunaan yang konsisten.

Amazon SageMaker Tingkat Gratis

Amazon SageMaker dapat dicoba secara gratis. Sebagai bagian dari AWS Tingkat Gratis, Anda dapat memulai Amazon SageMaker secara gratis. Tingkat gratis Anda dimulai dari bulan pertama saat Anda membuat sumber daya SageMaker pertama Anda. Detail dari tingkat gratis untuk Amazon SageMaker ada di tabel berikut ini.

Kapabilitas Amazon SageMaker Penggunaan Tingkat Gratis per bulan untuk 2 bulan pertama
Notebook studio, dan instans notebook 250 jam instans ml.t3.medium pada notebook Studio ATAU 250 jam instans ml.t2 atau instans ml.t3.medium pada instans notebook
RStudio di SageMaker 250 jam instans ml.t3.medium di aplikasi RSession DAN gratis instans ml.t3.medium untuk aplikasi RStudioServerPro
Data Wrangler 25 jam instans ml.m5.4xlarge
Tempat Penyimpanan Fitur 10 juta unit tulis, 10 juta unit baca, 25 GB penyimpanan (penyimpanan online standar)
Pelatihan 50 jam instans m4.xlarge atau m5.xlarge
Amazon SageMaker dengan TensorBoard 300 jam instans ml.r5.large
Inferensi Waktu Nyata 125 jam instans m4.xlarge atau m5.xlarge
Inferensi Nirserver 150.000 detik durasi inferensi sesuai permintaan
Canvas 160 jam/bulan untuk waktu sesi
HyperPod 50 jam instans m5.xlarge
  Penggunaan Tingkat Gratis per bulan selama 6 bulan pertama
Experiments
100.000 catatan metrik diserap per bulan, 1 juta catatan metrik diambil per bulan, dan 100.000 catatan metrik disimpan per bulan

Harga Sesuai Permintaan

  • Studio Classic
  • Amazon SageMaker Studio Classic
    Studio Classic menawarkan notebook Jupyter satu langkah dalam pengalaman IDE warisan kami. Sumber daya komputasi dasarnya sepenuhnya elastis dan notebook dapat dengan mudah dibagikan dengan orang lain sehingga memungkinkan adanya kolaborasi tanpa hambatan. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.

  • JupyterLab
  • Amazon SageMaker JupyterLab
    Luncurkan JupyterLab terkelola penuh dalam hitungan detik. Gunakan lingkungan pengembangan interaktif berbasis web terbaru untuk notebook, kode, dan data. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.

  • Code Editor
  • Amazon SageMaker Code Editor
    Code Editor, berdasarkan Code-OSS (Kode Studio Visual – Sumber Terbuka), memungkinkan Anda untuk menulis, menguji, melakukan debug, serta menjalankan analitik dan kode ML Anda. Code Editor sepenuhnya terintegrasi dengan SageMaker Studio dan mendukung ekstensi IDE yang tersedia di registri ekstensi Open VSX.

  • RStudio
  • RStudio
    RStudio menawarkan sumber daya komputasi cloud sesuai permintaan untuk mempercepat pengembangan model dan meningkatkan produktivitas. Anda dikenai biaya untuk tipe instans yang Anda pilih untuk menjalankan aplikasi RStudio Session dan aplikasi RStudio Server Pro.

    Aplikasi RStudioServerPro

  • Instans Notebook
  • Instans Notebook
    Instans notebook adalah instans komputasi yang menjalankan aplikasi notebook Jupyter. Anda dikenakan biaya untuk jenis instans yang Anda pilih, berdasarkan durasi penggunaan.

  • Pemrosesan
  • Amazon SageMaker Processing
    Amazon SageMaker Processing memungkinkan Anda menjalankan beban kerja prapemrosesan, pascapemrosesan, dan evaluasi model dengan mudah pada infrastruktur terkelola penuh. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.

  • TensorBoard
  • Amazon SageMaker dengan TensorBoard
    Amazon SageMaker dengan TensorBoard memberikan pengalaman TensorBoard yang di-hosting untuk memvisualisasikan dan men-debug masalah konvergensi model untuk pekerjaan pelatihan Amazon SageMaker.

  • Data Wrangler
  • Amazon SageMaker Data Wrangler

    Amazon SageMaker Data Wrangler mengurangi waktu pengumpulan dan penyiapan data untuk machine learning dari minggu ke menit. Cukup bayar atas waktu yang digunakan untuk membersihkan, menjelajahi, dan memvisualisasikan data. Harga di bawah ini berlaku bagi pelanggan yang menjalankan instans SageMaker Data Wrangler.* Harga SageMaker Canvas berlaku bagi Pelanggan yang menjalankan SageMaker Data Wrangler di instans ruang kerja SageMaker Canvas. Lihat halaman harga SageMaker Canvas untuk detail selengkapnya.

    Tugas Amazon SageMaker Data Wrangler

    Tugas Amazon SageMaker Data Wrangler dibuat saat aliran data diekspor dari SageMaker Data Wrangler. Dengan tugas SageMaker Data Wrangler, Anda dapat mengotomatiskan alur kerja persiapan data Anda. Tugas SageMaker Data Wrangler membantu Anda menerapkan kembali alur kerja persiapan data pada set data baru untuk membantu menghemat waktu, dengan biaya per detik.

  • Tempat Penyimpanan Fitur
  • Amazon SageMaker Feature Store
    Amazon SageMaker Feature Store adalah repositori pusat untuk menyerap, menyimpan, dan melayani fitur-fitur machine learning. Anda dikenai biaya atas penulisan, pembacaan, dan penyimpanan data grup di SageMaker Feature Store, dengan harga yang berbeda untuk penyimpanan online standar dan penyimpanan online dalam memori.

     Untuk penyimpanan online standar, penyimpanan data dikenakan biaya per GB per bulan. Untuk throughput, Anda dapat memilih antara mode kapasitas sesuai permintaan atau disediakan. Untuk sesuai permintaan, penulisan dikenakan biaya sebagai unit permintaan tulis per KB dan pembacaan dikenakan biaya sebagai unit permintaan baca per 4 KB. Untuk mode kapasitas yang disediakan, Anda menentukan kapasitas baca dan tulis yang menurut Anda diperlukan oleh aplikasi. Sagemaker Feature Store mengenakan biaya satu WCU untuk setiap penulisan per detik (hingga 1 KB) dan satu RCU untuk setiap pembacaan per detik (hingga 4 KB). Anda akan dikenai biaya untuk kapasitas throughput (baca dan tulis) yang Anda sediakan untuk grup fitur, meskipun Anda tidak sepenuhnya memanfaatkan kapasitas yang disediakan.

    Untuk penyimpanan online dalam memori, penulisan dikenakan biaya sebagai unit permintaan tulis per KB dengan minimum 1 unit per penulisan, pembacaan dikenakan biaya sebagai unit permintaan baca per KB dengan minimum 1 unit per pembacaan, dan penyimpanan data dikenakan biaya per GB per jam. Ada biaya penyimpanan data minimum sebesar 5 GiB (5,37 GB) per jam untuk penyimpanan online dalam memori.

  • Pelatihan
  • Pelatihan Amazon SageMaker
    Amazon SageMaker memudahkan pelatihan model machine learning (ML) dengan menyediakan semua yang Anda butuhkan untuk melatih, menyetel, dan men-debug model. Anda akan ditagih atas penggunaan jenis instans yang Anda pilih. Saat Anda menggunakan Amazon SageMaker Debugger untuk men-debug masalah dan memantau sumber daya selama pelatihan, Anda dapat menggunakan aturan bawaan untuk men-debug tugas pelatihan Anda atau menulis aturan kustom Anda sendiri. Penggunaan aturan bawaan untuk men-debug tugas pelatihan Anda tidak dikenakan biaya. Untuk aturan kustom, Anda akan dikenakan biaya atas tipe instans yang Anda pilih, berdasarkan durasi penggunaan.

  • Experiments
  • Amazon SageMaker Experiments
    Amazon SageMaker Experiments memungkinkan Anda mengelola, melacak, dan membandingkan eksperimen ML Anda. Anda dikenai biaya untuk penyerapan, pengambilan, dan penyimpanan catatan metrik. Data metrik adalah pasangan kunci/nilai dari data metrik. Penyerapan dan pengambilan dikenai biaya berdasarkan jumlah catatan metrik. Penyimpanan dikenakan biaya berdasarkan jumlah catatan metrik yang disimpan per bulan. Anda dapat menggunakan SageMaker Studio untuk memvisualisasikan eksperimen Anda tanpa biaya tambahan.

     

    Jenis Penagihan Harga
    Penyerapan 1,25 USD per juta catatan metrik
    Pengambilan 0,25 USD per juta catatan metrik
    Penyimpanan 0,25 USD per juta catatan metrik - bulan

     

  • Inferensi Waktu Nyata
  • Hosting Amazon SageMaker: Inferensi Waktu Nyata
    Amazon SageMaker memberikan inferensi waktu nyata untuk kasus penggunaan Anda yang memerlukan prediksi waktu nyata. Anda akan ditagih atas penggunaan jenis instans yang Anda pilih. Bila Anda menggunakan Amazon SageMaker Model Monitor untuk mempertahankan model akurasi tinggi yang menyediakan inferensi waktu nyata, Anda dapat menggunakan aturan bawaan untuk memantau model Anda atau menulis aturan kustom Anda sendiri. Untuk aturan internal, Anda mendapatkan hingga 30 jam pemantauan tanpa biaya. Biaya tambahan akan dihitung sesuai durasi penggunaan. Ada biaya terpisah bila menggunakan aturan kustom Anda sendiri.

  • Inferensi Asinkron
  • Inferensi Asinkron Amazon SageMaker:
    Inferensi Asinkron Amazon SageMaker merupakan opsi inferensi mendekati waktu nyata yang mengantrekan permintaan masuk dan memprosesnya secara asinkron. Gunakan opsi ini saat Anda perlu memproses muatan besar ketika data datang atau menjalankan model yang memiliki waktu pemrosesan inferensi yang lama dan tidak memiliki persyaratan latensi sub-detik. Anda dikenakan biaya untuk jenis instans yang Anda pilih.

  • Batch Transform
  • Batch Transform Amazon SageMaker
    Dengan Batch Transform Amazon SageMaker, Anda tidak perlu merinci set data menjadi beberapa bagian atau mengelola titik akhir waktu nyata. Batch Transform SageMaker memungkinkan Anda menjalankan prediksi pada set data batch besar atau kecil. Anda akan dikenai biaya untuk tipe instans yang Anda pilih, berdasarkan durasi penggunaan.

  • Inferensi Nirserver
  • Amazon SageMaker Serverless Inference
    Inferensi Nirserver Amazon SageMaker memungkinkan Anda melakukan deployment model machine learning untuk inferensi tanpa mengonfigurasi atau mengelola infrastruktur apa pun yang mendasarinya. Anda dapat menggunakan Inferensi Nirserver sesuai permintaan atau menambahkan Konkurensi yang Disediakan ke titik akhir Anda untuk performa yang dapat diprediksi.

    Dengan Inferensi Nirserver sesuai permintaan, Anda hanya membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Biaya komputasi bergantung pada konfigurasi memori yang Anda pilih.

    Konkurensi yang Disediakan

    Secara opsional, Anda juga dapat mengaktifkan Konkurensi yang Disediakan untuk titik akhir nirserver. Konkurensi yang Disediakan memungkinkan Anda melakukan deployment model pada titik akhir nirserver dengan performa yang dapat diprediksi, dan skalabilitas tinggi dengan menjaga titik akhir Anda tetap hangat untuk sejumlah permintaan bersamaan dan waktu tertentu. Seperti pada Inferensi Nirserver sesuai permintaan, saat Konkurensi yang Disediakan diaktifkan, Anda membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Anda juga membayar penggunaan Konkurensi yang Disediakan, berdasarkan memori yang dikonfigurasi, durasi yang disediakan, dan jumlah konkurensi yang diaktifkan.

  • JumpStart
  • Amazon SageMaker JumpStart
    Amazon SageMaker JumpStart membantu Anda memulai dengan cepat dan mudah dengan machine learning menggunakan akses satu klik ke koleksi model populer (dikenal juga dengan “model zoo”). Jumpstart juga menawarkan solusi end-to-end yang akan menyelesaikan kasus penggunaan ML umum, yang dapat dikustomisasi sesuai kebutuhan Anda. Tidak ada biaya tambahan untuk penggunaan model atau solusi JumpStart. Anda akan dikenai biaya untuk penggunaan jam instans Pelatihan dan Inferensi dasar sama dengan apabila Anda membuatnya secara manual.

  • Profiler
  • Amazon SageMaker Profiler mengumpulkan data tingkat sistem untuk visualisasi plot jejak CPU dan GPU resolusi tinggi. Alat ini didesain untuk membantu ilmuwan dan rekayasawan data mengidentifikasi hambatan performa terkait perangkat keras dalam model deep learning mereka, sehingga dapat menghemat waktu dan biaya pelatihan secara keseluruhan. Saat ini SageMaker Profiler hanya mendukung pembuatan profil pekerjaan pelatihan yang memanfaatkan tipe instans komputasi pelatihan ml.g4dn.12xlarge, ml.p3dn.24xlarge, dan ml.p4d.24xlarge.

    Wilayah: AS Timur (Ohio), AS Timur (Virginia Utara), AS Barat (Oregon), Eropa (Frankfurt), Eropa (Irlandia), dan Israel (Tel Aviv).

    Amazon SageMaker Profiler saat ini dalam versi pratinjau dan tersedia tanpa biaya bagi pelanggan di wilayah yang didukung. 

  • HyperPod
  • Amazon SageMaker HyperPod
    Amazon SageMaker HyperPod dibuat khusus untuk mempercepat pengembangan model fondasi (FM). Agar pelatihan FM lebih tangguh, alat ini terus memantau kondisi klaster, memperbaiki dan mengganti simpul yang rusak dengan cepat, dan sering menyimpan titik pemeriksaan untuk melanjutkan pelatihan secara otomatis tanpa kehilangan progres. SageMaker HyperPod telah dikonfigurasi sebelumnya dengan pustaka pelatihan terdistribusi SageMaker yang memungkinkan Anda meningkatkan performa pelatihan FM sekaligus sepenuhnya memanfaatkan infrastruktur komputasi dan jaringan klaster

Detail instans

Detail produk instans P5 Amazon SageMaker

Ukuran Instans vCPU Memori Instans (TiB) Model GPU GPU Total memori GPU (GB) Memori per GPU (GB) Bandwidth Jaringan (Gbps) RDMA GPUDirect Peer to Peer GPU Penyimpanan Instans (TB) Bandwidth EBS (Gbps)
ml.p5.48xlarge 192 2 NVIDIA H100 8 640 HBM3 80 3200 EFAv2   Ya 900 GB/s NVSwitch   8x3.84 NVMe SSD 80

Detail produk instans P4d Amazon SageMaker

Ukuran Instans vCPU Memori Instans (GiB) Model GPU GPU Total memori GPU (GB) Memori per GPU (GB) Bandwidth Jaringan (Gbps) RDMA GPUDirect Peer to Peer GPU Penyimpanan Instans (GB) Bandwidth EBS (Gbps)
ml.p4d.24xlarge 96 1152 NVIDIA A100 8 320 HBM 2 40 400 ENA DAN EFA Ya 600 GB/s NVSwitch 8x1000 NVMe SSD 19
ml.p4de.24xlarge 96 1152 NVIDIA A100 8 640 HNM2e 80 400 ENA dan EFA Ya 600 GB/s NVSwitch 8X1000 NVMe SSD 19

Detail produk instans P3 Amazon SageMaker

Ukuran Instans vCPU Memori Instans (GiB) Model GPU GPU Total memori GPU (GB) Memori per GPU (GB) Bandwidth Jaringan (Gbps) Peer to Peer GPU Penyimpanan Instans (GB) Bandwidth EBS (Gbps)
ml.p3.2xlarge 8 61 NVIDIA V100 1 16 16 Hingga 10 N/A Hanya EBS 1,5
ml.p3.8xlarge 32 244 NVIDIA V100 4 64 16 10 NVLink Hanya EBS 7
ml.p3.16xlarge 64 488 NVIDIA V100 8 128 16 25 NVLink Hanya EBS 14
ml.p3dn.24xlarge 96 768 NVIDIA V100 8 256 32 100 NVLink 2 x 900 NVMeSSD 19

Detail produk instans P2 Amazon SageMaker

Ukuran Instans vCPU Memori Instans (GiB) Model GPU GPU Total memori GPU (GB) Memori per GPU (GB) Bandwidth Jaringan (Gbps) Bandwidth EBS (Gbps)
ml.p2.xlarge 4 61 NVIDIA K80 1 12 12 Hingga 10 Tinggi
ml.p2.8xlarge 32 488 NVIDIA K80 8 96 12 10 10
ml.p2.16xlarge 64 732 NVIDIA K80 16 192 12 25 20

Detail produk instans G4 Amazon SageMaker

Ukuran Instans vCPU Memori Instans (GiB) Model GPU GPU Total memori GPU (GB) Memori per GPU (GB) Bandwidth Jaringan (Gbps) Penyimpanan Instans (GB) Bandwidth EBS (Gbps)
ml.g4dn.xlarge 4 16 NVIDIA T4 1 16 16 Hingga 25 1 x 125 NVMe SSD Hingga 3,5
ml.g4dn.2xlarge 8 32 NVIDIA T4 1 16 16 Hingga 25 1 x 125 NVMe SSD Hingga 3,5
ml.g4dn.4xlarge 16 64 NVIDIA T4 1 16 16 Hingga 25 1 x 125 NVMe SSD 4,75
ml.g4dn.8xlarge 32 128 NVIDIA T4 1 16 16 50 1 x 900 NVMe SSD 9,5
ml.g4dn.16xlarge 64 256 NVIDIA T4 1 16 16 50 1 x 900 NVMe SSD 9,5
ml.g4dn.12xlarge 48 192 NVIDIA T4 4 64 16 50 1 x 900 NVMe SSD 9,5

Detail produk instans G5 Amazon SageMaker

Ukuran Instans vCPU Memori Instans (GiB) Model GPU GPU Total Memori GPU (GB) Memori per GPU (GB) Bandwidth Jaringan (Gbps) Bandwidth EBS (Gbps) Penyimpanan Instans (GB)
ml.g5n.xlarge 4 16 NVIDIA A10G 1 24 24 Hingga 10 Hingga 3,5 1x250
ml.g5.2xlarge 8 32 NVIDIA A10G 1 24 24 Hingga 10 Hingga 3,5 1x450
ml.g5.4xlarge 16 64 NVIDIA A10G 1 24 24 Hingga 25 8 1x600
ml.g5.8xlarge 32 128 NVIDIA A10G 1 24 24 25 16 1x900
ml.g5.16xlarge 64 256 NVIDIA A10G 1 24 24 25 16 1x1900
ml.g5.12xlarge 48 192 NVIDIA A10G 4 96 24 40 16 1x3800
ml.g5.24xlarge 96 384 NVIDIA A10G 4 96 24 50 19 1x3800
ml.g5.48xlarge 192 768 NVIDIA A10G 8 192 24 100 19 2x3800

Detail produk instans Trn1 Amazon SageMaker

Ukuran Instans vCPU Memori (GiB) Akselerator Trainium Total Memori Akselerator (GB) Memori per Akselerator (GB) Penyimpanan Instans (GB) Bandwidth Jaringan (Gbps) Bandwidth EBS (Gbps)
ml.trn1.2xlarge 8 32 1 32 32 1 x 500 NVMe SSD Hingga 12,5 Hingga 20
ml.trn1.32xlarge 128 512 16 512 32 4 x 2000 NVMe SSD 800 80

Detail produk instans Inf1 Amazon SageMaker

Ukuran Instans vCPU Memori (GiB) Akselerator Inferentia Total Memori Akselerator (GB) Memori per Akselerator (GB) Penyimpanan Instans Interkoneksi antar akselerator Bandwidth Jaringan (Gbps) Bandwidth EBS (Gbps)
ml.inf1.xlarge 4 8 1 8 8 Hanya EBS N/A Hingga 25 Hingga 4,75
ml.inf1.2xlarge 8 16 1 8 8 Hanya EBS N/A Hingga 25 Hingga 4,75
ml.inf1.6xlarge 24 48 4 32 8 Hanya EBS Ya 25 4,75
ml.inf1.24xlarge 96 192 16 128 8 Hanya EBS ya 100 19

Detail produk instans Inf2 Amazon SageMaker

Ukuran Instans vCPU Memori (GiB) Akselerator Inferentia Total Memori Akselerator (GB) Memori per Akselerator (GB) Penyimpanan Instans Interkoneksi antar akselerator Bandwidth Jaringan (Gbps) Bandwidth EBS (Gbps)
ml.inf2.xlarge 4 16 1 32 32 Hanya EBS N/A Hingga 25 Hingga 10
ml.inf2.8xlarge 32 128 1 32 32 Hanya EBS N/A Hingga 25 10
ml.inf2.24xlarge 96 384 6 196 32 Hanya EBS Ya 50 30
ml.inf2.48xlarge 192 768 12 384 32 Hanya EBS Ya 100 60

Amazon SageMaker Studio

Amazon SageMaker Studio adalah antarmuka berbasis web tunggal untuk pengembangan ML lengkap, yang menawarkan pilihan lingkungan pengembangan terintegrasi (IDE) yang terkelola penuh dan alat yang dibuat khusus. Anda dapat mengakses SageMaker Studio secara gratis. Anda hanya akan dikenai biaya untuk komputasi dan penyimpanan dasar yang digunakan untuk IDE dan alat ML yang berbeda dalam SageMaker Studio.

Anda dapat menggunakan banyak layanan dari SageMaker Studio, AWS SDK for Python (Boto3), atau AWS Command Line Interface (AWS CLI), termasuk yang berikut ini:

  • IDE di SageMaker Studio untuk melakukan pengembangan ML lengkap dengan rangkaian IDE yang terkelola penuh, termasuk JupyterLab, Code Editor berdasarkan Code-OSS (Kode Studio Visual – Sumber Terbuka), dan RStudio
  • SageMaker Pipelines untuk mengotomatiskan dan mengelola alur kerja ML
  • SageMaker Autopilot untuk membuat model ML dengan visibilitas penuh secara otomatis
  • SageMaker Experiments untuk mengatur dan melacak tugas dan versi pelatihan Anda
  • SageMaker Debugger untuk melakukan debug anomali selama pelatihan
  • SageMaker Model Monitor untuk menjaga model agar tetap berkualitas tinggi
  • SageMaker Clarify untuk menjelaskan model ML Anda dan mendeteksi bias dengan lebih baik
  • SageMaker JumpStart untuk melakukan deployment solusi ML dengan mudah untuk banyak kasus penggunaan. Anda mungkin akan dikenai biaya untuk layanan AWS lain yang digunakan dalam solusi untuk panggilan API dasar yang dilakukan oleh Amazon SageMaker atas nama Anda.
  • SageMaker Inference Recommender untuk mendapatkan rekomendasi konfigurasi titik akhir yang tepat

Anda hanya membayar untuk sumber daya komputasi dan penyimpanan yang mendasari dalam SageMaker atau layanan AWS lainnya, berdasarkan penggunaan Anda.

Evaluasi model dasar

SageMaker Clarify mendukung evaluasi model dasar dengan metode evaluasi otomatis dan berbasis manusia. Masing-masing memiliki harga yang berbeda. Jika Anda mengevaluasi model dasar dari Amazon SageMaker JumpStart yang belum dilakukan deployment ke akun Anda, SageMaker akan melakukan deployment model JumpStart untuk sementara di instans SageMaker selama inferensi berlangsung. Instans spesifik akan sesuai dengan rekomendasi instans yang disediakan oleh JumpStart untuk model tersebut.

Evaluasi otomatis:
Evaluasi model dasar dijalankan sebagai tugas pemrosesan SageMaker. Pekerjaan evaluasi akan menginvokasi Inferensi SageMaker. Pelanggan dikenakan biaya untuk inferensi dan pekerjaan evaluasi. Pelanggan hanya dikenakan biaya selama pekerjaan evaluasi berlangsung. Biaya pekerjaan evaluasi adalah jumlah biaya per jam dari instans evaluasi dan jumlah biaya per jam dari instans hosting.

Evaluasi berbasis manusia:
Saat Anda menggunakan fitur evaluasi berbasis manusia tempat Anda membawa tenaga kerja Anda sendiri, Anda dikenakan biaya untuk tiga item: 1) instans SageMaker yang digunakan untuk inferensi, 2) instans yang digunakan untuk menjalankan Pekerjaan Pemrosesan SageMaker yang meng-host evaluasi manusia, dan 3 ) biaya sebesar 0,21 USD per tugas evaluasi manusia yang diselesaikan. Tugas manusia didefinisikan sebagai kejadian ketika pekerja manusia mengirimkan evaluasi atas satu perintah dan respons inferensi terkait di antarmuka pengguna evaluasi manusia. Harganya tetap sama baik Anda memiliki 1 maupun 2 model dalam pekerjaan evaluasi Anda atau Anda membawa inferensi Anda sendiri dan juga sama terlepas dari berapa banyak dimensi evaluasi dan metode penilaian yang Anda sertakan. Harga sebesar 0,21 USD per tugas sama untuk semua wilayah AWS. Tidak ada biaya terpisah untuk tenaga kerja, karena tenaga kerja tersebut disediakan oleh Anda.

Evaluasi yang dikelola AWS:
Untuk evaluasi ahli yang dikelola AWS, harga disesuaikan dengan kebutuhan evaluasi Anda dalam keterlibatan pribadi saat bekerja dengan tim evaluasi ahli AWS.

Amazon SageMaker Studio Lab

Anda dapat membuat dan melatih model ML menggunakan Amazon SageMaker Studio Lab secara gratis. SageMaker Studio Lab menawarkan developer, akademisi, dan ilmuwan data lingkungan pengembangan tanpa konfigurasi untuk belajar dan bereksperimen dengan ML tanpa biaya tambahan.

Amazon SageMaker Canvas

Amazon SageMaker Canvas memperluas akses ML dengan memberi analis bisnis kemampuan untuk menghasilkan prediksi ML yang akurat dengan menggunakan antarmuka point-and-click visual—tidak ada pengkodean atau pengalaman ML yang diperlukan.

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling memberikan dua penawaran pelabelan data, yaitu Amazon SageMaker Ground Truth Plus dan Amazon SageMaker Ground Truth. Anda dapat mempelajari selengkapnya mengenai Amazon SageMaker Data Labeling, sebuah layanan pelabelan data terkelola penuh yang memudahkan pembangunan set data pelatihan yang sangat akurat untuk ML.

Pengujian bayangan Amazon SageMaker

SageMaker membantu Anda menjalankan pengujian bayangan untuk mengevaluasi model ML baru sebelum perilisan produk dengan menguji performanya melalui model yang dilakukan deployment baru-baru ini. Pengujian bayangan SageMaker tidak dikenakan biaya tambahan selain penggunaan biaya untuk instans ML dan penyimpanan ML yang disediakan untuk meng-hosting model bayangan. Harga instans ML dan dimensi penyimpanan ML sama seperti opsi inferensi waktu nyata yang ditentukan di tabel harga sebelumnya. Tidak ada biaya tambahan untuk data yang diproses masuk dan keluar dari deployment bayangan.

Amazon SageMaker Edge

Pelajari selengkapnya tentang harga Amazon SageMaker Edge untuk mengoptimalkan, menjalankan, dan memantau model ML di armada perangkat edge

Amazon SageMaker Savings Plans

Savings Plans Amazon SageMaker membantu mengurangi biaya Anda hingga 64%. Paket secara otomatis berlaku untuk penggunaan instans SageMaker ML yang memenuhi syarat, termasuk notebook SageMaker Studio, instans notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference, dan SageMaker Batch Transform terlepas dari keluarga instans, ukuran, atau Wilayah. Misalnya, Anda dapat mengubah penggunaan dari instans CPU ml.c5.xlarge yang berjalan di AS Timur (Ohio) ke instans ml.Inf1 di AS Barat (Oregon) untuk beban kerja inferensi kapan saja dan secara otomatis terus membayar harga Savings Plans . 

Pelajari selengkapnya »

Total biaya kepemilikan (TCO) dengan Amazon SageMaker

Amazon SageMaker menawarkan total biaya kepemilikan (TCO) setidaknya 54% lebih rendah selama periode tiga tahun dibandingkan dengan solusi yang dikelola sendiri dan berbasis cloud lainnya. Pelajari selengkapnya tentang Analisis TCO untuk Amazon SageMaker.

Contoh harga

  • Sebagai ilmuwan data, Anda menghabiskan 20 hari menggunakan JupyterLab untuk eksperimen cepat pada notebook, kode, dan data selama 6 jam per hari pada instans ml.g4dn.xlarge. Anda membuat, lalu menjalankan ruang JupyterLab untuk mengakses IDE JupyterLab. Komputasi hanya dikenakan biaya untuk instans yang digunakan saat ruang JupyterLab sedang berjalan. Biaya penyimpanan untuk ruang JupyterLab akan terus bertambah hingga ruang tersebut dihapus.

    Komputasi

    Instans Durasi Hari Durasi total Biaya per jam Total
    ml.g4dn.xlarge 6 jam 20 6 * 20 = 120 jam 0,7364 USD 88,368 USD

    Penyimpanan

    Anda akan menggunakan penyimpanan Tujuan Umum SSD selama 480 jam (24 jam * 20 hari). Di Wilayah yang mengenakan biaya sebesar 0,1125 USD per GB-bulan:
    0,112 USD per GB-bulan * 5 GB * 480 / (24 jam/hari * 30 hari kalender) = 0,373 USD

  • Sebagai rekayasawan ML, Anda menghabiskan 20 hari menggunakan Code Editor untuk mengedit, mengeksekusi, dan melakukan debug kode produksi ML selama 6 jam per hari pada instans ml.g4dn.xlarge. Anda membuat, lalu menjalankan ruang Code Editor untuk mengakses IDE Code Editor. Komputasi hanya dikenakan biaya untuk instans yang digunakan saat ruang Code Editor sedang berjalan. Biaya penyimpanan untuk ruang Code Editor akan terus bertambah hingga ruang tersebut dihapus.

    Komputasi

    Instans Durasi Hari Durasi total Biaya per jam Total
    ml.g4dn.xlarge 6 jam 20 6 * 20 = 120 jam 0,7364 USD 88,368 USD

    Penyimpanan

    Anda akan menggunakan penyimpanan Tujuan Umum SSD selama 480 jam (24 jam * 20 hari). Di Wilayah yang mengenakan biaya sebesar 0,1125 USD per GB-bulan:
    0,112 USD per GB-bulan * 5 GB * 480 / (24 jam/hari * 30 hari kalender) = 0,373 USD

  • Seorang ilmuwan data akan melakukan urutan tindakan berikut saat menggunakan notebook di Amazon SageMaker Studio Classic.

    1. Membuka notebook 1 di kernel TensorFlow di instans ml.c5.xlarge, lalu bekerja di notebook ini selama 1 jam.
    2. Membuka notebook 2 di instans ml.c5.xlarge. Ini akan secara otomatis terbuka di instans ml.c5.xlarge yang sama yang menjalankan notebook 1. 
    3. Bekerja di notebook 1 dan notebook 2 sekaligus selama 1 jam.
    4. Ilmuwan data akan ditagih untuk total dua (2) jam penggunaan ml.c5.xlarge. Untuk waktu tumpang tindih saat ia bekerja di notebook 1 dan notebook 2 secara bersamaan, tiap-tiap aplikasi kernel akan dihitung selama 0,5 jam dan ia akan dikenai tagihan untuk 1 jam.
    Aplikasi kernel Instans notebook Jam Biaya per jam Total
    TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD
    TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Ilmu Data ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Seorang ilmuwan data menjalankan urutan tindakan berikut saat menggunakan RStudio:

    1. Meluncurkan RSession 1 pada instans ml.c5.xlarge, lalu bekerja di notebook ini selama 1 jam.
    2. Meluncurkan RSession 2 pada instans ml.c5.xlarge. Ini akan secara otomatis terbuka di instans ml.c5.xlarge yang sama yang menjalankan RSession 1.
    3. Bekerja pada RSesssion 1 dan RSession 2 secara bersamaan selama 1 jam.
    4. Ilmuwan data akan ditagih untuk total dua (2) jam penggunaan ml.c5.xlarge. Untuk jam yang tumpang tindih saat ia mengerjakan RSession 1 dan RSession 2 secara bersamaan, tiap-tiap aplikasi RSession akan diukur selama 0,5 jam dan ia akan dikenai biaya untuk 1 jam.

    Sementara itu, RServer berjalan selama 24/7 terlepas dari apakah ada RSessions yang sedang berjalan atau tidak. Jika admin memilih “Kecil” (ml.t3.medium), maka tidak dikenai biaya. Jika admin memilih “Sedang” (ml.c5.4xlarge) atau “Besar” (ml.c5.9xlarge), maka biayanya akan dibebankan per jam sejauh RStudio diaktifkan untuk Domain SageMaker.

    Aplikasi RSession Instans RSession Jam Biaya per jam Total
    Base R ml.c5.xlarge 1 0,204 USD 0,204 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Amazon SageMaker Processing hanya mengenakan biaya untuk instans yang digunakan saat tugas Anda sedang berjalan. Ketika Anda menyediakan data input untuk pemrosesan di Amazon S3, Amazon SageMaker akan mengunduh data dari Amazon S3 ke penyimpanan file lokal di awal tugas pemrosesan.

    Analis data akan menjalankan tugas pemrosesan untuk memproses dan memvalidasi data di dua instans ml.m5.4xlarge dengan durasi tugas selama 10 menit. Ia mengunggah set data sebesar 100 GB di S3 sebagai input untuk tugas pemrosesan, dan data output (yang ukurannya kurang lebih sama) akan disimpan kembali di S3.

    Jam  Instans pemrosesan Biaya per jam Total
    1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD
    Penyimpanan Tujuan Umum (SSD) (GB) Biaya per jam Total
    100 GB * 2 = 200 0,14 USD 0,0032 USD

    Subtotal untuk tugas Pemrosesan Amazon SageMaker = 0,308 USD.
    Subtotal untuk 200 GB penyimpanan SSD tujuan umum = 0,0032 USD.
    Total harga untuk contoh ini menjadi 0,3112 USD.

  • Dari tabel tersebut, Anda menggunakan Amazon SageMaker Data Wrangler selama total 18 jam dalam 3 hari untuk menyiapkan data Anda. Selain itu, Anda membuat tugas SageMaker Data Wrangler untuk menyiapkan data yang diperbarui setiap minggu. Setiap tugas berlangsung selama 40 menit, dan tugas dijalankan setiap minggu selama satu bulan.

    Total biaya bulanan atas penggunaan Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

    Aplikasi Instans SageMaker Studio Hari Durasi Durasi total Biaya per jam  Subtotal biaya
    SageMaker Data Wrangler ml.m5.4xlarge 3 6 jam 18 jam 0,922 USD 16,596 USD
    Tugas SageMaker Data Wrangler ml.m5.4xlarge - 40 menit 2,67 jam 0,922 USD 2,461 USD

    Sebagai ilmuwan data, Anda memerlukan waktu tiga hari menggunakan Amazon SageMaker Data Wrangler untuk membersihkan, menjelajahi, dan memvisualisasikan data Anda dengan durasi selama 6 jam per hari. Untuk menjalankan pipeline persiapan data, Anda kemudian memulai tugas SageMaker Data Wrangler yang dijadwalkan berjalan setiap minggu.

    Tabel di bawah ini merangkum total penggunaan Anda untuk bulan tersebut dan biaya terkait untuk menggunakan Amazon SageMaker Data Wrangler.

  • ++ Semua pecahan unit baca dibulatkan ke bilangan bulat berikutnya

    Penyimpanan data
    Total data yang disimpan = 31,5 GB
    Biaya bulanan atas penyimpanan data = 31,5 GB * 0,45 USD = 14,175 USD

    Total biaya bulanan atas Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

    Hari dalam bulan Total Tulis Total unit tulis Total Baca Total unit baca
    Hari 1 s/d 10 100.000 tulis 
    (10.000 tulis * 10 hari)
    2.500.000 
    (100.000 * 25 KB)
    100.000 
    (10.000 * 10 hari)
    700.000 ++ 
    (100.000 * 25/4 KB)
             
    Hari 11 200.000 tulis 5.000.000 
    (200.000 * 25 KB)
    200.000 baca 1.400.000 ++ 
    (200.000 * 25/4KB)
             
    Hari 12 s/d 30 1.520.000 tulis 
    (80.000 * 19 hari)
    38.000.000 
    (1.520.000 * 25 KB)
    1.520.000 tulis
    (80.000 * 19 hari)
    10.640.000++
    (1.520.000 * 25/4KB)
             
    Total unit yang dikenakan biaya   45.500.000 unit tulis   12.740.000 unit baca
    Biaya bulanan untuk tulis dan baca   56,875 USD 
    (45,5 juta unit tulis * 1,25 USD per juta tulis)
      3,185 USD 
    (12,74 juta unit baca * 0,25 USD per juta baca)

    Anda memiliki aplikasi web yang menerbitkan baca dan tulis, masing-masing sebesar 25 KB ke Amazon SageMaker Feature Store. Selama 10 hari pertama dalam sebulan, Anda akan menerima lalu lintas yang sedikit pada aplikasi, yang menghasilkan 10.000 tulis dan 10.000 baca setiap hari ke Tempat Penyimpanan Fitur SageMaker. Namun, pada hari ke-11 di bulan itu aplikasi Anda mencuri perhatian di media sosial, dan lalu lintas aplikasi melonjak menjadi 200.000 baca dan 200.000 tulis hari itu. Aplikasi Anda pun perlahan memiliki pola lalu lintas yang lebih teratur, rata-rata 80.000 baca dan 80.000 tulis setiap hari hingga akhir bulan.

    Tabel di bawah ini merangkum total penggunaan Anda selama bulan tersebut dan biaya penggunaan Amazon SageMaker Feature Store.

  • Total biaya untuk pelatihan dan melakukan debug dalam contoh ini adalah 2,38 USD. Instans komputasi dan volume penyimpanan tujuan umum yang digunakan oleh aturan bawaan Amazon SageMaker Debugger tidak dikenakan biaya tambahan.

      Penyimpanan tujuan umum (SSD) untuk pelatihan (GB)  Penyimpanan tujuan umum (SSD) untuk aturan bawaan debugger (GB) Penyimpanan tujuan umum (SSD) untuk aturan kustom debugger (GB) Biaya per GB-bulan Subtotal
    Kapasitas yang digunakan 3 2 1    
    Biaya 0 USD Tidak ada biaya tambahan untuk volume penyimpanan aturan bawaan 0 USD 0,10 USD 0 USD

     

    Jam Instans pelatihan Instans debug Biaya per jam  Subtotal
    4 * 0,5 = 2,00 ml.m4.4xlarge n/a 0,96 USD 1,92 USD
    4 * 0,5 * 2 = 4 n/a Tidak ada biaya tambahan untuk instans aturan built-in 0 USD 0 USD
    4 * 0,5 = 2 ml.m5.xlarge n/a 0,23 USD 0,46 USD
            -------
            2,38 USD

    Seorang ilmuwan data telah menghabiskan waktu seminggu mengerjakan model untuk sebuah ide baru. Ia melatih model 4 kali di sebuah ml.m4.4xlarge selama 30 menit per pelatihan dengan Amazon SageMaker Debugger diaktifkan menggunakan 2 aturan built-in dan 1 aturan kustom yang ia tulis. Untuk aturan kustom, ia menentukan instans ml. m5.xlarge. Ia melatih menggunakan data pelatihan 3 GB di Amazon S3, dan menekan output model 1 GB ke dalam Amazon S3. SageMaker membuat volume SSD tujuan umum (gp2) untuk setiap instans pelatihan. SageMaker juga membuat volume SSD tujuan umum (gp2) untuk setiap aturan yang ditentukan. Dalam contoh ini, total 4 volume SSD tujuan umum (gp2) akan dibuat. SageMaker Debugger mengeluarkan 1 GB data debug ke bucket Amazon S3 pelanggan.

  •   Biaya Total unit Biaya bulanan
    Penyerapan 1,25 USD per juta catatan metrik 1 juta (=1.000 ilmuwan data x 10 kali x 20 epoch x 5 metrik) catatan metrik yang diserap 1,25 USD (= 1,25 x 1)
    Penggunaan SageMaker Studio 0 USD   0 USD
    Pengambilan 0,25 USD per juta catatan metrik 10 juta (= 1 juta metrik yang diserap * 10 pengambilan per metrik yang diserap) catatan metrik yang diambil 2,5 USD (= 0,25 * 10)
    Penyimpanan 0,25 USD per juta catatan metrik - bulan 1 juta catatan metrik yang tersimpan 0,25 USD (= 0,25 x 1)
    Total biaya bulanan     4 USD

    Anda memiliki workbench ML yang digunakan oleh 1.000 ilmuwan data. Mereka melakukan eksperimen dengan melatih model mereka dengan parameter dan set data yang berbeda. Setiap ilmuwan data melatih model sepuluh kali dalam sebulan selama 20 epoch dan menangkap lima metrik khusus. Workbench menggunakan API pengambilan untuk mendapatkan data eksperimen dari SageMaker Experiments untuk analisis kustom. Ilmuwan data membandingkan data rekaman mereka di sepuluh iterasi pelatihan yang berbeda untuk menemukan model kandidat terbaik. Dalam contoh ini, biayanya adalah sebagai berikut:

      Biaya Total unit Biaya bulanan
    Penyerapan 1,25 USD per juta catatan metrik 100.000 (=100 ilmuwan data x 10 kali x 20 epoch x 5 metrik) catatan metrik yang diserap 0,125 USD (= 1,25 x 100.000/1.000.000)
    Penggunaan SageMaker Studio 0 USD   0 USD
    Pengambilan 0,25 USD per juta catatan metrik 0 0 USD
    Penyimpanan 0,25 USD per juta catatan metrik - bulan 100.000 catatan metrik yang tersimpan 0,025 USD (= 0,25 x 100.000/1.000.000)
    Total biaya bulanan     0,15 USD

     

    Sebuah tim yang terdiri dari 100 ilmuwan data sedang mengerjakan sebuah proyek untuk ide baru. Mereka melakukan eksperimen dengan melatih model mereka dengan parameter dan set data yang berbeda. Rata-rata, setiap ilmuwan data melatih model sepuluh kali dalam sebulan selama 20 epoch dan menangkap lima metrik khusus. Ilmuwan data menggunakan SageMaker Studio untuk menganalisis eksperimen mereka. Dalam contoh ini, biayanya adalah sebagai berikut:

  • Subtotal untuk pelatihan, hosting, dan pemantauan = 305,827 USD. Subtotal untuk 3.100 MB data yang diproses Masuk dan 310 MB data yang diproses Keluar untuk Hosting per bulan = 0.054 USD. Total biaya untuk contoh ini adalah 305,881 USD per bulan.

    Catatan, untuk aturan bawaan dengan instans ml.m5.xlarge, Anda akan mendapatkan hingga 30 jam pemantauan yang digabungkan di seluruh titik akhir setiap bulan, tanpa biaya.

     

    Data Masuk per bulan - hosting Data Keluar per bulan - hosting Biaya per GB Masuk atau Keluar Total
    100 MB * 31 = 3.100 MB   0,016 USD 0,0496 USD
      10 MB * 31 = 310 MB 0,016 USD 0,00496 USD
    Jam per bulan Instans hosting Instans Model Monitor Biaya per jam Total
    24 * 31 * 2 = 1488 ml.c5.xlarge   0,204 USD 303,522 USD
    31*0,08 = 2,5   ml.m5.4xlarge 0,922 USD 2,305 USD

    Model dalam contoh #5 kemudian dilakukan deployment ke produksi pada dua (2) instans ml.c5.xlarge untuk melakukan host multi-AZ yang andal. Amazon SageMaker Model Monitor diaktifkan dengan satu (1) instans ml.m5.4xlarge dan tugas pemantauan dijadwalkan sekali per hari. Setiap tugas pemantauan memerlukan waktu 5 menit. Model akan menerima 100 MB data per hari, dan inferensi sebesar 1/10 dari ukuran data input.

  • Subtotal untuk SageMaker Asynchronous Inference = 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Total biaya Inferensi Asinkron untuk contoh ini menjadi 16,38 USD per bulan.

    Data Masuk per bulan Data Keluar per bulan Biaya per GB Masuk atau Keluar Total
    10 KB * 1.024 * 31 = 310 MB 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048
      10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048
    Penyimpanan Tujuan Umum (SSD) (GB) Biaya per Gb-bulan Total
    4 0,14 USD 0,56 USD
    Jam per bulan Instans hosting Biaya per jam Total
    2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD

    Amazon SageMaker Asynchronous Inference mengenakan biaya untuk instans yang digunakan oleh titik akhir Anda. Saat sedang tidak secara aktif memproses permintaan, Anda dapat mengonfigurasi penskalaan otomatis untuk menskalakan jumlah instans ke nol guna menghemat biaya. Untuk muatan input di Amazon S3, tidak ada biaya untuk membaca data input dari Amazon S3 dan menulis data output ke S3 di Wilayah yang sama.

    Model dalam Contoh #5 digunakan untuk menjalankan titik akhir Inferensi Asinkron SageMaker. Titik akhir dikonfigurasi untuk dijalankan pada 1 instans ml.c5.xlarge dan menurunkan skala jumlah instansnya ke nol saat tidak memproses permintaan secara aktif. Instans ml.c5.xlarge di titik akhir memiliki 4 GB penyimpanan tujuan umum (SSD) yang terpasang. Dalam contoh ini, titik akhir akan mempertahankan jumlah instans 1 selama 2 jam per hari dan memiliki periode pendinginan selama 30 menit setelah diskalakan turun ke jumlah instans nol untuk sisa hari itu. Oleh karena itu, Anda dikenai biaya penggunaan sebesar 2,5 jam per hari. 

    Titik akhir memproses 1.024 permintaan per hari. Ukuran untuk setiap isi permintaan/respons pemanggilan adalah 10 KB dan ukuran untuk setiap muatan permintaan inferensi di Amazon S3 adalah 100 MB. Output inferensi adalah sebesar 1/10 dari ukuran data input yang disimpan kembali di Amazon S3 di Wilayah yang sama. Dalam contoh ini, biaya pemrosesan data berlaku untuk isi permintaan dan respons, tetapi tidak untuk data yang ditransfer ke/dari Amazon S3. 

  • Total biaya untuk inferensi dalam contoh ini adalah 2,88 USD.

    Jam Instans hosting Biaya per jam Total
    3 * 0,25 * 4 = 3 jam ml.m4.4xlarge 0,96 USD 2,88 USD

    Model dalam contoh #5 digunakan untuk menjalankan SageMaker Batch Transform. Ilmuwan data menjalankan empat tugas Batch Transform SageMaker yang berbeda di 3 ml.m4.4xlarge selama 15 menit per tugas yang dijalankan. Ia mengunggah set data evaluasi sebesar 1 GB di S3 untuk setiap proses, dan inferensi sebesar 1/10 dari ukuran data input yang disimpan kembali di S3.

  • Biaya proses data bulanan 

    Pemrosesan data (GB) Biaya per GB Masuk atau Keluar Biaya pemrosesan data bulanan
    10 GB 0,016 USD 0,16 USD

    Subtotal untuk biaya durasi Inferensi Nirserver SageMaker sesuai permintaan = 40 USD. Subtotal untuk biaya pemrosesan data 10 GB = 0,16 USD. Total biaya untuk contoh ini adalah 40,16 USD.

    Biaya komputasi bulanan

    Jumlah permintaan Durasi setiap permintaan Durasi total inferensi (detik) Biaya per detik Biaya durasi inferensi bulanan
    10 Juta 100 ms 1 Juta 0,00004 USD 40 USD

    Dengan Inferensi Nirserver sesuai permintaan, Anda hanya membayar kapasitas komputasi yang digunakan untuk memproses permintaan inferensi, ditagih per milidetik, dan jumlah data yang diproses. Biaya komputasi bergantung pada konfigurasi memori yang Anda pilih.

    Jika Anda mengalokasikan memori sebesar 2 GB untuk titik akhir, menjalankannya 10 juta kali dalam satu bulan dan berjalan selama 100 milidetik setiap waktu, serta memproses total 10 GB Data Masuk/Keluar, biaya Anda akan dihitung sebagai berikut:

  • Asumsikan Anda menjalankan layanan chat-bot untuk perusahaan pemrosesan penggajian. Anda memperkirakan lonjakan pertanyaan pelanggan pada akhir Maret, sebelum batas waktu pengajuan pajak. Namun, untuk sisa bulan ini, lalu lintas diperkirakan akan rendah. Jadi, Anda melakukan deployment titik akhir nirserver dengan memori 2 GB dan menambahkan Konkurensi yang Tersedia sebanyak 100 selama 5 hari terakhir dalam sebulan pada pukul 9 pagi - 5 sore (8 jam), tempat titik akhir Anda memproses 10 juta permintaan dan total 10 GB Data Masuk/Keluar. Selama sisa bulan ini, chatbot berjalan pada Inferensi Nirserver sesuai permintaan dan memproses 3 juta permintaan dan 3 GB Data Masuk/Keluar. Misalnya, durasi setiap permintaan adalah 100 milidetik.

    Biaya Konkurensi yang Tersedia (PC)
    Harga PC adalah 0,000010 USD/detik
    Durasi penggunaan PC (detik) = 5 hari x 100 PC x 8 jam x 3.600 detik = 14.400.000 detik
    Biaya penggunaan PC = 14.400.000 detik x 0,000010 USD/detik = 144 USD.

    Biaya durasi inferensi untuk lalu lintas yang dilayani oleh Konkurensi yang Tersedia
    Harga durasi inferensi adalah 0,000023 USD/detik
    Total durasi Inferensi untuk PC (detik) = 10 juta x (100 milidetik) /1.000 = 1 juta detik.
    Biaya durasi inferensi untuk PC = 1.000.000 detik x 0,000023 USD/detik = 23 USD

    Biaya durasi inferensi sesuai permintaan
    Harga komputasi bulanan adalah 0,00004 USD/detik dan tingkat gratis menyediakan 150 ribu detik.
    Total komputasi (detik) = (3) juta x (100 milidetik) /1.000 = 0,3 juta detik.
    Total komputasi – Komputasi tingkat gratis = Komputasi tertagih bulanan dalam satuan detik
    0,3 juta detik – 150 ribu detik = 150 ribu detik
    Biaya komputasi bulanan = 150 ribu x 0,00004 USD = 6 USD

    Pemrosesan Data
    Biaya/GB Data Diproses Masuk/Keluar = 0,016 USD
    Total GB yang diproses = 10+3 = 13
    Total Biaya = 0,016 USD x 13 = 0,208 USD

    Total biaya untuk bulan Maret
    Total biaya = Biaya Konkurensi yang Tersedia + Durasi inferensi untuk Konkurensi yang Tersedia + Durasi inferensi untuk komputasi sesuai permintaan + Biaya Pemrosesan Data
    = 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

  • Pelanggan menggunakan JumpStart untuk melakukan deployment model BERT Base Uncased yang dilatih sebelumnya untuk mengklasifikasikan sentimen ulasan pelanggan sebagai positif atau negatif.

    Pelanggan melakukan deployment model tersebut ke dua (2) instans ml.c5.xlarge untuk hosting multi-AZ yang tepercaya. Model akan menerima 100 MB data per hari, dan inferensi sebesar 1/10 dari ukuran data input.

    Jam per bulan Instans hosting Biaya per jam Total
    24 * 31 * 2 = 1488 ml.c5.xlarge 0,204 USD 303,55 USD
     
    Data Masuk per bulan - Hosting Data Keluar per bulan - Hosting Biaya per GB Masuk atau Keluar

    Total

    100 MB * 31 = 3.100 MB   0,02 USD 0,06 USD
      10 MB * 31 = 310 MB 0,02 USD 0,01 USD
     

    Subtotal untuk pelatihan, hosting, dan pemantauan = 305,827 USD. Subtotal untuk 3.100 MB data yang diproses Masuk dan 310 MB data yang diproses Keluar untuk Hosting per bulan = 0,06 USD. Total biaya untuk contoh ini adalah 305,887 USD per bulan.

  • Katakanlah Anda menginginkan klaster 64 p5 untuk digunakan secara terus menerus selama 3 bulan guna mendukung deployment model menyeluruh.

    Jam Instans pelatihan Biaya per jam
    3 bulan * 30 hari * 24 jam = 2.160 jam ml.p5.48xlarge 113,07 USD
     

    Total biaya untuk klaster dalam contoh ini adalah 244.321,20 USD

  • Evaluasi model dasar dengan SageMaker Clarify hanya membebankan biaya kepada Anda untuk instans yang digunakan saat tugas evaluasi otomatis Anda berjalan. Saat Anda memilih tugas dan set data evaluasi otomatis, SageMaker memuat set data perintah dari Amazon S3 ke instans evaluasi SageMaker.

    Dalam contoh berikut, seorang rekayasawan ML menjalankan evaluasi model Llama2 7B di AS Timur (Virginia Utara) untuk akurasi tugas peringkasan. Tipe instans yang direkomendasikan untuk inferensi Llama 2 7B adalah ml.g5.2xlarge. Instans minimum yang direkomendasikan untuk evaluasi adalah ml.m5.2xlarge. Dalam contoh ini, pekerjaan berjalan selama 45 menit (bergantung pada ukuran set data). Dalam contoh ini, biayanya adalah 1,48 USD untuk pekerjaan evaluasi dan hasil terperinci.

    Jam Kerja Pemrosesan (contoh)

    Wilayah

    Tipe Instans

    Instans

    Biaya per jam

    Biaya

    0,45

    US-east-1

    Hosting LLM

    ml.g5.2xlarge

    1,52 USD

    1,14 USD

    0,45

    US-east-1

    evaluasi

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Total

           

    1,48 USD

    Dalam contoh berikutnya, rekayasawan yang sama di Virginia menjalankan pekerjaan evaluasi lain untuk akurasi tugas peringkasan, tetapi menggunakan versi Llama 2 7B yang disesuaikan yang dilakukan deployment ke akun mereka dan aktif serta berjalan. Dalam kasus ini, karena model telah dilakukan deployment ke akun mereka, satu-satunya biaya tambahan adalah untuk instans evaluasi.

    Jam Kerja Pemrosesan

    Wilayah

    Tipe Instans

    Instans

    Biaya per jam

    Biaya

    0,45

    US-east-1

    evaluasi

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Total

           

    0,35 USD

  • Dalam contoh berikut, seorang rekayasawan machine learning di AS Timur (Virginia Utara) menjalankan evaluasi Llama-2-7B berbasis manusia untuk akurasi tugas peringkasan dan menggunakan tenaga kerja privat mereka untuk melakukan evaluasi. Tipe instans yang direkomendasikan untuk Llama-2-7B adalah ml.g5.2xlarge. Instans minimum yang direkomendasikan untuk Pekerjaan Pemrosesan evaluasi berbasis manusia adalah ml.t3.medium. Inferensi di Llama-2-7B berjalan selama 45 menit (bergantung ukuran set data). Set data berisi 50 perintah, dan developer memerlukan 2 pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam evaluasi pembuatan tugas sebagai parameter “pekerja per perintah”). Akan ada 100 tugas dalam pekerjaan evaluasi ini (1 tugas untuk setiap pasangan respons perintah per setiap pekerja: 2 pekerja x 50 rangkaian respons perintah = 100 tugas manusia). Tenaga kerja manusia membutuhkan waktu satu hari (24 jam) untuk menyelesaikan 100 tugas evaluasi manusia dalam pekerjaan evaluasi (bergantung jumlah dan tingkat keterampilan pekerja, serta panjang/kompleksitas perintah dan respons inferensi).

    Jam Komputasi

    Tugas manusia

    Wilayah

    Tipe Instans

    Instans

    Biaya per jam

    Biaya per tugas manusia

    Total Biaya

    0,45

     

    AS Timur (Virginia Utara)

    Hosting LLM

    ml.g5.2xlarge

    1,52 USD

     

    1,14 USD

    24

     

    AS Timur (Virginia Utara)

    Pekerjaan Pemrosesan

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Apa saja

         

    0,21 USD

    21,00 USD

    Total

               

    23,34 USD

    Pada contoh berikutnya, rekayasawan yang sama di AS Timur (Virginia Utara) menjalankan pekerjaan evaluasi yang sama, tetapi menggunakan Llama-2-7B yang sudah dilakukan deployment ke akun mereka dan aktif serta berjalan. Dalam hal ini, satu-satunya biaya tambahan adalah untuk pekerjaan pemrosesan evaluasi dan tugas manusia.

    Jam Komputasi

    Tugas manusia

    Wilayah

    Tipe Instans

    Instans

    Biaya per jam

    Biaya per tugas manusia

    Total Biaya

    24

     

    AS Timur (Virginia Utara)

    Pekerjaan Pemrosesan

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Apa saja

         

    0,21 USD

    21,00 USD

    Total

               

    22,20 USD