ค่าบริการ Amazon SageMaker
ภาพรวมราคา
Amazon SageMaker ช่วยให้นักวิทยาศาสตร์ข้อมูลและนักพัฒนาเตรียมความพร้อม สร้าง ฝึกอบรม และปรับใช้โมเดลแมชชีนเลิร์นนิง (ML) คุณภาพสูงได้อย่างรวดเร็วโดยการรวบรวมชุดความสามารถที่หลากหลาย ซึ่งสร้างขึ้นมาเพื่อ ML โดยเฉพาะเข้าด้วยกัน SageMaker รองรับเฟรมเวิร์ก ML, ชุดเครื่องมือ และภาษาเขียนโปรแกรมชั้นนำ
เมื่อใช้ SageMaker คุณจะจ่ายเฉพาะส่วนที่คุณใช้เท่านั้น คุณมีตัวเลือกในการชำระเงินสองรูปแบบ ได้แก่ ราคาแบบตามความต้องการ ซึ่งไม่มีค่าธรรมเนียมขั้นต่ำและไม่มีภาระผูกพันล่วงหน้า และ SageMaker Savings Plans ซึ่งนำเสนอโมเดลราคาที่ยืดหยุ่นตามการใช้งาน โดยแลกเปลี่ยนกับภาระผูกพันในการใช้งานอย่างต่อเนื่อง
Amazon SageMaker Free Tier
ลองใช้ Amazon SageMaker ได้ฟรี ในฐานะส่วนหนึ่งของ AWS Free Tier คุณสามารถเริ่มใช้งาน Amazon SageMaker ได้ฟรี Free Tier ของคุณจะเริ่มเดือนแรกเมื่อคุณสร้างทรัพยากร SageMaker แรกของคุณ รายละเอียดของ Free Tier สำหรับ Amazon SageMaker อยู่ในตารางด้านล่าง
ความสามารถของ Amazon SageMaker | การใช้งาน Free Tier ต่อเดือนสำหรับระยะเวลา 2 เดือนแรก |
Studio Notebooks และอินสแตนซ์โน้ตบุ๊ก | อินสแตนซ์ ml.t3.medium 250 ชั่วโมงบน Studio Notebooks หรืออินสแตนซ์ ml.t2 medium หรืออินสแตนซ์ ml.t3.medium 250 ชั่วโมงบนอินสแตนซ์โน้ตบุ๊ก |
RStudio บน SageMaker | อินสแตนซ์ ml.t3.medium 250 ชั่วโมงบนแอป RSession และอินสแตนซ์ ml.t3.medium ฟรีสำหรับแอป RStudioServerPro |
Data Wrangler | อินสแตนซ์ ml.m5.4xlarge 25 ชั่วโมง |
แหล่งเก็บคุณสมบัติ | หน่วยการเขียน 10 ล้านหน่วย, หน่วยการอ่าน 10 ล้านหน่วย, พื้นที่เก็บข้อมูล 25 GB (พื้นที่เก็บออนไลน์มาตรฐาน) |
การฝึกอบรม | อินสแตนซ์ m4.xlarge หรือ m5.xlarge 50 ชั่วโมง |
Amazon SageMaker กับ TensorBoard | อินสแตนซ์ ml.r5.large 300 ชั่วโมง |
การอนุมานแบบเรียลไทม์ | อินสแตนซ์ m4.xlarge หรือ m5.xlarge 125 ชั่วโมง |
การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ | ระยะเวลาการอนุมานตามความต้องการ 150,000 วินาที |
Canvas | 160 ชั่วโมง/เดือนสำหรับเวลาเซสชัน |
HyperPod | อินสแตนซ์ m5.xlarge 50 ชั่วโมง |
ราคาแบบตามความต้องการ
-
Studio Classic
-
JupyterLab
-
Code Editor
-
RStudio
-
อินสแตนซ์โน้ตบุ๊ก
-
การประมวลผล
-
TensorBoard
-
Data Wrangler
-
Feature Store
-
การฝึกอบรม
-
MLflow
-
การอนุมานแบบเรียลไทม์
-
การอนุมานแบบอะซิงโครนัส
-
Batch Transform
-
การอนุมานแบบไร้เซิร์ฟเวอร์
-
JumpStart
-
Profiler
-
HyperPod
-
การเพิ่มประสิทธิภาพการอนุมาน
-
Studio Classic
-
Amazon SageMaker Studio Classic
Studio Classic เสนอ Jupyter Notebook แบบขั้นตอนเดียวในประสบการณ์ IDE ดั้งเดิมของเรา ทรัพยากรการประมวลผลพื้นฐานนั้นยืดหยุ่นได้อย่างเต็มที่ และสามารถแชร์โน้ตบุ๊คร่วมกับผู้อื่นได้อย่างง่ายดาย ทำให้สามารถทำงานร่วมกันได้อย่างราบรื่น ระบบจะเรียกเก็บค่าใช้บริการเฉพาะสำหรับประเภทของอินสแตนซ์ที่คุณใช้และระยะเวลาในการใช้งาน -
JupyterLab
-
Amazon SageMaker JupyterLab
เปิดตัว JupyterLab ที่มีการจัดการเต็มรูปแบบภายในไม่กี่วินาที ใช้สภาพแวดล้อมการพัฒนาล่าสุดแบบโต้ตอบบนเว็บสำหรับโน้ตบุ๊ค โค้ด และข้อมูล ระบบจะเรียกเก็บค่าใช้บริการเฉพาะสำหรับประเภทของอินสแตนซ์ที่คุณใช้และระยะเวลาในการใช้งาน -
Code Editor
-
Amazon SageMaker Code Editor
Code Editor ซึ่งอิงมาจาก Code-OSS (Visual Studio Code - Open Source) ช่วยให้คุณสามารถเขียน ทดสอบ แก้ไขข้อบกพร่องและเรียกใช้การวิเคราะห์และโค้ด ML ของคุณได้ ซึ่งรวมเข้ากับ SageMaker Studio อย่างสมบูรณ์และรองรับส่วนขยาย IDE ที่มีอยู่ในรีจิสทรีส่วนขยาย Open VSX -
RStudio
-
RStudio
RStudio เสนอทรัพยากรการประมวลผลบนระบบคลาวด์แบบตามความต้องการเพื่อเร่งรัดการพัฒนาโมเดลและเพิ่มผลิตภาพ ระบบจะเรียกเก็บเงินจากคุณสำหรับประเภทอินสแตนซ์ที่คุณเลือกใช้งานแอป RStudio Session และแอป RStudio Server Pro
แอป RStudioServerPro
-
อินสแตนซ์โน้ตบุ๊ก
-
อินสแตนซ์โน้ตบุ๊ก
อินสแตนซ์โน้ตบุ๊กคืออินสแตนซ์การประมวลผลที่เรียกใช้แอป Jupyter Notebook คุณจะถูกเรียกเก็บค่าใช้จ่ายเฉพาะสำหรับประเภทของอินสแตนซ์ที่คุณใช้และระยะเวลาในการใช้งาน
-
การประมวลผล
-
การประมวลผล Amazon SageMaker
การประมวลผล Amazon SageMaker ช่วยให้คุณรันปริมาณงานสำหรับ ช่วงก่อนการประมวลผล หลังการประมวลผล และการประเมินโมเดลบนโครงสร้างพื้นฐานที่มีการจัดการเต็มรูปแบบได้อย่างง่ายดาย คุณจะถูกเรียกเก็บค่าใช้จ่ายเฉพาะสำหรับประเภทของอินสแตนซ์ที่คุณใช้และระยะเวลาในการใช้งาน
-
TensorBoard
-
Amazon SageMaker กับ TensorBoard
Amazon SageMaker กับ TensorBoard มอบประสบการณ์ TensorBoard ที่โฮสต์เพื่อแสดงภาพและแก้ปัญหาการบรรจบกันของโมเดลสำหรับงานฝึกอบรม Amazon SageMaker
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler ช่วยลดเวลาในการรวบรวมและจัดเตรียมข้อมูลสำหรับการทำแมชชีนเลิร์นนิ่ง จากเป็นสัปดาห์เหลือเพียงไม่กี่นาที คุณจ่ายเฉพาะสำหรับเวลาที่ใช้ในการเรียบเรียง สำรวจ และแสดงภาพข้อมูลเท่านั้น ลูกค้าที่ใช้งานอินสแตนซ์ SageMaker Data Wrangler จะต้องเสียค่าบริการตามราคาด้านล่างนี้* ลูกค้าที่ใช้ SageMaker Data Wrangler บนอินสแตนซ์ SageMaker Canvas Workspace จะต้องเสียค่าบริการตามราคา SageMaker Canvas ดูรายละเอียดเพิ่มเติมได้ที่ หน้าราคา SageMaker Canvas
Amazon SageMaker Data Wrangler Jobs
Amazon SageMaker Data Wrangler Jobs จะถูกสร้างขึ้นเมื่อโฟลวของข้อมูลถูกนำออกจาก SageMaker Data Wrangler ด้วย Amazon SageMaker Data Wrangler Jobs คุณสามารถกำหนดการทำงานอัตโนมัติสำหรับเวิร์คโฟลวในการเตรียมข้อมูลได้ Amazon SageMaker Data Wrangler Jobs จะช่วยในการปรับใช้เวิร์กโฟลว์ในการจัดเตรียมข้อมูลของคุณบนชุดข้อมูลใหม่เพื่อช่วยคุณประหยัดเวลา และจะคิดค่าใช้จ่ายตามจำนวนวินาที
-
Feature Store
-
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store คือพื้นที่เก็บข้อมูลส่วนกลางสำหรับการนำเข้า จัดเก็บ และให้บริการฟีเจอร์สำหรับแมชชีนเลิร์นนิง คุณจะถูกเรียกเก็บค่าบริการสําหรับกลุ่มคุณสมบัติ การเขียน การอ่าน และพื้นที่เก็บข้อมูลใน SageMaker Feature Store โดยมีราคาที่แตกต่างกันสําหรับร้านค้าออนไลน์มาตรฐานแลพื้นที่เก็บออนไลน์ในหน่วยความจําสําหรับพื้นที่เก็บออนไลน์มาตรฐาน จะมีการเรียกเก็บค่าบริการพื้นที่เก็บข้อมูลต่อ GB ต่อเดือน สําหรับอัตราการโอนถ่ายข้อมูล คุณสามารถเลือกระหว่างโหมดความจุตามความต้องการหรือโหมดความจุที่จัดเตรียมไว้ สําหรับโหมดตามความต้องการ การเขียนจะถูกเรียกเก็บเงินตามหน่วยคําขอเขียนต่อ KB และการอ่านจะถูกเรียกเก็บเงินตามหน่วยคําขออ่านต่อ 4 KB สำหรับโหมดความจุที่เตรียมใช้งาน คุณจะระบุความจุการอ่านและเขียนที่คุณคาดว่าแอปพลิเคชันของคุณจะต้องการ Sagemaker Feature Store จะเรียกเก็บเงินหนึ่ง WCU สําหรับแต่ละหน่วยการเขียนต่อวินาที (สูงสุด 1 KB) และหนึ่ง RCU สําหรับแต่ละหน่วยการอ่านต่อวินาที (สูงสุด 4 KB) คุณจะถูกเรียกเก็บค่าบริการสำหรับความสามารถในการถ่ายโอนข้อมูล (การอ่านและการเขียน) ที่จัดเตรียมสำหรับกลุ่มคุณสมบัติของคุณ แม้ว่าคุณจะไม่ได้ใช้ความจุที่เตรียมใช้งานอย่างเต็มที่ก็ตาม
สําหรับพื้นที่เก็บออนไลน์ในหน่วยความจํา การเขียนจะถูกเรียกเก็บค่าบริการตามหน่วยคําขอเขียนต่อ KB โดยมีอย่างน้อย 1 หน่วยต่อการเขียน การอ่านจะถูกเรียกเก็บค่าบริการตามหน่วยคําขออ่านต่อ KB โดยมีอย่างน้อย 1 หน่วยต่อการอ่าน และพื้นที่เก็บข้อมูลจะถูกเรียกเก็บค่าบริการตาม GB ต่อชั่วโมง มีค่าบริการพื้นที่เก็บข้อมูลขั้นต่ํา 5 GiB (5.37 GB) ต่อชั่วโมงสําหรับร้านค้าออนไลน์ในหน่วยความจํา
-
การฝึกอบรม
-
Amazon SageMaker Training
Amazon SageMaker Training ช่วยให้การฝึกอบรมโมเดลแมชชีนเลิร์นนิ่ง (ML) เป็นเรื่องง่ายโดยให้ทุกสิ่งที่คุณต้องการสำหรับการฝึกอบรม ปรับแต่ง และแก้ไขข้อบกพร่อง (debug) ของโมเดล คุณจะถูกเรียกเก็บเงินตามประเภทอินสแตนซ์ที่คุณเลือกใช้งาน เมื่อคุณใช้ Amazon SageMaker Debugger เพื่อแก้ไขข้อบกพร่องและติดตามทรัพยากรในระหว่างการฝึกข้อมูล คุณสามารถใช้กฎที่ติดตั้งมาด้วยเพื่อแก้ไขข้อบกพร่องของงานในการฝึกข้อมูลหรือเขียนกฎที่ตั้งค่าเองของคุณก็ได้ การใช้งานฝึกแก้ไขข้อบกพร่องนั้นไม่มีค่าใช้จ่าย คุณจะถูกเรียกเก็บค่าใช้จ่ายเฉพาะสำหรับประเภทอินแสตนซ์ที่คุณใช้และระยะเวลาในการใช้งาน
-
MLflow
-
Amazon SageMaker กับ MLflow
Amazon SageMaker กับ MLflow ช่วยให้ลูกค้าสามารถชำระเงินสำหรับสิ่งที่คุณใช้เท่านั้น ลูกค้าชำระเงินสำหรับเซิร์ฟเวอร์ติดตาม MLflow ตามค่าใช้จ่ายในการคำนวณและการจัดเก็บ
ลูกค้าจะจ่ายค่าคำนวณตามขนาดของเซิร์ฟเวอร์ติดตามและจำนวนชั่วโมงที่ใช้งานอยู่ นอกจากนี้ลูกค้าจะชำระเงินสำหรับข้อมูลเมตาใด ๆ ที่เก็บไว้ในเซิร์ฟเวอร์ติดตาม MLflow
-
การอนุมานแบบเรียลไทม์
-
Amazon SageMaker Hosting: การอนุมานแบบเรียลไทม์
Amazon SageMaker ให้บริการการอนุมานแบบเรียลไทม์สำหรับกรณีที่คุณต้องการการพยากรณ์แบบเรียลไทม์ คุณจะถูกเรียกเก็บเงินตามประเภทอินสแตนซ์ที่คุณเลือกใช้งาน เมื่อคุณใช้ Amazon SageMaker Model Monitor เพื่อรักษาความแม่นยำสูงของโมเดลที่ให้การอนุมานแบบเรียลไทม์ คุณสามารถใช้กฎในตัวเพื่อเฝ้าติดตามโมเดลหรือเขียนกฎแบบกำหนดเองได้ สำหรับกฎแบบกำหนดเอง คุณจะได้รับการตรวจสอบฟรีสูงสุด 30 ชั่วโมง ค่าใช้จ่ายเพิ่มเติมจะถูกเรียกเก็บโดยคิดจากระยะเวลาการใช้งาน คุณจะถูกเรียกเก็บค่าใช้จ่ายเพิ่มเติมต่างหากเมื่อคุณใช้กฎแบบที่คุณกำหนดเอง
-
การอนุมานแบบอะซิงโครนัส
-
การอนุมานแบบอะซิงโครนัสของ Amazon SageMaker:
การอนุมานแบบอะซิงโครนัสของ Amazon SageMaker คือตัวเลือกในการอนุมานที่ใกล้เคียงแบบเรียลไทม์ซึ่งจัดคิวคำขอที่เข้ามาและประมวลผลคำขอเหล่านั้นแบบอะซิงโครนัส ใช้ตัวเลือกนี้เมื่อคุณต้องการประมวลผลเพย์โหลดขนาดใหญ่เมื่อข้อมูลมาถึงหรือใช้งานโมเดลที่ใช้เวลาในการประมวลผลการอนุมานยาวนานและไม่มีความต้องการเวลาแฝงในระดับต่ำกว่าวินาที คุณจะถูกเรียกเก็บเงินตามประเภทอินสแตนซ์ที่เลือก -
Batch Transform
-
Amazon SageMaker Batch Transform
การใช้ Amazon SageMaker Batch Transform ช่วยให้ไม่จำเป็นต้องแบ่งชุดข้อมูลออกเป็นหลายๆ ส่วนหรือจัดการตำแหน่งข้อมูลปลายทางแบบเรียลไทม์ SageMaker Batch Transform ช่วยให้คุณรันการคาดการณ์บนชุดข้อมูลแบบกลุ่มทั้งขนาดใหญ่และเล็กได้ คุณจะถูกเรียกเก็บค่าใช้จ่ายเฉพาะสำหรับประเภทของอินสแตนซ์ที่คุณใช้และระยะเวลาในการใช้งาน
-
การอนุมานแบบไร้เซิร์ฟเวอร์
-
Amazon SageMaker Serverless Inference
การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Amazon SageMaker ช่วยให้คุณปรับใช้โมเดลแมชชีนเลิร์นนิงสำหรับการอนุมานได้โดยไม่ต้องกำหนดค่าหรือจัดการโครงสร้างพื้นฐานที่จำเป็นใดๆ คุณสามารถใช้การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ตามความต้องการ หรือเพิ่มกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้ไปยังตำแหน่งข้อมูลของคุณเพื่อประสิทธิภาพที่คาดการณ์ได้เมื่อใช้การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ตามความต้องการ คุณจะจ่ายค่าบริการเฉพาะความสามารถในการคำนวณที่ใช้ประมวลผลคำขอการอนุมานเท่านั้น โดยจะเรียกเก็บเงินตามมิลลิวินาที และปริมาณของข้อมูลที่ประมวลผล ค่าบริการในการคำนวณจะขึ้นอยู่กับการกำหนดค่าหน่วยความจำที่คุณเลือก
กระบวนการทำงานพร้อมกันที่มีการเตรียมใช้งานนอกจากนี้ คุณยังสามารถเลือกเปิดใช้งานกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้สำหรับตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ของคุณได้อีกด้วย กระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้ช่วยให้คุณสามารถปรับใช้โมเดลบนตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ด้วยประสิทธิภาพที่คาดการณ์ได้ พร้อมความสามารถในการปรับขนาดสูงเพื่อให้ดำเนินการ Warm ตำแหน่งข้อมูลของคุณสำหรับจำนวนคำขอพร้อมกันและเวลาตามที่ระบุ เมื่อใช้การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ตามความต้องการและเมื่อเปิดใช้งานกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้ คุณจะจ่ายค่าบริการสำหรับความสามารถในการคำนวณที่ใช้ประมวลผลคำขอการอนุมานเท่านั้น โดยจะเรียกเก็บเงินตามมิลลิวินาที และปริมาณของข้อมูลที่ประมวลผล นอกจากนี้ คุณยังต้องจ่ายเงินสำหรับกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้ โดยขึ้นอยู่กับหน่วยความจำที่กำหนดค่าไว้ ระยะเวลาที่จัดสรรไว้ และจำนวนของการทำงานพร้อมกันที่เปิดใช้งาน
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart ช่วยให้คุณเริ่มต้นใช้งานแมชชีนเลิร์นนิงได้อย่างรวดเร็วและง่ายดายด้วยการเข้าถึงชุดโมเดลยอดนิยมต่างๆ ได้ในคลิกเดียว (หรือที่เรียกว่า “Model Zoo”) Jumpstart ยังมีโซลูชันแบบครบวงจรที่ช่วยแก้ปัญหาการใช้งาน ML ทั่วไป ซึ่งสามารถปรับแต่งได้ตามความต้องการของคุณ ไม่มีค่าใช้จ่ายเพิ่มเติมสำหรับการใช้โมเดลหรือโซลูชันของ JumpStart คุณจะถูกเรียกเก็บเงินตามชั่วโมงอินสแตนซ์ Training and Inference (การฝึกอบรมและการอนุมาน) ที่ใช้ไป ในระดับเดียวกันกับที่คุณสร้างด้วยตนเอง
-
Profiler
-
Amazon SageMaker Profiler จะรวบรวมข้อมูลในระบบเพื่อแสดงภาพแผนการติดตาม CPU และ GPU ความละเอียดสูง เครื่องมือนี้ได้รับการออกแบบมาเพื่อช่วยให้นักวิทยาศาสตร์ข้อมูลและวิศวกรสามารถระบุปัญหาคอขวดในด้านประสิทธิภาพที่เกี่ยวข้องกับฮาร์ดแวร์ในโมเดลดีปเลิร์นนิง ซึ่งจะช่วยประหยัดเวลาและต้นทุนการฝึกฝนตั้งแต่ต้นจนจบ ในปัจจุบัน SageMaker Profiler รองรับเฉพาะการสร้างโปรไฟล์งานการฝึกฝนที่ใช้ประโยชน์จากประเภทอินสแตนซ์การประมวลผลการฝึกฝน ml.g4dn.12xlarge, ml.p3dn.24xlarge และ ml.p4d.24xlarge
ภูมิภาค: สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), ยุโรป (แฟรงก์เฟิร์ต), ยุโรป (ไอร์แลนด์) และอิสราเอล (เทลอาวีฟ)ในปัจจุบัน Amazon SageMaker Profiler อยู่ในช่วงแสดงตัวอย่างและเปิดให้ใช้งานโดยไม่มีค่าใช้จ่ายสำหรับลูกค้าในภูมิภาคที่รองรับ
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod สร้างขึ้นเพื่อเร่งการพัฒนาโมเดลพื้นฐาน (FM) เพื่อให้การฝึกอบรม FM มีความยืดหยุ่นมากขึ้น จะตรวจสอบความสมบูรณ์ของคลัสเตอร์ ซ่อมแซมและแทนที่โหนดที่ผิดพลาดได้ทันที และบันทึกจุดตรวจบ่อยครั้งเพื่อดําเนินการฝึกอบรมต่อโดยอัตโนมัติโดยไม่สูญเสียความคืบหน้า SageMaker HyperPod กําหนดค่าล่วงหน้าด้วยไลบรารีการฝึกอบรมแบบกระจายของ SageMaker ที่ช่วยให้คุณปรับปรุงประสิทธิภาพการฝึกอบรม FM ได้ในขณะที่ใช้การประมวลผลของคลัสเตอร์และโครงสร้างพื้นฐานเครือข่ายของคลัสเตอร์ได้อย่างเต็มที่หมายเหตุ: ราคาของ SageMaker HyperPod ไม่ครอบคลุมค่าบริการที่เชื่อมต่อกับคลัสเตอร์ HyperPod เช่น Amazon EKS, Amazon FSx สำหรับ Lustre และ Amazon Simple Storage Service (Amazon S3)
-
การเพิ่มประสิทธิภาพการอนุมาน
-
ชุดเครื่องมือเพิ่มประสิทธิภาพการอนุมานช่วยให้คุณใช้เทคนิคการเพิ่มประสิทธิภาพการอนุมานล่าสุดได้ง่ายเพื่อให้บรรลุประสิทธิภาพต้นทุนที่ล้ำสมัย (SOTA) บน Amazon SageMaker ในขณะที่ประหยัดเวลานักพัฒนาหลายเดือน คุณสามารถเลือกจากเมนูเทคนิคการเพิ่มประสิทธิภาพยอดนิยมที่จัดทำโดย SageMaker และเรียกใช้งานการเพิ่มประสิทธิภาพล่วงหน้า เกณฑ์มาตรฐานโมเดลสำหรับเมตริกประสิทธิภาพและความแม่นยำ จากนั้นปรับใช้โมเดลที่ปรับให้เหมาะสมกับตำแหน่งข้อมูล SageMaker เพื่ออนุมานได้
รายละเอียดของอินสแตนซ์
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker P5
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำของอินสแตนซ์ (TiB) | รุ่นของ GPU | GPU | หน่วยความจำ GPU ทั้งหมด (GB) | หน่วยความจำต่อ GPU (GB) | แบนวิดท์เครือข่าย (Gbps) | GPUDirect RDMA | GPU แบบ Peer to Peer | พื้นที่เก็บข้อมูลอินสแตนซ์ (TB) | แบนด์วิดท์ EBS (Gbps) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | ใช้ได้ | 900 GB/s NVSwitch | 8x3.84 NVMe SSD | 80 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker P4d
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำของอินสแตนซ์ (GiB) | รุ่นของ GPU | GPU | หน่วยความจำ GPU ทั้งหมด (GB) | หน่วยความจำต่อ GPU (GB) | แบนวิดท์เครือข่าย (Gbps) | GPUDirect RDMA | GPU แบบ Peer to Peer | พื้นที่เก็บข้อมูลของอินสแตนซ์ (GB) | แบนวิดท์ EBS (Gbps) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA และ EFA | ใช้ได้ | NVSwitch 600 GB/วินาที | 8x1000 NVMe SSD | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA และ EFA | ใช่ | 600 GB/s NVSwitch | 8X1000 NVMe SSD | 19 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker P3
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำของอินสแตนซ์ (GiB) | รุ่นของ GPU | GPU | หน่วยความจำ GPU ทั้งหมด (GB) | หน่วยความจำต่อ GPU (GB) | แบนวิดท์เครือข่าย (Gbps) | GPU แบบ Peer to Peer | พื้นที่เก็บข้อมูลของอินสแตนซ์ (GB) | แบนด์วิดท์ EBS (Gbps) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | สูงสุด 10 | ไม่มี | EBS เท่านั้น | 1.5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | EBS เท่านั้น | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | EBS เท่านั้น | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900 NVMeSSD | 19 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker P2
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำของอินสแตนซ์ (GiB) | รุ่นของ GPU | GPU | หน่วยความจำ GPU ทั้งหมด (GB) | หน่วยความจำต่อ GPU (GB) | แบนวิดท์เครือข่าย (Gbps) | แบนด์วิดท์ EBS (Gbps) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | สูงสุด 10 | สูง |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker G4
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำของอินสแตนซ์ (GiB) | รุ่นของ GPU | GPU | หน่วยความจำ GPU ทั้งหมด (GB) | หน่วยความจำต่อ GPU (GB) | แบนวิดท์เครือข่าย (Gbps) | พื้นที่เก็บข้อมูลของอินสแตนซ์ (GB) | แบนวิดท์ EBS (Gbps) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | สูงสุด 25 | 1 x 125 NVMe SSD | สูงสุด 3.5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | สูงสุด 25 | 1 x 125 NVMe SSD | สูงสุด 3.5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | สูงสุด 25 | 1 x 125 NVMe SSD | 4.75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 NVMe SSD | 9.5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 NVMe SSD | 9.5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 NVMe SSD | 9.5 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker G5
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำของอินสแตนซ์ (GiB) | รุ่นของ GPU | GPU | หน่วยความจำ GPU ทั้งหมด (GB) | หน่วยความจำต่อ GPU (GB) | แบนวิดท์เครือข่าย (Gbps) | แบนวิดท์ EBS (Gbps) | พื้นที่เก็บข้อมูลของอินสแตนซ์ (GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | สูงสุด 10 | สูงสุด 3.5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | สูงสุด 10 | สูงสุด 3.5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | สูงสุด 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker Trn1
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำ (GiB) | Trainium Accelerator | หน่วยความจำของ Accelerator ทั้งหมด (GB) | หน่วยความจำต่อ Accelerator (GB) | พื้นที่เก็บข้อมูลอินสแตนซ์ (GB) | แบนด์วิดท์เครือข่าย (Gbps) | แบนด์วิดท์ EBS (Gbps) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 NVMe SSD | สูงสุด 12.5 | สูงสุด 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 NVMe SSD | 800 | 80 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker Inf1
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำ (GiB) | Inferentia Accelerator | หน่วยความจำของ Accelerator ทั้งหมด (GB) | หน่วยความจำต่อ Accelerator (GB) | พื้นที่เก็บข้อมูลอินสแตนซ์ | Inter-Accelerator Interconnect | แบนด์วิดท์เครือข่าย (Gbps) | แบนด์วิดท์ EBS (Gbps) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | EBS เท่านั้น | ไม่ระบุ | สูงสุด 25 | สูงสุด 4.75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | EBS เท่านั้น | ไม่ระบุ | สูงสุด 25 | สูงสุด 4.75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | EBS เท่านั้น | ใช้ได้ | 25 | 4.75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | EBS เท่านั้น | ใช้ได้ | 100 | 19 |
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon SageMaker Inf2
ขนาดของอินสแตนซ์ | vCPU | หน่วยความจำ (GiB) | Inferentia Accelerator | หน่วยความจำของ Accelerator ทั้งหมด (GB) | หน่วยความจำต่อ Accelerator (GB) | พื้นที่เก็บข้อมูลอินสแตนซ์ | Inter-Accelerator Interconnect | แบนด์วิดท์เครือข่าย (Gbps) | แบนด์วิดท์ EBS (Gbps) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | EBS เท่านั้น | ไม่ระบุ | สูงสุด 25 | สูงสุด 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | EBS เท่านั้น | ไม่ระบุ | สูงสุด 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | EBS เท่านั้น | ใช้ได้ | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | EBS เท่านั้น | มี | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio เป็นอินเทอร์เฟซบนเว็บเดียวสําหรับการพัฒนา ML ที่สมบูรณ์ นำเสนอตัวเลือกสภาพแวดล้อมการพัฒนาแบบผสานรวม (IDE) ที่มีการจัดการเต็มรูปแบบและเครื่องมือที่สร้างขึ้นตามวัตถุประสงค์ คุณสามารถเข้าถึง SageMaker Studio ได้โดยไม่เสียค่าใช้จ่าย คุณจะเสียค่าใช้จ่ายสําหรับการประมวลผลและพื้นที่จัดเก็บข้อมูลพื้นฐานที่คุณใช้สําหรับเครื่องมือ IDE และ ML ต่างๆ ภายใน SageMaker Studio เท่านั้น
คุณสามารถใช้บริการต่าง ๆ จาก SageMaker Studio, AWS SDK for Python (Boto3) หรือ AWS Command Line Interface (AWS CLI) รวมถึงสิ่งต่อไปนี้:
- IDE บน SageMaker Studio เพื่อดําเนินการพัฒนาแมชชีนเลิร์นนิงที่สมบูรณ์ด้วยชุด IDE ที่มีการจัดการเต็มรูปแบบรวมถึง JupyterLab, Code Editor ที่อ้างอิงจาก Code-OSS (Visual Studio Code – Open Source) และ RStudio
- SageMaker Pipelines เพื่อจัดการและทำเวิร์กโฟลว์ของแมชชีนเลิร์นนิงให้เป็นอัตโนมัติ
- SageMaker Autopilot เพื่อสร้างโมเดล ML โดยอัตโนมัติซึ่งสามารถมองเห็นได้อย่างสมบูรณ์
- SageMaker Experiments เพื่อจัดการและติดตามงานในการฝึกฝนและเวอร์ชันต่างๆ
- SageMaker Debugger เพื่อแก้จุดบกพร่องของความผิดปกติต่างๆ ในระหว่างการฝึกอบรม
- SageMaker Model Monitor เพื่อดูแลรักษาโมเดลให้มีคุณภาพสูง
- SageMaker Clarify เพื่ออธิบายโมเดล ML ของคุณให้ดียิ่งขึ้นและตรวจหาความเอนเอียง
- SageMaker JumpStart เพื่อปรับใช้โซลูชัน ML สำหรับกรณีการใช้งานต่างๆ อย่างง่ายดาย คุณอาจเสียค่าบริการจากบริการอื่น ๆ ของ AWS ที่ใช้ในโซลูชันสำหรับการเรียกใช้ API พื้นฐานโดย Amazon SageMaker ในนามของคุณ
- SageMaker Inference Recommender เพื่อรับคำแนะนำสำหรับการกำหนดค่าตำแหน่งข้อมูลที่เหมาะสม
คุณจะจ่ายเฉพาะทรัพยากรในการประมวลผลและพื้นที่จัดเก็บข้อมูลพื้นฐานภายใน SageMaker หรือบริการอื่น ๆ ของ AWS ตามการใช้งานจริงของคุณเท่านั้น
ในการใช้ Amazon Q Developer ใน JupyterLab คุณต้องสมัครสมาชิก Amazon Q Developer Pro ราคานักพัฒนาซอฟต์แวร์ Amazon Q มีให้ ที่นี่
การประเมินโมเดลพื้นฐาน
SageMaker Clarify รองรับการประเมินโมเดลพื้นฐานด้วยวิธีการประเมินทั้งแบบอัตโนมัติและโดยมนุษย์ ซึ่งแต่ละแบบจะมีค่าบริการที่ต่างกัน หากคุณกำลังประเมินโมเดลพื้นฐานจาก Amazon SageMaker JumpStart ที่ยังไม่ได้ปรับใช้กับบัญชีของคุณ SageMaker จะปรับใช้โมเดล JumpStart บนอินสแตนซ์ SageMaker ชั่วคราวตลอดระยะเวลาการอนุมาน อินสแตนซ์เฉพาะจะเป็นไปตามคำแนะนำอินสแตนซ์ของ JumpStart สำหรับโมเดลนั้น
การประเมินอัตโนมัติ:
การประเมินโมเดลพื้นฐานจะทำงานเป็นงานการประมวลผลของ SageMaker งานการประเมินจะเรียกดำเนินการ SageMaker Inference ลูกค้าจะถูกเรียกเก็บค่าบริการสำหรับการอนุมานและงานการประเมิน ลูกค้าจะถูกเรียกเก็บเงินตามระยะเวลาของงานการประเมินเท่านั้น ค่าใช้จ่ายของงานการประเมินจะเป็นผลรวมของค่าใช้จ่ายต่อชั่วโมงของอินสแตนซ์การประเมิน และผลรวมของค่าใช้จ่ายต่อชั่วโมงของอินสแตนซ์ที่โฮสต์
การประเมินโดยมนุษย์:
เมื่อคุณใช้ฟีเจอร์การประเมินโดยมนุษย์โดยการนำพนักงานมาดำเนินการเอง คุณจะถูกเรียกเก็บค่าบริการสำหรับ 3 รายการดังนี้: 1) อินสแตนซ์ SageMaker ที่ใช้สำหรับการอนุมาน 2) อินสแตนซ์ที่ใช้ในการรันงาน SageMaker Processing ที่โฮสต์การประเมินโดยมนุษย์ และ 3 ) ค่าบริการ 0.21 USD ต่องานการประเมินโดยมนุษย์ที่เสร็จสมบูรณ์แล้ว งานของมนุษย์เกิดขึ้นเมื่อผู้ปฏิบัติงานส่งการประเมินพรอมต์เดียวและการตอบสนองการอนุมานที่เกี่ยวข้องโดยใช้อินเทอร์เฟซผู้ใช้สำหรับการประเมินโดยมนุษย์ ค่าบริการจะเท่ากันไม่ว่าคุณจะมีโมเดล 1 หรือ 2 ตัวในงานการประเมินของคุณ หรือคุณจะเป็นผู้ดำเนินการอนุมานด้วยตนเอง และไม่ว่าคุณจะรวมมิติข้อมูลการประเมินและวิธีการให้คะแนนจำนวนเท่าใด ก็จะยังมีค่าบริการเท่ากัน ค่าบริการ 0.21 USD ต่องานจะเท่ากันสำหรับทุก AWS Region ไม่มีค่าใช้จ่ายแบบแยกต่างหากสำหรับแรงงาน เนื่องจากคุณเป็นผู้จัดหาแรงงานเอง
การประเมินที่จัดการโดย AWS:
สำหรับการประเมินโดยผู้เชี่ยวชาญที่จัดการโดย AWS ค่าบริการจะถูกปรับแต่งตามความต้องการในการประเมินของคุณในการมีส่วนร่วมแบบส่วนตัวในขณะที่ทำงานร่วมกับทีมประเมินผลโดยผู้เชี่ยวชาญของ AWS
Amazon SageMaker Studio Lab
คุณสามารถสร้างและฝึกอบรมโมเดล ML โดยใช้ Amazon SageMaker Studio Lab ได้ฟรี SageMaker Studio Lab มอบสภาพแวดล้อมในการพัฒนาแบบไม่ต้องกำหนดค่าให้กับนักพัฒนา นักวิชาการ และนักวิทยาศาสตร์ข้อมูล เพื่อเรียนรู้และทดลองกับ ML โดยไม่ต้องเสียค่าใช้จ่ายเพิ่มเติม
Amazon SageMaker Canvas
Amazon SageMaker Canvas ขยายขอบเขตการเข้าถึง ML โดยมอบความสามารถในการสร้างการคาดการณ์ ML ที่แม่นยำให้กับนักวิเคราะห์ธุรกิจโดยใช้อินเทอร์เฟซชี้และคลิกแบบภาพ ซึ่งไม่จำเป็นต้องเขียนโค้ดหรือมีประสบการณ์ในการใช้งาน ML มาก่อน
การติดป้ายข้อมูลของ Amazon SageMaker
การติดป้ายข้อมูลของ Amazon SageMaker มอบข้อเสนอการติดป้ายข้อมูลสองแบบ ได้แก่ Amazon SageMaker Ground Truth Plus และ Amazon SageMaker Ground Truth คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับการระบุประเภทข้อมูลของ Amazon SageMaker บริการติดป้ายข้อมูลที่มีการจัดการอย่างเต็มรูปแบบ ซึ่งช่วยให้สร้างชุดข้อมูลการฝึกฝนที่มีความแม่นยำสูงสำหรับ ML ได้อย่าง่ายดาย
การทดสอบก่อนใช้งานจริง (Shadow Testing) ของ Amazon SageMaker
SageMaker ช่วยให้คุณสามารถเรียกใช้การทดสอบก่อนใช้งานจริง (Shadow Testing) เพื่อประเมินโมเดล ML ใหม่ก่อนการเปิดตัวจริงโดยการทดสอบประสิทธิภาพกับโมเดลที่ใช้งานอยู่ในปัจจุบัน โดยไม่มีค่าใช้จ่ายเพิ่มเติมสำหรับการเรียกใช้การทดสอบก่อนใช้งานจริง (Shadow Testing) ของ SageMaker นอกเหนือจากค่าใช้จ่ายการใช้งานสำหรับอินสแตนซ์ ML และพื้นที่จัดเก็บ ML ที่จัดเตรียมเพื่อโฮสต์โมเดลเสมือนจริง ราคาสำหรับอินสแตนซ์ ML และขนาดพื้นที่จัดเก็บ ML จะเหมือนกับตัวเลือกการอนุมานแบบเรียลไทม์ที่ระบุไว้ในตารางราคาก่อนหน้านี้ ไม่มีค่าใช้จ่ายเพิ่มเติมสำหรับข้อมูลที่ประมวลผลทั้งในและนอกการปรับใช้การทดสอบก่อนมีการนำไปใช้จริง
Amazon SageMaker Edge
เรียนรู้เพิ่มเติมเกี่ยวกับราคาสำหรับ Amazon SageMaker Edge เพื่อเพิ่มประสิทธิภาพ รัน และตรวจสอบโมเดล ML บนกลุ่มอุปกรณ์ Edge
Amazon SageMaker Savings Plans
Amazon SageMaker Savings Plans ช่วยลดค่าใช้จ่ายของคุณได้สูงสุด 64% โดยแผนจะมีผลกับการใช้งานอินสแตนซ์ SageMaker ML ที่มีสิทธิ์โดยอัตโนมัติ รวมถึง SageMaker Studio Notebooks, อินสแตนซ์โน้ตบุ๊กของ SageMaker, การประมวลผล SageMaker, SageMaker Data Wrangler, การฝึกอบรม SageMaker, การอนุมานแบบเรียลไทม์ของ SageMaker และ SageMaker Batch Transform ไม่ว่าจะเป็นกลุ่มประเภทอินสแตนซ์ ขนาด หรือ Region ใด ตัวอย่างเช่น คุณสามารถเปลี่ยนแปลงการใช้งานจากอินสแตนซ์ CPU ml.c5.xlarge ที่ทำงานในสหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ) เป็นอินสแตนซ์ ml.Inf1 ในสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับเวิร์กโหลดการอนุมานได้ทุกเมื่อและยังคงชำระเงินตามราคาของ Savings Plans โดยอัตโนมัติ
ต้นทุนรวมในการเป็นเจ้าของ (TCO) เมื่อใช้ Amazon SageMaker
Amazon SageMaker ช่วยลดต้นทุนรวมในการเป็นเจ้าของ (TCO) ได้อย่างน้อย 54% ตลอดระยะเวลาสามปี เมื่อเทียบกับโซลูชันจัดการเองบนระบบคลาวด์แบบอื่นๆ เรียนรู้เพิ่มเติมกับการวิเคราะห์ TCO ที่ครบถ้วนสำหรับ Amazon SageMaker
ตัวอย่างราคา
-
ตัวอย่างราคาที่ 1: JupyterLab
ในฐานะนักวิทยาศาสตร์ข้อมูล คุณใช้เวลา 20 วันในการใช้ JupyterLab เพื่อการทดลองอย่างรวดเร็วบนโน้ตบุ๊ก โค้ด และข้อมูลเป็นเวลา 6 ชั่วโมงต่อวันบนอินสแตนซ์ ml.g4dn.xlarge คุณสร้างและเรียกใช้พื้นที่ JupyterLab เพื่อเข้าถึง IDE ของ JupyterLab การประมวลผลจะเสียค่าใช้จ่ายสําหรับอินสแตนซ์ที่ใช้เมื่อพื้นที่ JupyterLab กําลังทํางานอยู่เท่านั้น เสียค่าบริการพื้นที่เก็บข้อมูลสําหรับพื้นที่ JupyterLab ที่เกิดขึ้นจนกว่าจะถูกลบการประมวลผล
อินสแตนซ์ ระยะเวลา วัน ระยะเวลารวม ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด ml.g4dn.xlarge 6 ชั่วโมง 20 6 * 20 = 120 ชั่วโมง 0.7364 USD 88.368 USD พื้นที่จัดเก็บ
คุณจะใช้พื้นที่จัดเก็บ SSD เอนกประสงค์เป็นเวลา 480 ชั่วโมง (24 ชั่วโมง * 20 วัน) ในภูมิภาคที่คิดค่าบริการ 0.1125 USD ต่อ GB ต่อเดือน:
0.112 USD ต่อ GB ต่อเดือน * 5 GB * 480 / (24 ชั่วโมง/วัน * เดือนละ 30 วัน) = 0.373 USD -
ตัวอย่างราคาที่ 2: Code Editor
ในฐานะวิศวกร ML คุณใช้เวลา 20 วันในการใช้ Code Editor สําหรับการแก้ไข การดําเนินการ และการดีบักโค้ดการผลิต ML เป็นเวลา 6 ชั่วโมงต่อวันบนอินสแตนซ์ ml.g4dn.xlarge คุณสร้างและเรียกใช้พื้นที่ Code Editor เพื่อเข้าถึง IDE ของ Code Editor การประมวลผลจะเสียค่าใช้จ่ายสําหรับอินสแตนซ์ที่ใช้เมื่อพื้นที่ Code Editor กําลังทํางานอยู่เท่านั้น เสียค่าบริการพื้นที่เก็บข้อมูลสําหรับพื้นที่ Code Editor ที่เกิดขึ้นจนกว่าจะถูกลบการประมวลผล
อินสแตนซ์ ระยะเวลา วัน ระยะเวลารวม ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด ml.g4dn.xlarge 6 ชั่วโมง 20 6 * 20 = 120 ชั่วโมง 0.7364 USD 88.368 USD พื้นที่จัดเก็บ
คุณจะใช้พื้นที่จัดเก็บ SSD เอนกประสงค์เป็นเวลา 480 ชั่วโมง (24 ชั่วโมง * 20 วัน) ในภูมิภาคที่คิดค่าบริการ 0.1125 USD ต่อ GB ต่อเดือน:
0.112 USD ต่อ GB ต่อเดือน * 5 GB * 480 / (24 ชั่วโมง/วัน * เดือนละ 30 วัน) = 0.373 USD
-
ตัวอย่างราคาที่ 3: Studio Classic
นักวิทยาศาสตร์ข้อมูลจะต้องทำตามลำดับการดำเนินการดังต่อไปนี้ขณะที่ใช้ โน้ตบุ๊คใน Amazon SageMaker Studio Classic
- เปิดโน้ตบุ๊ก 1 ในเคอร์เนล TensorFlow บนอินสแตนซ์ ml.c5.xlarge จากนั้นทำงานบนโน้ตบุ๊กนี้เป็นเวลา 1 ชั่วโมง
- เปิดโน้ตบุ๊ก 2 บนอินสแตนซ์ ml.c5.xlarge ระบบจะเปิดในอินสแตนซ์ ml.c5.xlarge เดียวกันกับที่เรียกใช้ในโน้ตบุ๊ก 1 โดยอัตโนมัติ
- ทำงานบนโน้ตบุ๊ค 1 และโน้ตบุ๊ค 2 พร้อมกันเป็นเวลา 1 ชั่วโมง
- นักวิทยาศาสตร์ข้อมูลจะถูกเรียกเก็บค่าบริการสำหรับการใช้งาน ml.c5.xlarge ทั้งหมด 2 ชั่วโมง สำหรับชั่วโมงที่เหลื่อมล้ำกันในขณะที่ทำงานบนโน้ตบุ๊ก 1 และโน้ตบุ๊ก 2 พร้อมกันนั้น ระบบจะวัดแอปพลิเคชันเคอร์เนลแต่ละรายการเป็นเวลา 0.5 ชั่วโมง และจะเรียกเก็บค่าบริการสำหรับการใช้งาน 1 ชั่วโมง
แอปพลิเคชันเคอร์เนล อินสแตนซ์โน้ตบุ๊ก ชั่วโมง ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด TensorFlow ml.c5.xlarge 1 0.204 USD 0.204 USD TensorFlow ml.c5.xlarge 0.5 0.204 USD 0.102 USD วิทยาศาสตร์ข้อมูล ml.c5.xlarge 0.5 0.204 USD 0.102 USD 0.408 USD -
ตัวอย่างราคาที่ 4: RStudio
นักวิทยาศาสตร์ข้อมูลจะต้องทำตามลำดับการดำเนินการต่อไปนี้ในขณะที่ใช้ RStudio
- เปิด RSession 1 บนอินสแตนซ์ ml.c5.xlarge จากนั้นทำงานบนโน้ตบุ๊กนี้เป็นเวลา 1 ชั่วโมง
- เปิด RSession 2 บนอินสแตนซ์ ml.c5.xlarge ระบบจะเปิดในอินสแตนซ์ ml.c5.xlarge เดียวกันกับที่เรียกใช้ใน RSession 1 โดยอัตโนมัติ
- ทำงานบน RSesssion 1 และ RSession 2 พร้อมกันเป็นเวลา 1 ชั่วโมง
- นักวิทยาศาสตร์ข้อมูลจะถูกเรียกเก็บค่าบริการสำหรับการใช้งาน ml.c5.xlarge ทั้งหมดสอง (2) ชั่วโมง สำหรับชั่วโมงที่เหลื่อมล้ำกันในขณะที่ทำงานบน RSession 1 และ RSession 2 พร้อมกันนั้น ระบบจะวัดการใช้งาน RSession แต่ละรายการเป็นเวลา 0.5 ชั่วโมง และจะเรียกเก็บค่าบริการสำหรับการใช้งาน 1 ชั่วโมง
ในขณะเดียวกัน RServer ก็ทำงานทุกวันตลอด 24 ชั่วโมง ไม่ว่าจะเปิด RSession หรือไม่ก็ตาม หากผู้ดูแลระบบเลือก "Small" (ml.t3.medium) แสดงว่าไม่เสียค่าใช้จ่าย หากผู้ดูแลระบบเลือก "Medium" (ml.c5.4xlarge) หรือ "Large" (ml.c5.9xlarge) ระบบจะเรียกเก็บเงินเป็นรายชั่วโมงตามเวลาที่เปิดใช้งาน RStudio สำหรับโดเมน SageMaker
แอป RSession อินสแตนซ์ RSession ชั่วโมง ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด Base R ml.c5.xlarge 1 0.204 USD 0.204 USD Base R ml.c5.xlarge 0.5 0.204 USD 0.102 USD Base R ml.c5.xlarge 0.5 0.204 USD 0.102 USD 0.408 USD -
ตัวอย่างราคาที่ 5: การประมวลผล
Amazon SageMaker Processing จะคิดค่าใช้จ่ายเฉพาะอินสแตนซ์ที่ใช้ขณะเรียกใช้งานของคุณเท่านั้น เมื่อคุณจัดเตรียมข้อมูลอินพุตสำหรับการประมวลผลใน Amazon S3 แล้ว Amazon SageMaker จะดาวน์โหลดข้อมูลจาก Amazon S3 ไปยังพื้นที่จัดเก็บไฟล์ภายในระบบเมื่อเริ่มต้นงานประมวลผล
นักวิเคราะห์ข้อมูลเรียกใช้งานประมวลผลเพื่อประมวลผลล่วงหน้าและตรวจสอบความถูกต้องของข้อมูลบนอินสแตนซ์ ml.m5.4xlarge สองรายการเป็นระยะเวลางาน 10 นาที เธออัปโหลดชุดข้อมูลขนาด 100 GB ใน S3 เพื่อเป็นอินพุตสำหรับงานประมวลผล และจะจัดเก็บข้อมูลเอาต์พุต (ที่มีขนาดเท่ากัน) ไว้ใน S3
ชั่วโมง อินสแตนซ์การประมวลผล ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด 1 * 2 * 0.167 = 0.334 ml.m5.4xlarge 0.922 USD 0.308 USD พื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไป (GB) ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด 100 GB * 2 = 200 0.14 USD 0.0032 USD ผลรวมย่อยสำหรับงานประมวลผลของ Amazon SageMaker = 0.308 USD
ผลรวมย่อยสำหรับพื้นที่จัดเก็บข้อมูล SSD สำหรับการใช้ทั่วไปขนาด 200 GB = 0.0032 USD
ราคารวมสำหรับตัวอย่างนี้คือ 0.3112 USD
-
ตัวอย่างราคาที่ 6: Data Wrangler
จากตาราง คุณใช้งาน Amazon SageMaker Data Wrangler ทั้งหมด 18 ชั่วโมง ตลอด 3 วันเพื่อจัดเตรียมข้อมูลของคุณ นอกจากนี้ คุณยังสร้าง SageMaker Data Wrangler job เพื่อเตรียมข้อมูลที่อัพเดตเป็นรายสัปดาห์ แต่ละงานจะใช้เวลา 40 นาที และงานจะรันทุกสัปดาห์เป็นเวลา 1 เดือน
ค่าใช้จ่ายรายเดือนโดยรวมของคุณในการใช้งาน Data Wrangler = 16.596 USD + 2.461 USD = 19.097 USD
แอปพลิเคชัน อินสแตนซ์ SageMaker Studio วัน ระยะเวลา ระยะเวลารวม ค่าใช้จ่ายต่อชั่วโมง ผลรวมย่อยของค่าใช้จ่าย SageMaker Data Wrangler ml.m5.4xlarge 3 6 ชั่วโมง 18 ชั่วโมง 0.922 USD 16.596 USD SageMaker Data Wrangler Job ml.m5.4xlarge - 40 นาที 2.67 ชั่วโมง 0.922 USD 2.461 USD ในฐานะนักวิทยาศาสตร์ข้อมูล คุณใช้เวลา 3 วันในการใช้งาน Amazon SageMaker Data Wrangler เพื่อเรียบเรียง สำรวจ และแสดงภาพข้อมูลของคุณเป็นเวลา 6 ชั่วโมงต่อวัน ในการดำเนินการตามไปป์ไลน์สำหรับเตรียมข้อมูลของคุณ คุณต้องเริ่ม SageMaker Data Wrangler job ที่มีกำหนดให้ทำงานทุกสัปดาห์
ตารางด้านล่างจะสรุปปริมาณการใช้งานโดยรวมของคุณตลอดทั้งเดือนและค่าใช้จ่ายที่เกี่ยวข้องกับการใช้งาน Amazon SageMaker Data Wrangler
-
ตัวอย่างราคาที่ 7: แหล่งเก็บคุณสมบัติ
++ จำนวนหน่วยการอ่านที่ไม่เต็มหน่วยจะถูกปัดเศษขึ้นเป็นจำนวนหน่วยถัดไป
พื้นที่จัดเก็บข้อมูล
จัดเก็บข้อมูลรวม = 31.5 GB
ค่าใช้จ่ายรายเดือนสำหรับการจัดเก็บข้อมูล = 31.5 GB * 0.45 USD = 14.175 USDค่าใช้จ่ายรายเดือนสำหรับ Amazon SageMaker Feature Store = 56.875 USD + 3.185 USD + 14.175 USD = 74.235 USD
วันของเดือน การเขียนทั้งหมด หน่วยการเขียนทั้งหมด การอ่านทั้งหมด หน่วยการอ่านทั้งหมด วันที่ 1 ถึงวันที่ 10 การเขียน 100,000 รายการ
(การเขียน 10,000 รายการ * 10 วัน)2,500,000
(100,000 * 25KB )100,000
(10,000 * 10 วัน)700,000++
(100,000 * 25/4 KB )วันที่ 11 การเขียน 200,000 รายการ 5,000,000
(200,000* 25KB)การอ่าน 200,000 รายการ 1,400,000++
(200,000* 25/4KB)วันที่ 12 ถึง วันที่ 30 การเขียน 1,520,000 รายการ
(80,000 * 19 วัน)38,000,000
(1,520,000 * 25 KB)การเขียน 1,520,000 รายการ
(80,000 * 19 วัน)มากกว่า 10,640,000
(1,520,000 * 25/4 KB)หน่วยที่คิดค่าใช้จ่ายทั้งหมด การเขียน 45,500,000 รายการ การเขียน 12,740,000 รายการ ค่าใช้จ่ายรายเดือนสำหรับการเขียนและการอ่าน 56.875 USD
(45.5 ล้านหน่วยการเขียน * 1.25 USD ต่อการเขียนล้านรายการ)3.185 USD
(12.74 ล้านหน่วยการอ่าน * 0.25 USD ต่อการอ่านล้านรายการ)คุณมีเว็บแอปพลิเคชันที่ออกการอ่านและการเขียนรายการละ 25 KB ใน Amazon SageMaker Feature Store สำหรับช่วง 10 วันแรกของเดือน คุณจะพบปัญหาการรับส่งข้อมูลเล็กน้อย ส่งผลให้มีการเขียน 10,000 รายการและอ่าน 10,000 รายการต่อวันไปยัง SageMaker Feature Store ในวันที่ 11 ของเดือน แอพพลิเคชันของคุณเป็นที่สนใจบนสื่อสังคมออนไลน์และการรับส่งข้อมูลของแอปพลิเคชันพุ่งสูงขึ้นเป็นการอ่าน 200,000 รายการและการเขียน 200,000 รายการในวันนั้น จากนั้นแอพพลิเคชันของคุณจึงกลับเข้าสู่รูปแบบการรับส่งข้อมูลปกติ โดยเฉลี่ยในแต่ละวันมีการเขียน 80,000 รายการและการอ่าน 80,000 รายการตลอดทั้งเดือน
ตารางด้านล่างสรุปปริมาณการใช้งานโดยรวมของคุณตลอดทั้งเดือนและค่าใช้จ่ายที่เกี่ยวข้องกับการใช้งาน Amazon SageMaker Feature Store
-
ตัวอย่างราคาที่ 8: การฝึกอบรม
ค่าบริการรวมทั้งหมดสำหรับการฝึกอบรมและการแก้จุดบกพร่องในตัวอย่างนี้คือ 2.38 USD อินสแตนซ์ของการประมวลผลและไดรฟ์ข้อมูลพื้นที่จัดเก็บข้อมูลสำหรับการใช้ทั่วไปที่ใช้งานโดยกฎที่มีอยู่แล้วของ Amazon SageMaker Debugger จะไม่มีค่าบริการเพิ่มเติม
พื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไปสำหรับการฝึกอบรม (GB) พื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไปสำหรับกฎในตัวของ Debugger (GB) พื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไปสำหรับกฎแบบกำหนดเองของ Debugger (GB) ค่าใช้จ่ายต่อ GB ต่อเดือน ผลรวมย่อย ความจุที่ใช้ 3 2 1 ราคา 0 USD ไม่มีค่าบริการเพิ่มเติมสำหรับไดรฟ์ข้อมูลพื้นที่จัดเก็บของกฎในตัว 0 USD 0.10 USD 0 USD ชั่วโมง อินสแตนซ์การฝึกอบรม อินสแตนซ์แก้จุดบกพร่อง ค่าใช้จ่ายต่อชั่วโมง ผลรวมย่อย 4 * 0.5 = 2.00 ml.m4.4xlarge ไม่ระบุ 0.96 USD 1.92 USD 4 * 0.5 * 2 = 4 ไม่ระบุ ไม่มีค่าบริการเพิ่มเติมสำหรับอินสแตนซ์ของกฎในตัว 0 USD 0 USD 4 * 0.5 = 2 ml.m5.xlarge ไม่ระบุ 0.23 USD 0.46 USD ------- 2.38 USD นักวิทยาศาสตร์ข้อมูลคนหนึ่งได้ใช้เวลาหนึ่งสัปดาห์ในการพัฒนาโมเดลสำหรับไอเดียใหม่ เธอฝึกอบรมแบบจำลอง4 ครั้งใน ml.m4.4xlarge ใหญ่เป็นเวลา 30 นาทีต่อการฝึกซ้อมกับ Amazon SageMaker Debugger เปิดใช้งานโดยใช้กฎในตัว 2 ตัวและกฎที่กำหนดเอง 1 ข้อที่เธอเขียน สำหรับกฎแบบกำหนดเอง เธอระบุอินสแตนซ์ ml.m5.xlarge เธอฝึกโดยใช้ข้อมูลการฝึกอบรมขนาด 3 GB ใน Amazon S3 และส่งเอาต์พุตโมเดล 1 GB ไปยัง Amazon S3 SageMaker สร้างไดรฟ์ข้อมูล SSD (gp2) สำหรับงานทั่วไปสำหรับอินสแตนซ์การฝึกอบรมแต่ละรายการ SageMaker ยังสร้างไดรฟ์ข้อมูล SSD (gp2) สำหรับงานทั่วไปสำหรับแต่ละกฎที่ระบุด้วย ในตัวอย่างนี้ ระบบจะสร้างไดรฟ์ข้อมูล SSD (gp2) สำหรับงานทั่วไปจำนวน 4 รายการ SageMaker Debugger จะปล่อยข้อมูลการแก้จุดบกพร่อง 1 GB ไปยังบัคเก็ต Amazon S3 ของลูกค้า
-
ตัวอย่างราคาที่ 9: MLflow
คุณมีนักวิทยาศาสตร์ข้อมูลสองทีม ทีมหนึ่งที่มีนักวิทยาศาสตร์ข้อมูล 10 คนและอีกทีมหนึ่งที่มีนักวิทยาศาสตร์ข้อมูล 40 คน เพื่อรองรับทั้งสองทีมนี้ คุณเลือกที่จะเปิดใช้งานเซิร์ฟเวอร์ติดตาม MLflow สองเซิร์ฟเวอร์ที่แตกต่างกัน: หนึ่งตัวเล็ก และตัวกลางหนึ่ง แต่ละทีมกำลังทำการทดลองการเรียนรู้ของแมชชีนเลิร์นนิง (ML) และจำเป็นต้องบันทึกเมตริกพารามิเตอร์และสิ่งประดิษฐ์ที่ผลิตโดยความพยายามในการฝึกอบรม พวกเขาต้องการใช้เซิร์ฟเวอร์ติดตาม MLflow เป็นเวลา 160 ชั่วโมงต่อเดือน สมมติว่าทีมวิทยาศาสตร์ข้อมูลแต่ละคนเก็บข้อมูลเมตาขนาด 1 GB เพื่อติดตามการทำงานในการทดลอง ใบเรียกเก็บค่าบริการเมื่อสิ้นเดือนจะถูกคำนวณดังนี้
ค่าใช้จ่ายในการคำนวณสำหรับอินสแตนซ์ขนาดเล็ก: 160* 0.60 USD= 96 USD
ค่าใช้จ่ายในการคำนวณสำหรับอินสแตนซ์ขนาดกลาง: 160* 1.40 USD= 166.4 USD
ค่าจัดเก็บข้อมูลสำหรับสองทีม: 2 * 1 * 0.10 = 0.20 USDทั้งหมด = 262.60 USD
-
ตัวอย่างราคาที่ 10: การอนุมานแบบเรียลไทม์
ผลรวมย่อยสำหรับการฝึกอบรม การโฮสต์ และการตรวจสอบ = 305.827 USD ผลรวมย่อยสำหรับข้อมูลที่ประมวลผลเข้า 3,100 MB และข้อมูลที่ประมวลผลออก 310 MB สำหรับการโฮสต์ต่อเดือน = 0.054 USD ค่าบริการรวมสำหรับตัวอย่างนี้คือ 305.881 USD
โปรดทราบ สำหรับกฎในตัวที่มีอินสแตนซ์ ml.m5.xlarge คุณจะได้รับการตรวจสอบรวมสูงสุด 30 ชั่วโมงในแต่ละเดือนสำหรับตำแหน่งข้อมูลทั้งหมดโดยไม่มีค่าใช้จ่าย
ข้อมูลเข้าต่อเดือน – การโฮสต์ ข้อมูลออกต่อเดือน – การโฮสต์ ค่าใช้จ่ายต่อ GB เข้าหรือออก รวมทั้งหมด 100 MB * 31 = 3,100 MB 0.016 USD 0.0496 USD 10 MB * 31 = 310 MB 0.016 USD 0.00496 USD ชั่วโมงต่อเดือน อินสแตนซ์การโฮสต์ อินสแตนซ์การตรวจสอบโมเดล ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด 24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 USD 303.522 USD 31*0.08 = 2.5 ml.m5.4xlarge 0.922 USD 2.305 USD โมเดลในตัวอย่างที่ 5 จะปรับใช้ในการใช้งานจริงกับอินสแตนซ์ ml.c5.xlarge สอง (2) รายการเพื่อการโฮสต์แบบ Multi-AZ ที่น่าเชื่อถือ โดยจะเปิดใช้งาน Amazon SageMaker Model Monitor กับอินสแตนซ์ ml.m5.4xlarge หนึ่ง (1) รายการ และกำหนดเวลางานตรวจสอบวันละครั้ง งานตรวจสอบแต่ละงานใช้เวลาดำเนินการ 5 นาที โมเดลจะได้รับข้อมูล 100 MB ต่อวัน และการอนุมานจะมีขนาด 1 ใน 10 ของข้อมูลอินพุต
-
ตัวอย่างราคาที่ 11: การอนุมานแบบอะซิงโครนัส
ผลรวมย่อยสำหรับการอนุมานแบบอะซิงโครนัสของ SageMaker = 15.81 USD + 0.56 USD + 2 * .0048 = 16.38 USD ค่าบริการการอนุมานแบบอะซิงโครนัสรวมสำหรับตัวอย่างนี้คือ 16.38 USD ต่อเดือน
ข้อมูลเข้าต่อเดือน ข้อมูลออกต่อเดือน ค่าใช้จ่ายต่อ GB เข้าหรือออก รวมทั้งหมด 10 KB * 1,024 * 31 = 310 MB 10 KB * 1,024 * 31 = 310 MB 0.02 USD 0.0048 10 KB * 1,024 * 31 = 310 MB 0.02 USD 0.0048 พื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไป (GB) ค่าใช้จ่ายต่อ GB ต่อเดือน รวมทั้งหมด 4 0.14 USD 0.56 USD ชั่วโมงต่อเดือน อินสแตนซ์การโฮสต์ ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด 2.5 * 31 * 1 = 77.5 ml.c5.xlarge 0.20 USD 15.81 USD การอนุมานแบบอะซิงโครนัสของ Amazon SageMaker จะเรียกเก็บค่าบริการตามอินสแตนซ์ที่ใช้โดยตำแหน่งข้อมูลของคุณ เมื่อไม่มีการประมวลผลคำขอ คุณสามารถกำหนดค่าการปรับขนาดอัตโนมัติให้ปรับการนับอินสแตนซ์เป็นศูนย์เพื่อประหยัดค่าใช้จ่ายได้ สำหรับเพย์โหลดอินพุตใน Amazon S3 จะไม่มีค่าใช้จ่ายสำหรับการอ่านข้อมูลอินพุตจาก Amazon S3 และการเขียนข้อมูลเอาต์พุตไปยัง S3 ใน Region เดียวกัน
โมเดลในตัวอย่างที่ 5 จะใช้เพื่อเรียกใช้ตำแหน่งข้อมูลการอนุมานแบบอะซิงโครนัสของ SageMaker ตำแหน่งข้อมูลจะกำหนดค่าเพื่อเรียกใช้อินสแตนซ์ ml.c5.xlarge 1 รายการและปรับลดการนับอินสแตนซ์ลงเป็นศูนย์เมื่อไม่มีการประมวลผลคำขอ อินสแตนซ์ ml.c5.xlarge ในตำแหน่งข้อมูลมีพื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไปขนาด 4 GB ติดตั้งอยู่ ในตัวอย่างนี้ ตำแหน่งข้อมูลจะคงการนับอินสแตนซ์ไว้ที่ 1 เป็นเวลา 2 ชั่วโมงต่อวันและมีเวลาพัก 30 นาที หลังจากปรับลดการนับอินสแตนซ์ลงเป็นศูนย์สำหรับเวลาที่เหลือของวัน ดังนั้น ระบบจะเรียกเก็บเงินคุณสำหรับการใช้งานเป็นเวลา 2.5 ชั่วโมงต่อวัน
ตำแหน่งข้อมูลประมวลผลคำขอ 1,024 รายการต่อวัน ขนาดของคำขอเรียกใช้/เนื้อหาการตอบกลับแต่ละรายการจะอยู่ที่ 10 KB และเพย์โหลดคำขอการอนุมานแต่ละรายการใน Amazon S3 จะอยู่ที่ 100 MB เอาต์พุตของการอนุมานมีขนาด 1 ใน 10 ของข้อมูลอินพุตที่จัดเก็บไว้ใน Amazon S3 ใน Region เดียวกัน ในตัวอย่างนี้ ค่าบริการประมวลผลข้อมูลจะมีผลกับคำขอและเนื้อหาการตอบกลับ แต่ไม่มีผลกับข้อมูลที่ถ่ายโอนเข้า/ออก Amazon S3
-
ตัวอย่างราคาที่ 12: Batch Transform
ค่าใช้จ่ายทั้งหมดสำหรับการอนุมานในตัวอย่างนี้จะเป็น 2.88 USD
ชั่วโมง อินสแตนซ์การโฮสต์ ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด 3 * 0.25 * 4 = 3 ชั่วโมง ml.m4.4xlarge 0.96 USD 2.88 USD แบบจำลองในตัวอย่างที่ 5 จะใช้ในการเรียกใช้ SageMaker Batch Transform นักวิทยาศาสตร์ข้อมูลจะเรียกใช้งาน SageMaker Batch Transform 4 รายการแยกจากกันบน ml.m4.4xlarge จำนวน 3 รายการเป็นเวลา 15 นาทีต่อการเรียกใช้งาน เธอจะอัปโหลดชุดข้อมูลการประเมินขนาด 1 GB ใน S3 สำหรับการเรียกใช้แต่ละครั้ง และการอนุมานจะมีขนาด 1 ใน 10 ของข้อมูลอินพุต ซึ่งจะจัดเก็บกลับเข้าไปใน S3
-
ตัวอย่างราคาที่ 13: การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ตามความความต้องการ
ค่าบริการในการประมวลผลข้อมูลต่อเดือน
การประมวลผลข้อมูล (GB) ค่าใช้จ่ายต่อ GB เข้าหรือออก ค่าบริการในการประมวลผลข้อมูลต่อเดือน 10 GB 0.016 USD 0.16 USD ผลรวมย่อยของค่าบริการสำหรับระยะเวลาการอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ของ SageMaker ตามความต้องการ = 40 USD ผลรวมย่อยของค่าบริการสำหรับการประมวลผลข้อมูล 10 GB = 0.16 USD ค่าบริการรวมสำหรับตัวอย่างนี้คือ 40.16 USD
ค่าบริการในการประมวลผลรายเดือน
จำนวนคำขอ ระยะเวลาของแต่ละคำขอ ระยะเวลารวมในการอนุมาน (วินาที) ค่าใช้จ่ายต่อวินาที ค่าบริการสำหรับระยะเวลาการอนุมานต่อเดือน 10 ล้าน 100 มิลลิวินาที 1 ล้าน 0.00004 USD 40 USD
เมื่อใช้การอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ตามความต้องการ คุณจะจ่ายค่าบริการเฉพาะความสามารถในการคำนวณที่ใช้ประมวลผลคำขอการอนุมานเท่านั้น โดยจะเรียกเก็บเงินตามมิลลิวินาที และปริมาณของข้อมูลที่ประมวลผล ค่าบริการในการคำนวณจะขึ้นอยู่กับการกำหนดค่าหน่วยความจำที่คุณเลือก
หากคุณจัดสรรหน่วยความจำ 2 GB ให้กับตำแหน่งข้อมูลของคุณ ดำเนินการ 10 ล้านครั้งในหนึ่งเดือน และตำแหน่งข้อมูลนั้นทำงานเป็นเวลา 100 มิลลิวินาทีในแต่ละครั้ง และประมวลผลข้อมูลขาเข้า/ขาออกทั้งหมดรวม 10 GB ค่าบริการของคุณจะคำนวณได้ดังนี้
-
ตัวอย่างราคาที่ 14: กระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้บนการอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์
สมมติว่าคุณกำลังใช้บริการ Chatbot เพื่อให้บริษัทประมวลผลเงินเดือน คุณคาดว่าจะมีการสอบถามจากลูกค้าเพิ่มขึ้นอย่างรวดเร็วในช่วงปลายเดือนมีนาคม ก่อนถึงกำหนดยื่นภาษี อย่างไรก็ตาม ในช่วงที่เหลือของเดือน คาดว่าปริมาณการใช้ข้อมูลจะอยู่ในระดับต่ำ ดังนั้น คุณจึงปรับใช้ตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ที่มีหน่วยความจำ 2GB และเพิ่มกระบวนการทำงานพร้อมกันที่จัดสรรไว้เป็น 100 สำหรับ 5 วันสุดท้ายของเดือนในช่วงเวลา 9.00 - 17.00 น. (8 ชั่วโมง) ซึ่งในระหว่างนั้น ตำแหน่งข้อมูลของคุณจะประมวลผลคำขอ 10 ล้านรายการและข้อมูลขาเข้า/ออกขนาด 10GB ในช่วงที่เหลือของเดือน Chatbot จะทำงานตามการอนุมานแบบไม่ต้องใช้เซิร์ฟเวอร์ตามความต้องการ และจะประมวลผลคำขอ 3 M และข้อมูลขาเข้า/ออกขนาด 3GB สมมติว่าระยะเวลาของแต่ละคำขอคือ 100 มิลลินาที
ค่าบริการของกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้ (PC)
ราคา PC คือ 0.000010 USD/วินาที
ระยะเวลาการใช้งาน PC (วินาที) = 5 วัน* 100 PC* 8 ชั่วโมง* 3,600 วินาที = 14,400,000 วินาที
ค่าใช้จ่ายการใช้งาน PC = 14,400,000 วินาที* 0.000010USD/วินาที = 144 USDค่าใช้จ่ายตามระยะเวลาการอนุมานสำหรับการรับส่งข้อมูลที่ให้บริการโดยกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้
ราคาตามระยะเวลาการอนุมานคือ 0.000023 USD/วินาที
ระยะเวลาการอนุมานรวมสำหรับ PC (วินาที) = 10M*(100 มิลลินาที) /1000 = 1M วินาที
ค่าใช้จ่ายตามระยะเวลาการอนุมานสำหรับ PC = 1,000,000 วินาที * 0.000023 USD/วินาที = 23 USDค่าใช้จ่ายตามระยะเวลาการอนุมานตามความต้องการ
ราคาการประมวลผลรายเดือนคือ 0.00004 USD/วินาที และมี Free Tier 150k วินาที
การประมวลผลทั้งหมด (วินาที) = (3) M * (100 มิลลินาที) /1000 = 0.3M วินาที
การประมวลผลทั้งหมด – การประมวลผลของ Free Tier = ค่าบริการประมวลผลรายเดือนเป็นวินาที
0.3M วินาที – 150k วินาที = 150k วินาที
ค่าบริการประมวลผลรายเดือน = 150k * 0.00004 USD = 6 USDการประมวลผลข้อมูล
ค่าใช้จ่าย/GB ของข้อมูลขาเข้า/ออกที่ประมวลผล = 0.016 USD
GB ที่ประมวลผลทั้งหมด = 10+3=13
ค่าใช้จ่ายทั้งหมด = 0.016 USD*13= 0.208 USD
ค่าบริการทั้งหมดสำหรับเดือนมีนาคม
ค่าใช้จ่ายทั้งหมด = ค่าใช้จ่ายของกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว้ + ระยะเวลาการอนุมานสำหรับกระบวนการทำงานพร้อมกันที่มีการจัดสรรไว + ระยะเวลาการอนุมานสำหรับการประมวลผลตามความต้องการ + ค่าใช้จ่ายในการประมวลผลข้อมูล
= 144 USD + 23 USD + 6 USD + 0.208 USD = 173.2 USD -
ตัวอย่างค่าบริการที่ 15: JumpStart
ลูกค้าใช้ JumpStart เพื่อปรับใช้โมเดล BERT Base Uncased ที่ได้รับการฝึกอบรมไว้แล้วล่วงหน้า เพื่อจัดประเภทรีวิวลูกค้าว่าเป็นบวกหรือลบ
ลูกค้าปรับใช้โมเดลนี้กับอินสแตนซ์ ml.c5.xlarge สอง (2) รายการเพื่อการโฮสต์แบบ Multi-AZ ที่น่าเชื่อถือ โมเดลจะได้รับข้อมูล 100 MB ต่อวัน และการอนุมานจะมีขนาด 1 ใน 10 ของข้อมูลอินพุต
ชั่วโมงต่อเดือน อินสแตนซ์การโฮสต์ ค่าใช้จ่ายต่อชั่วโมง รวมทั้งหมด 24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 USD 303.55 USD ข้อมูลเข้าต่อเดือน – การโฮสต์ ข้อมูลออกต่อเดือน – การโฮสต์ ค่าใช้จ่ายต่อ GB เข้าหรือออก
รวมทั้งหมด
100 MB * 31 = 3,100 MB 0.02 USD 0.06 USD 10 MB * 31 = 310 MB 0.02 USD 0.01 USD ผลรวมย่อยสำหรับการฝึกอบรม การโฮสต์ และการตรวจสอบ = 305.827 USD ผลรวมย่อยสำหรับข้อมูลที่ประมวลผลเข้า 3,100 MB และข้อมูลที่ประมวลผลออก 310 MB สำหรับการโฮสต์ต่อเดือน = 0.06 USD ค่าบริการรวมสำหรับตัวอย่างนี้คือ 305.887 USD ต่อเดือน
-
ตัวอย่างราคาที่ 16: HyperPod Cluster
สมมติว่าคุณต้องการจัดเตรียมคลัสเตอร์ 4 ml.g5.24xlarge เป็นเวลา 1 เดือน (30 วัน) พร้อมพื้นที่เก็บข้อมูลเพิ่มเติม 100 GB ต่ออินสแตนซ์เพื่อรองรับการพัฒนาโมเดล ค่าใช้จ่ายทั้งหมดสำหรับคลัสเตอร์และพื้นที่เก็บข้อมูลเพิ่มเติมในตัวอย่างนี้คือ 29,374.40 USDการประมวลผล
อินสแตนซ์ ระยะเวลา อินสแตนซ์ ค่าใช้จ่ายต่อชั่วโมง ผลรวมย่อย ml.g5.24xlarge 30 วัน* 24 ชั่วโมง = 720 ชั่วโมง 4 10.18 USD 29,318.40 USD พื้นที่จัดเก็บ
พื้นที่จัดเก็บข้อมูล (SSD) สำหรับการใช้ทั่วไป ระยะเวลา อินสแตนซ์ ค่าใช้จ่ายต่อ GB ต่อเดือน ผลรวมย่อย 100 GB 30 วัน* 24 ชั่วโมง = 720 ชั่วโมง 4 0.14 USD 56.00 USD -
ตัวอย่างค่าบริการที่ 17: การประเมินโมเดลพื้นฐาน (การประเมินอัตโนมัติ)
การประเมินโมเดลพื้นฐานด้วย SageMaker Clarify จะเรียกเก็บค่าบริการจากคุณเฉพาะอินสแตนซ์ที่ใช้ในขณะที่งานการประเมินอัตโนมัติกำลังทำงานอยู่เท่านั้น เมื่อคุณเลือกงานการประเมินอัตโนมัติและชุดข้อมูล SageMaker จะโหลดชุดข้อมูลที่พรอมต์จาก Amazon S3 ไปยังอินสแตนซ์การประเมินของ SageMaker
ในตัวอย่างต่อไปนี้ วิศวกร ML จะเรียกใช้งานการประเมินโมเดล Llama2 7B ในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) เพื่อความแม่นยำของงานการสรุป ประเภทอินสแตนซ์ที่แนะนำสำหรับการอนุมานสำหรับ Llama 2 7B คือ ml.g5.2xlarge อินสแตนซ์ขั้นต่ำที่แนะนำสำหรับการประเมินคือ ml.m5.2xlarge ในตัวอย่างนี้ งานจะทำงานเป็นเวลา 45 นาที (ขึ้นอยู่กับขนาดของชุดข้อมูล) ในตัวอย่างนี้ ค่าใช้จ่ายจะเป็น 1.48 USD สำหรับงานการประเมินและผลลัพธ์โดยละเอียดชั่วโมงงานการประมวล (ตัวอย่าง)
รีเจี้ยน
ประเภทอินสแตนซ์
อินสแตนซ์
ค่าใช้จ่ายต่อชั่วโมง
ค่าใช้จ่าย
0.45
US-east-1
การโฮสต์ LLM
ml.g5.2xlarge
1.52 USD
1.14 USD
0.45
US-east-1
การประเมิน
ml.m5.2xlarge
0.46 USD
0.35 USD
รวมทั้งหมด
1.48 USD
ในตัวอย่างถัดไป วิศวกรคนเดิมในเวอร์จิเนียเรียกใช้งานการประเมินอื่นเพื่อความแม่นยำของงานการสรุป แต่ใช้ Llama 2 7B เวอร์ชันที่ปรับแต่งเองซึ่งปรับใช้กับบัญชีและเริ่มต้นใช้งาน ในตัวอย่างนี้ เนื่องจากมีการนำโมเดลไปใช้กับบัญชีอยู่แล้ว เพราะฉะนั้นจะมีค่าใช้จ่ายต้นทุนเพิ่มเติมเพียงอย่างเดียวสำหรับอินสแตนซ์การประเมิน
ชั่วโมงงานการประมวล
รีเจี้ยน
ประเภทอินสแตนซ์
อินสแตนซ์
ค่าใช้จ่ายต่อชั่วโมง
ค่าใช้จ่าย
0.45
US-east-1
การประเมิน
ml.m5.2xlarge
0.46 USD
0.35 USD
รวมทั้งหมด
0.35 USD
-
ตัวอย่างค่าบริการที่ 18: การประเมินโมเดลพื้นฐาน (การประเมินโดยมนุษย์)
ในตัวอย่างต่อไปนี้ วิศวกรแมชชีนเลิร์นนิงในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) จะเรียกใช้การประเมิน Llama-2-7B โดยศัยมนุษย์เพื่อความแม่นยำของงานการสรุป และใช้บุคลากรส่วนตัวของตนเองในการประเมิน ประเภทอินสแตนซ์ที่แนะนำสำหรับ Llama-2-7B คือ ml.g5.2xlarge อินสแตนซ์ขั้นต่ำที่แนะนำสำหรับงานประมวลผลการประเมินโดยมนุษย์คือ ml.t3.medium การอนุมานบน Llama-2-7B จะใช้เวลา 45 นาที (ขึ้นอยู่กับขนาดของชุดข้อมูล) ชุดข้อมูลประกอบด้วยพรอมต์ 50 รายการ และนักพัฒนาต้องการให้ผู้ปฏิบัติงาน 2 คนให้คะแนนชุดการตอบกลับพรอมต์แต่ละชุด (กำหนดค่าได้ในการสร้างงานการประเมินเป็นพารามิเตอร์ “ผู้ปฏิบัติงานต่อหนึ่งพรอมต์”) งานการประเมินนี้จะมี 100 งาน (1 งานสำหรับแต่ละคู่การตอบกลับพรอมต์ต่อพนักงานแต่ละคน: 2 คน x ชุดการตอบกลับพรอมต์ 50 ชุด = 100 งานของมนุษย์) บุคลากรที่เป็นมนุษย์จะใช้เวลาหนึ่งวัน (24 ชั่วโมง) เพื่อดำเนินงานประเมินโดยมนุษย์ทั้งหมด 100 งานในงานประเมิน (ขึ้นอยู่กับจำนวนและระดับทักษะของผู้ปฏิบัติงาน และความยาว/ความซับซ้อนของการตอบสนองทันทีและการอนุมาน)
ชั่วโมงประมวลผล
งานของมนุษย์
รีเจี้ยน
ประเภทอินสแตนซ์
อินสแตนซ์
ค่าใช้จ่ายต่อชั่วโมง
ค่าใช้จ่ายต่องานของมนุษย์
ค่าใช้จ่ายทั้งหมด
0.45
สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ)
การโฮสต์ LLM
ml.g5.2xlarge
1.52 USD
1.14 USD
24
สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ)
งานการประมวลผล
ml.t3.medium
0.05 USD
1.20 USD
100
ใดก็ได้
0.21 USD
21.00 USD
รวมทั้งหมด
23.34 USD
ในตัวอย่างถัดไป วิศวกรคนเดียวกันในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) จะเรียกใช้งานการประเมินแบบเดียวกัน แต่ใช้ Llama-2-7B ที่ใช้งานกับบัญชีของตนแล้วและเริ่มทำงาน ในกรณีนี้ ค่าใช้จ่ายที่เพิ่มขึ้นเพียงอย่างเดียวคือค่าใช้จ่ายสำหรับงานประมวลผลการประเมินและงานของมนุษย์
ชั่วโมงประมวลผล
งานของมนุษย์
รีเจี้ยน
ประเภทอินสแตนซ์
อินสแตนซ์
ค่าใช้จ่ายต่อชั่วโมง
ค่าใช้จ่ายต่องานของมนุษย์
ค่าใช้จ่ายทั้งหมด
24
สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ)
งานการประมวลผล
ml.t3.medium
0.05 USD
1.20 USD
100
ใดก็ได้
0.21 USD
21.00 USD
รวมทั้งหมด
22.20 USD