Amazon Bedrock

ภาพรวมราคา

Amazon Bedrock เป็นบริการที่มีการจัดการเต็มรูปแบบซึ่งเสนอโมเดลพื้นฐาน (FM) ที่มีประสิทธิภาพสูงผ่าน API เดียว ควบคู่ไปกับความสามารถที่หลากหลายในการสร้างแอปพลิเคชัน AI ช่วยสร้าง พร้อมทั้งยังมีความปลอดภัย มีความเป็นส่วนตัว และมี AI ที่รับผิดชอบและเชื่อถือได้

Amazon Bedrock นำเสนอตัวเลือกราคาที่ยืดหยุ่นเพื่อสนับสนุนลูกค้าในทุกขั้นตอนของการใช้งาน AI ช่วยสร้าง ลูกค้าสามารถเลือกจากราคาแบบตามความต้องการ ซึ่งชำระตามการใช้งานจริงโดยไม่มีข้อผูกพันล่วงหน้า หรือโหมดแบทช์สำหรับการประมวลผลข้อมูลจำนวนมากที่ประหยัดค่าใช้จ่าย สำหรับเวิร์กโหลดปริมาณมากและคาดการณ์ได้ บริการอัตราการโอนถ่ายข้อมูลที่จัดสรรล่วงหน้าจะมอบขีดความสามารถในการรองรับของโมเดลที่จัดไว้ให้โดยเฉพาะ พร้อมราคาที่มีส่วนลด ตัวเลือกเหล่านี้ช่วยเพิ่มประสิทธิภาพต้นทุนในขณะที่รักษาสมดุลระหว่างความเร็ว ขนาด และความต้องการในการเข้าถึงโมเดล

      

รูปแบบราคา

ด้วยโหมดแบบออนดีมานด์ คุณจะจ่ายเฉพาะส่วนที่คุณใช้เท่านั้น โดยไม่มีสัญญาระยะยาวตามเวลา สำหรับโมเดลการสร้างข้อความ ระบบจะเรียกเก็บเงินสำหรับทุกโทเค็นอินพุตที่ประมวลผลและทุกโทเค็นเอาต์พุตที่สร้างขึ้น สำหรับโมเดลการฝัง ระบบจะเรียกเก็บเงินสำหรับทุกโทเค็นอินพุตที่ประมวลผล โทเค็นประกอบด้วยอักขระสองสามตัวและอ้างอิงถึงหน่วยข้อความพื้นฐานที่โมเดลเรียนรู้ที่จะเข้าใจอินพุตและการแจ้งเตือนของผู้ใช้ สำหรับโมเดลการสร้างภาพ ระบบจะเรียกเก็บเงินสำหรับทุกภาพที่ถูกสร้างขึ้น ตอนนี้โมเดลที่กำหนดเองรองรับตามความต้องการ เรียนรู้เพิ่มเติมเกี่ยวกับการอนุมานตามความต้องการและโมเดลที่กำหนดเอง

การอนุมานข้ามรีเจี้ยน: โหมดตามความต้องการยังรองรับการอนุมานข้ามรีเจี้ยนสำหรับบางโมเดลด้วย โดยจะช่วยให้นักพัฒนาสามารถจัดการปริมาณการรับส่งข้อมูลที่เพิ่มขึ้นอย่างกะทันหันได้อย่างราบรื่นโดยใช้การประมวลผลข้าม AWS Region ต่างๆ และได้รับขีดจำกัดอัตราการโอนถ่ายข้อมูลและความยืดหยุ่นที่เพิ่มขึ้น ไม่มีค่าบริการเพิ่มเติมสำหรับการใช้การอนุมานข้ามรีเจี้ยน และราคาจะได้รับการคำนวณตามรีเจี้ยนที่คุณร้องขอใน (รีเจี้ยนต้นทาง)

เมื่อใช้งานโหมด Batch คุณจะสามารถจัดเตรียมชุดพร้อมท์เป็นไฟล์อินพุตเดียว และรับการตอบกลับเป็นไฟล์เอาต์พุตเดียว ช่วยให้คุณสามารถรับการคาดการณ์ในวงกว้างพร้อมกันได้ การตอบกลับจะได้รับการประมวลผลและจัดเก็บไว้ในบัคเก็ต Amazon S3 ของคุณ เพื่อให้คุณสามารถเข้าถึงได้ในภายหลัง Amazon Bedrock นำเสนอโมเดลพื้นฐาน (FM) ที่เลือกจากผู้ให้บริการ AI ชั้นนำเช่น Anthropic, Meta, Mistral AI และ Amazon สำหรับการอนุมานแบบแบทช์ในราคาที่ต่ำกว่า 50% เมื่อเทียบกับราคาอนุมานตามความต้องการ โปรดดูรายการโมเดลที่นี่

การอนุมานที่ได้รับการปรับปรุงความหน่วงสำหรับโมเดลพื้นฐานใน Amazon Bedrock ช่วยให้การตอบสนองของโมเดลเร็วขึ้นและเพิ่มประสิทธิภาพการตอบสนองสำหรับแอปพลิเคชัน AI ช่วยสร้างของคุณ คุณสามารถใช้การอนุมานที่ได้รับการปรับปรุงความหน่วงสำหรับ Amazon Nova Pro, โมเดล Claude 3.5 Haiku ของ Anthropic และโมเดล Llama 3.1 405B กับ 70B ของ Meta ได้ จากการตรวจสอบยืนยันโดย Anthropic นั้น เมื่อปรับใช้การอนุมานที่ได้รับการปรับปรุงความหน่วงบน Amazon Bedrock แล้ว การใช้งาน Claude 3.5 Haiku จะสามารถทำงานบน AWS ได้เร็วกว่าบนแพลตฟอร์มอื่นใด นอกจากนี้ ด้วยการอนุมานที่ได้รับการปรับปรุงเวลาแฝงใน Bedrock โมเดล Llama 3.1 405B และ 70B จะทำงานบน AWS ได้เร็วกว่าบนผู้ให้บริการระบบคลาวด์รายใหญ่รายอื่นใด เรียนรู้เพิ่มเติมที่นี่

เมื่อใช้งานโหมด Provisioned Throughput คุณจะสามารถซื้อหน่วยโมเดลสำหรับฐานเฉพาะหรือโมเดลแบบกำหนดเองได้ โหมด Provisioned Throughput ที่เตรียมใช้งานได้รับการออกแบบมาสำหรับเวิร์กโหลดการอนุมานที่มีความสอดคล้องขนาดใหญ่เป็นหลัก ซึ่งต้องการอัตราการโอนถ่ายข้อมูลที่แน่นอน หน่วยโมเดลมีอัตราการโอนถ่ายข้อมูลที่แน่นอน ซึ่งวัดจากจำนวนโทเค็นอินพุตหรือเอาต์พุตสูงสุดที่ประมวลผลต่อนาที เมื่อเลือกใช้ราคาสำหรับแบบ Provisioned Throughput ระบบจะเรียกเก็บเงินเป็นรายชั่วโมง ดังนั้นคุณจึงมีความยืดหยุ่นในการเลือกเงื่อนไขสัญญาแบบ 1 เดือนหรือ 6 เดือนก็ได้

การนำเข้าโมเดลที่กำหนดเองช่วยให้คุณสามารถใช้ประโยชน์จากการลงทุนในการปรับแต่งโมเดลก่อนหน้าภายใน Amazon Bedrock และเป็นการใช้งานในลักษณะที่ได้รับการจัดการแบบเต็มรูปแบบเช่นเดียวกับโมเดลพื้นฐานที่โฮสต์ไว้ คุณสามารถนำเข้าน้ำหนักที่กำหนดเองสำหรับสถาปัตยกรรมโมเดลที่รองรับ และให้บริการโมเดลที่กำหนดเองโดยใช้โหมดตามความต้องการ ไม่มีค่าใช้จ่ายในการนำเข้าโมเดลที่กำหนดเองไปยัง Bedrock เมื่อคุณนำเข้าโมเดลคุณจะสามารถเข้าถึงได้ตามความต้องการ โดยไม่ต้องดำเนินการส่วนการควบคุมใด ๆ คุณจะถูกเรียกเก็บเงินสำหรับการอนุมานโมเดลเท่านั้น โดยพิจารณาจากจำนวนสำเนาของโมเดลที่กำหนดเองของคุณที่จำเป็นในการให้บริการปริมาณการอนุมานของคุณและระยะเวลาที่สำเนาแต่ละรุ่นใช้งานอยู่ โดยเรียกเก็บเงินในช่วงเวลา 5 นาที สำเนาโมเดลเป็นอินสแตนซ์เดียวของโมเดลที่นำเข้าพร้อมให้บริการคำขออนุมาน ราคาต่อสำเนาโมเดลต่อนาทีขึ้นอยู่กับปัจจัยต่าง ๆ เช่น สถาปัตยกรรม ความยาวบริบท, AWS Region, เวอร์ชันหน่วยประมวลผล (การสร้างฮาร์ดแวร์) และถูกกำหนดตามขนาดสำเนาโมเดล

Amazon Bedrock Marketplace ช่วยให้คุณสามารถค้นพบ ทดสอบ และใช้โมเดลพื้นฐานยอดนิยม เกิดใหม่ และเฉพาะทางกว่า 100 โมเดลใน Bedrock โมเดล Amazon Bedrock Marketplace จะนำไปใช้จริงกับตำแหน่งข้อมูลโดยที่คุณสามารถเลือกจำนวนอินสแตนซ์และประเภทอินสแตนซ์ที่คุณต้องการ รวมทั้งกำหนดค่านโยบายการปรับขนาดอัตโนมัติเพื่อให้ตรงกับความต้องการของเวิร์กโหลดของคุณได้ สำหรับโมเดลที่เป็นกรรมสิทธิ์ เราจะเรียกเก็บค่าบริการจากคุณ ซึ่งเป็นราคาซอฟต์แวร์ที่กำหนดโดยผู้ให้บริการโมเดล (ต่อชั่วโมง โดยสามารถเรียกเก็บเงินแบบเพิ่มขึ้นเป็นวินาที หรือต่อคำขอ) และราคาโครงสร้างพื้นฐานตามอินสแตนซ์ที่คุณเลือก คุณสามารถดูราคาก่อนสมัครใช้บริการโมเดลจากผู้ให้บริการและจากรายการโมเดลใน AWS Marketplace สำหรับโมเดลที่ให้ใช้งานสาธารณะ เราจะเรียกเก็บค่าบริการจากคุณเฉพาะค่าโครงสร้างพื้นฐานตามอินสแตนซ์ที่คุณเลือก เรียนรู้เพิ่มเติมที่นี่

การปรับแต่งและการเพิ่มประสิทธิภาพ

การกลั่นโมเดล

Amazon Bedrock Model Distillation ช่วยให้ลูกค้าสามารถถ่ายโอนความรู้จากโมเดลที่มีความสามารถที่ใหญ่กว่า (ที่เรียกว่า “โมเดลขนาดใหญ่ (Teacher Model)”) ไปยังโมเดลที่เล็กกว่า เร็วกว่า และประหยัดค่าใช้จ่าย (ที่เรียกว่า “โมเดลขนาดเล็ก (Student Model)”) โมเดลขนาดเล็กจึงมีประสิทธิภาพเท่ากับโมเดลขนาดใหญ่สำหรับกรณีการใช้งานเฉพาะ ด้วย Amazon Bedrock Model Distillation คุณจะจ่ายเงินสำหรับสิ่งที่คุณใช้ การกลั่นโมเดลเป็นกระบวนการ 2 ขั้นตอนที่เริ่มจากการสร้างข้อมูลสังเคราะห์จากโมเดลขนาดใหญ่ (Teacher Model) จากนั้นจึงฝึกโมเดลขนาดเล็ก (Student Model) การสร้างข้อมูลสังเคราะห์จะถูกเรียกเก็บตามราคาแบบตามความต้องการของโมเดลขนาดใหญ่ที่เลือก การปรับแต่งโมเดลขนาดเล็กจะถูกเรียกเก็บตามอัตราการปรับแต่งโมเดล คุณสามารถตั้งค่าการอนุมานบนโมเดลที่กำหนดเองได้โดยการสร้างโมเดลแบบกำหนดเองตามความต้องการหรือซื้อ Provisioned Throughput ขึ้นอยู่กับความต้องการเวิร์กโหลดและวัตถุประสงค์ด้านต้นทุนที่เฉพาะเจาะจง ตัวเลือกการอนุมานตามความต้องการประกอบด้วยแบบจำลองการกำหนดราคาตามโทเค็นที่เรียกเก็บเงินตามจำนวนโทเค็นที่ประมวลผลระหว่างการอนุมาน

การปรับแต่งอย่างละเอียด / การฝึกบื้องต้นแบบต่อเนื่อง
เมื่อใช้ Amazon Bedrock คุณจะสามารถปรับแต่ง FM ด้วยข้อมูลของคุณเพื่อส่งมอบการตอบสนองที่เหมาะกับงานเฉพาะและบริบททางธุรกิจของคุณได้ คุณสามารถปรับโมเดลอย่างละเอียดด้วยข้อมูลที่มีป้ายกำกับหรือใช้การฝึกอบรมล่วงหน้าอย่างต่อเนื่องด้วยข้อมูลที่ไม่ได้ติดฉลาก สำหรับการปรับแต่งโมเดลสร้างข้อความ คุณจะถูกเรียกเก็บค่าสำหรับการฝึกแบบจำลองตามจำนวนโทเค็นทั้งหมดที่ประมวลผลโดยโมเดล (จำนวนโทเค็นในคอร์ปัสข้อมูลการฝึกอบรม x จำนวนยุค) และสำหรับพื้นที่จัดเก็บแบบจำลองที่เรียกเก็บต่อเดือนต่อโมเดล Epoch หมายถึงการส่งผ่านชุดข้อมูลการฝึกของคุณแบบสมบูรณ์หนึ่งครั้งระหว่างการปรับแต่งเพิ่มเติมหรือการฝึกล่วงหน้าอย่างต่อเนื่อง

คุณสามารถตั้งค่าการอนุมานบนโมเดลที่กำหนดเองได้โดยการสร้างโมเดลแบบกำหนดเองตามความต้องการหรือซื้อ Provisioned Throughput ขึ้นอยู่กับความต้องการเวิร์กโหลดและวัตถุประสงค์ด้านต้นทุนที่เฉพาะเจาะจง ตัวเลือกการอนุมานตามความต้องการประกอบด้วยแบบจำลองการกำหนดราคาตามโทเค็นที่เรียกเก็บเงินตามจำนวนโทเค็นที่ประมวลผลระหว่างการอนุมาน หากคุณซื้อ Provisioned Throughput หน่วยโมเดลหนึ่งหน่วยจะพร้อมใช้งานโดยไม่มีเงื่อนไขข้อผูกพันสำหรับการอนุมานในแบบจำลองที่กำหนดเอง คุณจะถูกเรียกเก็บเงินสำหรับจำนวนชั่วโมงที่คุณใช้ในหน่วยรุ่นแรกสำหรับการอนุมานของโมเดลที่กำหนดเอง หากคุณต้องการเพิ่มอัตราการโอนถ่ายข้อมูลของคุณเกินกว่า 1 หน่วยโมเดล คุณจะต้องซื้อระยะเวลาสัญญา 1 เดือนหรือ 6 เดือน

ด้วยการแคชพร้อมท์บน Amazon Bedrock คุณสามารถแคชบริบทซ้ำ ๆ ตลอดการเรียกใช้ API เพื่อลดต้นทุนและเวลาแฝงในการตอบสนอง พร้อมท์มักมีบริบททั่วไปหรือคำนำหน้า เช่น บทสนทนายาว ๆ การสนทนาหลายตอน ตัวอย่างหลายช็อต และคำแนะนำโดยละเอียดที่ปรับปรุงพฤติกรรมของโมเดล เมื่อใช้ Amazon Bedrock API ที่มีอยู่ คุณสามารถระบุคำนำหน้าพร้อมท์ที่คุณต้องการแคชเป็นเวลาห้านาทีในแคชเฉพาะบัญชี AWS ได้ ในช่วงเวลานั้น คำขอใด ๆ ที่มีคำนำหน้าที่ตรงกันจะได้รับส่วนลดสูงสุด 90% สำหรับโทเค็นที่แคชไว้ และปรับปรุงเวลาแฝงสูงสุดถึง 85% ราคาและการปรับปรุงประสิทธิภาพจะแตกต่างกันไปตามโมเดลและความยาวของพร้อมท์ แต่แคชของคุณจะถูกแยกออกไปยังบัญชี AWS ของคุณอยู่เสมอ

การจัดการพร้อมท์ Amazon Bedrock ช่วยเร่งการสร้าง การทดสอบ และการใช้งานพร้อมท์ผ่าน UI ที่ใช้งานง่ายและชุด API คุณสามารถทดสอบและกำหนดเวอร์ชันของพร้อมท์ เปรียบเทียบตัวแปรต่าง ๆ และเรียกใช้ในโครงสร้างพื้นฐานแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ปลอดภัยได้อย่างง่ายดาย

การเพิ่มประสิทธิภาพพร้อมท์ใน Amazon Bedrock จะเขียนพร้อมท์ให้ใหม่โดยอัตโนมัติเพื่อประสิทธิภาพที่ดีขึ้นและการตอบกลับที่กระชับมากขึ้นสำหรับโมเดลพื้นฐาน โดยจะผสานเข้ากับการจัดการพร้อมท์เพื่อการเปรียบเทียบเวอร์ชันเดิมกับเวอร์ชันที่เพิ่มประสิทธิภาพแบบเคียงข้างกัน รวมทั้งการจัดการวงจรการใช้งานพร้อมท์ คุณยังสามารถใช้การเพิ่มประสิทธิภาพพร้อมท์ใน Bedrock Playground หรือใช้โดยตรงผ่าน API ได้อีกด้วย

เครื่องมือ

Amazon Bedrock Guardrails เป็นความสามารถของ AI ที่มีความรับผิดชอบเพียงอย่างเดียวจากผู้ให้บริการระบบคลาวด์รายใหญ่ ซึ่งช่วยให้คุณสามารถสร้างและปรับแต่งการป้องกันความปลอดภัย ความเป็นส่วนตัว และความจริงให้กับแอปพลิเคชัน AI ช่วยสร้าง โดยจะประเมินอินพุตของผู้ใช้และการตอบสนองของโมเดลตามนโยบายเฉพาะกรณีการใช้งาน ซึ่งจะช่วยเสริมการป้องกันเพิ่มเติมนอกเหนือจากการป้องกันเดิมที่มีอยู่ การป้องกันจาก Guardrails สามารถนำไปใช้กับโมเดลที่โฮสต์บน Amazon Bedrock หรือกับโมเดลของบุคคลที่สาม (เช่น OpenAI และ Google Gemini) ผ่าน ApplyGuardrail API คุณยังสามารถใช้ Guardrails กับเฟรมเวิร์กเอเจนต์ เช่น Strands Agents รวมถึงเอเจนต์ที่ปรับใช้โดยใช้ Amazon Bedrock AgentCore Guardrails ช่วยกรองผลลัพธ์เพี้ยนและปรับปรุงความถูกต้องตามข้อเท็จจริงผ่านการตรวจสอบกราวด์ตามบริบทกับเนื้อหา RAG และการตรวจสอบการให้เหตุผลอัตโนมัติเพื่อให้การตอบสนองที่แท้จริงที่พิสูจน์ได้

ฐานความรู้สำหรับ Amazon Bedrock มีเวิร์กโฟลว์การดึงข้อมูลเพื่อการสร้างแบบเสริม (RAG) ที่มีการจัดการเต็มรูปแบบ ซึ่งช่วยให้ลูกค้าสามารถสร้างแอปพลิเคชัน AI ช่วยสร้างที่มีความแม่นยำสูง ความหน่วงต่ำ ปลอดภัย และกำหนดเองได้ โดยการรวมข้อมูลตามบริบทจากแหล่งที่มาของข้อมูลของตนเอง รองรับแหล่งที่มาของข้อมูลต่าง ๆ รวมถึง S3 และ Confluence, Salesforce และ SharePoint ในการแสดงตัวอย่าง นอกจากนี้ยังมีการนำเข้าเอกสารเพื่อการสตรีมข้อมูลด้วย ฐานความรู้ Bedrock แปลงข้อมูลที่ไม่ได้มีโครงสร้างเป็นแบบฝังเก็บไว้ในฐานข้อมูลเวกเตอร์ และช่วยให้สามารถดึงข้อมูลจากที่เก็บข้อมูลที่หลากหลาย นอกจากนี้ยังรวมเข้ากับ Kendra สำหรับการดึงข้อมูลที่มีการจัดการ และรองรับการดึงข้อมูลที่มีโครงสร้างโดยใช้ภาษาธรรมชาติไปยัง SQL

Amazon Bedrock Data Automation เปลี่ยนเนื้อหาแบบหลายรูปแบบที่ไม่มีโครงสร้างเป็นรูปแบบข้อมูลที่มีโครงสร้างสำหรับกรณีการใช้งาน เช่น การประมวลผลเอกสารอัจฉริยะ การวิเคราะห์วิดีโอและ RAG Bedrock Data Automation สามารถสร้างเนื้อหาเอาต์พุตมาตรฐานโดยใช้ค่าเริ่มต้นที่กำหนดไว้ล่วงหน้าซึ่งเฉพาะรูปแบบเฉพาะ เช่น คำอธิบายวิดีโอแต่ละฉาก การถอดเสียงหรือการวิเคราะห์เอกสารอัตโนมัติ นอกจากนี้ ลูกค้ายังสามารถสร้างเอาต์พุตที่กำหนดเองได้โดยระบุข้อกำหนดเอาต์พุตในพิมพ์เขียวตามรูปแบบข้อมูลของตนเอง ซึ่งจากนั้นสามารถโหลดลงในฐานข้อมูลหรือคลังข้อมูลที่มีอยู่ได้อย่างง่ายดาย Bedrock Data Automation ยังสามารถใช้เพื่อวิเคราะห์เนื้อหาสำหรับแอปพลิเคชัน RAG ได้ ผ่านการผสานการทำงานกับฐานความรู้ ซึ่งช่วยปรับปรุงความแม่นยำและความเกี่ยวข้องของผลลัพธ์ด้วยการรวมข้อมูลที่ฝังอยู่ในทั้งรูปภาพและข้อความ

Amazon Bedrock Agents มีความสามารถในการสร้างและกำหนดค่าเอเจนต์อิสระภายในแอปพลิเคชันของคุณ เอเจนต์เหล่านี้จะเชื่อมต่อกับแหล่งที่มาของข้อมูลของบริษัทคุณอย่างปลอดภัย และเพิ่มคำขอของผู้ใช้ด้วยข้อมูลที่ถูกต้องเพื่อสร้างการตอบสนองที่ตรงประเด็น คุณสามารถสร้างแอปพลิเคชันแบบเอเจนต์ตัวเดียวหรือหลายตัวได้ในไม่กี่ขั้นตอนเพื่อเร่งเวลาที่ใช้ในการสร้างแอปพลิเคชัน AI ช่วยสร้าง เอเจนต์เหล่านี้รองรับการตีความโค้ดเพื่อสร้างและดำเนินการเขียนโค้ดแบบไดนามิก ตลอดจนการคืนการควบคุม ซึ่งช่วยให้คุณกำหนดสคีมาการดำเนินการและคืนการควบคุมกลับมาได้ทุกครั้งที่เอเจนต์เรียกดำเนินการ Amazon Bedrock Agents มีความสามารถในการเก็บรักษาความจำตลอดการโต้ตอบ เพื่อนำเสนอประสบการณ์ผู้ใช้ที่เหมาะกับตัวบุคคลและราบรื่นมากขึ้น

Amazon Bedrock Flows เป็นฟีเจอร์การเขียนและดำเนินการเวิร์กโฟลว์ของ Bedrock สำหรับแอปพลิเคชัน AI ช่วยสร้าง ช่วยเร่งการสร้าง การทดสอบ และการปรับใช้เวิร์กโฟลว์ AI ช่วยสร้างที่ผู้ใช้กำหนดขึ้นผ่านเครื่องสร้างภาพที่ใช้งานง่ายและชุด API ช่วยให้คุณเชื่อมโยงโมเดลพื้นฐานล่าสุด พร้อมท์ เอเจนต์ ฐานความรู้ กฎควบคุมระบบ และบริการ AWS (เช่น Amazon Lex, AWS Lambda, Amazon S3) เข้ากับตรรกะทางธุรกิจได้อย่างราบรื่นเพื่อสร้างเวิร์กโฟลว์ AI ช่วยสร้าง คุณสามารถทดสอบและกำหนดเวอร์ชันเวิร์กโฟลว์ของคุณได้อย่างง่ายดาย และรันในสภาพแวดล้อมแบบไม่ต้องใช้เซิร์ฟเวอร์ที่ปลอดภัยผ่านทางอินเทอร์เฟซภาพหรือ API โดยไม่ต้องตั้งโครงสร้างพื้นฐานของคุณเอง

การประเมินโมเดล: การประเมินโมเดล Amazon Bedrock ช่วยให้คุณจ่ายตามการใช้งานโดยไม่มีข้อผูกมัดปริมาณขั้นต่ำสำหรับจำนวนพร้อมท์หรือการตอบกลับ สำหรับการประเมินโดยอัตโนมัติ (แบบเป็นโปรแกรม) คุณจ่ายเงินสำหรับการอนุมานจากการเลือกโมเดลในการประเมินเท่านั้น คะแนนอัลกอริทึมที่สร้างขึ้นโดยอัตโนมัติจะให้บริการโดยไม่มีค่าใช้จ่ายเพิ่มเติม สำหรับการประเมินอัตโนมัติ (โมเดล/LLM-as-a-judge) คุณจะชำระเฉพาะค่าอนุมานจากโมเดลตัวสร้างและโมเดลตัวประเมินที่คุณเลือกเท่านั้น ในงานการประเมินโมเดล LLM-as-a-Judge ตัวชี้วัดในตัวจะใช้เทมเพลตพร้อมท์ของระบบการตัดสินที่ไม่ซ้ำกันสำหรับแต่ละตัวชี้วัด และโมเดลการตัดสินที่พร้อมใช้งานซึ่งจะถูกเรียกเก็บเงินเป็นส่วนหนึ่งของการใช้งานโทเค็นของคุณ โดยพร้อมท์ของการตัดสินสามารถดูได้ในเอกสารประกอบ AWS สาธารณะเพื่อความโปร่งใส สำหรับการประเมินด้วยมนุษย์ที่ใช้ทีมงานของคุณเอง คุณจะถูกเรียกเก็บสำหรับการอนุมานโมเดลในการประเมิน และคิดค่าใช้จ่าย 0.21 USD ต่องานของมนุษย์ที่เสร็จสมบูรณ์ งานของมนุษย์เกิดขึ้นเมื่อผู้ปฏิบัติงานส่งการประเมินพร้อมท์เดียวและการตอบสนองการอนุมานที่เกี่ยวข้องโดยใช้อินเทอร์เฟซผู้ใช้สำหรับการประเมินโดยมนุษย์ ราคาต่องานจะเหมือนกันไม่ว่าคุณจะมีโมเดลหนึ่งหรือสองแบบในงานประเมินของคุณและเหมือนกันโดยไม่คำนึงถึงจำนวนตัวชี้วัดการประเมินและวิธีการให้คะแนน โดยจะยังมีค่าบริการเท่ากัน ค่าใช้จ่ายสำหรับงานของมนุษย์จะปรากฏภายใต้ส่วน Amazon SageMaker ในใบเรียกเก็บเงิน AWS ของคุณและเหมือนกันสำหรับทุก AWS Region ไม่มีค่าใช้จ่ายแบบแยกต่างหากสำหรับแรงงาน เนื่องจากคุณเป็นผู้จัดหาแรงงานเอง หากคุณใช้ฟีเจอร์ “นำการตอบสนองการอนุมานของคุณเอง” แทนที่จะเรียกโมเดล Bedrock ในระหว่างงานประเมินผล คุณจะถูกเรียกเก็บเงินเฉพาะสำหรับการอนุมานของโมเดลของผู้ประเมิน (งาน LLM-as-a-judge) หรือ 0.21 USD ต่องานที่มนุษย์ทำเสร็จสมบูรณ์ (งานการประเมินโดยมนุษย์) สำหรับการประเมินที่จัดการโดย AWS ค่าบริการจะถูกปรับแต่งตามความต้องการในการประเมินของคุณในการมีส่วนร่วมแบบส่วนตัวในขณะที่ทำงานร่วมกับทีมประเมินผลโดยผู้เชี่ยวชาญของ AWS

การประเมิน RAG: การประเมิน Amazon Bedrock RAG ช่วยให้คุณจ่ายตามการใช้งาน โดยไม่มีข้อผูกมัดปริมาณขั้นต่ำสำหรับจำนวนพร้อมท์หรือการตอบกลับ หากคุณประเมินฐานความรู้ Amazon Bedrock คุณจะชำระเฉพาะค่าอนุมานจากโมเดลตัวสร้างและโมเดลตัวประเมินที่คุณเลือก (งานการประเมินใช้ LLM-as-a-judge) รวมถึงค่าใช้จ่ายใด ๆ ที่เกิดขึ้นจากการใช้ฐานความรู้ในงานการประเมินตามราคาของฐานความรู้ของ Amazon Bedrock หากคุณใช้ฟีเจอร์ “นำการตอบสนองการอนุมานของคุณเอง” คุณจะถูกเรียกเก็บเงินเฉพาะสำหรับการอนุมานของโมเดลของผู้ประเมิน ในงานการประเมิน RAG ตัววัดในตัวจะใช้เทมเพลตคำเตือนของระบบการตัดสินที่ไม่ซ้ำกันสำหรับแต่ละตัวชี้วัด และโมเดลการตัดสินที่พร้อมใช้งานซึ่งจะถูกเรียกเก็บเงินเป็นส่วนหนึ่งของการใช้งานโทเค็นของคุณ และพร้อมท์ของการตัดสินจะพร้อมใช้งานในเอกสารประกอบ AWS สาธารณะเพื่อความโปร่งใส ตัวชี้วัดบางตัวเกี่ยวข้องกับการทำการอนุมานของโมเดลการตัดสินจากบริบทที่ดึงมาจากฐานความรู้/ระบบ RAG ของคุณหรือคำตอบพื้นฐานของคุณ นอกเหนือจากอินพุตพร้อมท์ ซึ่งส่งผลต่อต้นทุนที่เกี่ยวข้องกับตัววัดแต่ละตัว - สามารถดูข้อมูลเพิ่มเติมเกี่ยวกับตัวชี้วัดแต่ละตัวได้ในเอกสารประกอบ AWS สาธารณะสำหรับการประเมิน

รายละเอียดราคาโมเดล

ราคาขึ้นอยู่กับรูปแบบ ผู้ให้บริการ และโมเดล โปรดเลือกผู้ให้บริการโมเดลเพื่อดูราคาโดยละเอียด

Amazon Bedrock นำเสนอโมเดลพื้นฐาน (FM) ที่เลือกจากผู้ให้บริการ AI ชั้นนำเช่น Anthropic, Meta, Mistral AI และ Amazon สำหรับการอนุมานแบบแบทช์ในราคาที่ต่ำกว่า 50% เมื่อเทียบกับราคาอนุมานตามความต้องการ โปรดดูรายการโมเดลที่นี่

  • AI21 Labs
  • AI21 Labs

    ราคาแบบตามความต้องการ

  • Amazon
    • Amazon Nova
    • Amazon Nova

      ราคาสำหรับโมเดลการทำความเข้าใจ

      เครื่องมือในตัว

      ราคาสำหรับโมเดลการสร้างเนื้อหาสร้างสรรค์

      ราคาสำหรับโมเดลการสร้างและทำความเข้าใจคำพูด

      ราคาแบบตามความต้องการสำหรับโมเดลพื้นฐานการแปลงคำพูดเป็นคำพูด

      หมายเหตุ: *ราคาอินพุตและเอาต์พุตโทเค็นข้อความใช้กับกรณีการใช้งานเฉพาะ เช่น การถอดคำพูดเป็นข้อความ การเรียกใช้เครื่องมือเพื่อทำงานให้เสร็จสิ้นหรือสร้างพื้นฐานความรู้ การเพิ่มประวัติการสนทนาลงในเซสชัน ฯลฯ 

      การอนุมานตามความต้องการสำหรับโมเดล Nova ที่กำหนดเองมีราคาเท่ากับการอนุมานพื้นฐาน Nova

      ราคาสำหรับโมเดลการฝัง

    • Amazon Titan
    • Amazon Titan

    • Amazon อื่น ๆ
  • Anthropic
  • Anthropic

    ราคาแบบตามความต้องการและแบบแบตช์

    โมเดลที่มีการเข้าถึงเพิ่มเติม

    ผู้ให้บริการ ชื่อโมเดล ภูมิภาค ราคาต่อโทเค็นอินพุต 1,000 รายการ ราคาต่อโทเค็นเอาต์พุต 1,000 รายการ ค่าบริการต่อโทเค็นอินพุต 1,000 รายการ (แบตช์) ราคาต่อโทเค็นเอาต์พุต 1,000 รายการ (แบตช์) ราคาต่อ 1,000 โทเค็นอินพุต (เขียนแคช) ราคาต่อโทเค็นอินพุต 1,000 รายการ (อ่านแคช)
     Anthropic  Claude 3.5 Sonnet (การเข้าถึงแบบขยายสาธารณะมีผลบังคับใช้ตั้งแต่วันที่ 1 ธันวาคม 2025) สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), ยุโรป (แฟรงก์เฟิร์ต), ยุโรป (ไอร์แลนด์), ยุโรป (ซูริก), ยุโรป (ปารีส) 0.006 USD 0.03 USD 0.003 USD 0.015 USD ไม่มี ไม่มี
    Anthropic  Claude 3.5 Sonnet v2 (การเข้าถึงแบบขยายสาธารณะมีผลบังคับใช้ตั้งแต่วันที่ 1 ธันวาคม 2025) สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) 0.006 USD 0.03 USD 0.003 USD 0.015 USD 0.0075 USD 0.0006 USD

    การอนุมานแบบเพิ่มประสิทธิภาพเวลาแฝง

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

    โมเดล Anthropic ราคาต่อชั่วโมงต่อโมเดล
    โดยไม่มีสัญญาผูกมัด
    ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 1 เดือน ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 6 เดือน

    Claude Instant

    44.00 USD

    39.60 USD

    22.00 USD

    Claude 2.0/2.1

    70.00 USD

    63.00 USD

    35.00 USD

    Region: เอเชียแปซิฟิก (โตเกียว)

    โมเดล Anthropic ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 1 เดือน ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 6 เดือน

    Claude Instant

    53.00 USD

    29.00 USD

    Claude 2.0/2.1

    86.00 USD

    48.00 USD

    ภูมิภาค: ยุโรป (แฟรงก์เฟิร์ต)

    โมเดล Anthropic ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 1 เดือน ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 6 เดือน

    Claude Instant

    49.00 USD

    27.00 USD

    Claude 2.0/2.1

    79.00 USD

    44.00 USD

    โปรดติดต่อทีมบัญชี AWS ของคุณเพื่อขอดูรายละเอียดเพิ่มเติมเกี่ยวกับหน่วยโมเดล 

     

  • Cohere
  • Cohere

    ราคาแบบตามความต้องการ

    โมเดล Cohere ราคาต่อการสืบค้น 1,000 รายการ**
    Rerank 3.5 2.00 USD
    **คุณจะถูกเรียกเก็บเงินตามจำนวนการสืบค้นโดยที่การสืบค้นหนึ่งรายการสามารถมีชิ้นส่วนเอกสารได้สูงสุด 100 ชิ้น หากการสืบค้นมีชิ้นส่วนเอกสารมากกว่า 100 ชิ้น จะนับเป็นการสืบค้นหลายรายการ ตัวอย่างเช่น หากคำขอมีเอกสาร 350 ฉบับ จะถือว่าเป็นการสืบค้น 4 รายการ โปรดทราบว่าเอกสารแต่ละฉบับสามารถมีโทเค็นได้สูงสุด 500 โทเค็นเท่านั้น (รวมถึงแบบสอบถามและโทเค็นทั้งหมดของเอกสาร) และหากความยาวโทเค็นสูงกว่า 512 โทเค็น จะแบ่งออกเป็นเอกสารหลายฉบับ

    ราคาสำหรับการปรับแต่ง (การปรับแต่งอย่างละเอียด)

    *โทเค็นทั้งหมดที่ได้รับการฝึก = จำนวนโทเค็นในคลังข้อมูลการฝึก x จำนวน Epoch

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    โมเดล Cohere ราคาต่อชั่วโมงต่อโมเดล 
    โดยไม่มีสัญญาผูกมัด
    ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 1 เดือน

    ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 6 เดือน

    Cohere Command

    49.50 USD

    39.60 USD

    23.77 USD

    Cohere Command - Light 8.56 USD

    6.85 USD

    4.11 USD
    ฝัง 3 ภาษาอังกฤษ 7.12 USD

    6.76 USD

    6.41 USD
    ฝัง 3 ภาษา 7.12 USD

    6.76 USD

    6.41 USD

    โปรดติดต่อทีมบัญชีหรือฝ่ายขายของ AWS ของคุณเพื่อขอดูรายละเอียดเพิ่มเติมเกี่ยวกับหน่วยโมเดล 

  • DeepSeek
  • DeepSeek

    ราคาแบบตามความต้องการ

  • Luma AI
  • ราคาแบบตามความต้องการ

  • Meta
  • Meta

    Llama 4

    ราคาแบบตามความต้องการและแบบแบตช์

    Llama 3.3

    ราคาแบบตามความต้องการและแบบแบตช์

    Llama 3.2

    ราคาแบบ On-Demand และแบบ Batch

    ราคาสำหรับการปรับแต่งโมเดล (การปรับแต่งอย่างละเอียด)

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    Llama 3.1

    ราคาแบบ On-Demand และแบบ Batch

    ราคาสำหรับการปรับแต่งโมเดล (การปรับแต่งอย่างละเอียด)

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    Llama 3

    ราคาแบบ On-Demand

    Llama 2

    ราคาแบบ On-Demand

    Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

    โมเดล Meta ราคาต่อโทเค็นอินพุต 1,000 รายการ ราคาต่อโทเค็นเอาท์พุต 1,000 รายการ

    Llama 2 Chat (13B)

    0.00075 USD

    0.001 USD

    Llama 2 Chat (70B)

    0.00195 USD

    0.00256 USD

    ราคาสำหรับการปรับแต่งโมเดล (การปรับแต่งอย่างละเอียด)

    โมเดล Meta ราคาในการฝึกโทเค็น 1,000 รายการ ราคาในการจัดเก็บโมเดลแบบกำหนดเองแต่ละโมเดล* ต่อเดือน ราคาเพื่อการอนุมานจากโมเดลที่กำหนดเองต่อ 1 หน่วยโมเดลต่อชั่วโมง (โดยไม่มีการกำหนดราคา อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้โดยไม่มีสัญญาผูกมัด)

    Llama 2 Pretrained (13B)

    0.00149 USD

    1.95 USD

    23.50 USD

    Llama 2 Pretrained (70B)

    0.00799 USD

    1.95 USD 23.50 USD

    *พื้นที่จัดเก็บโมเดลแบบกำหนดเอง = 1.95 USD

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    โมเดล Meta ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 1 เดือน ราคาต่อชั่วโมงต่อหน่วยโมเดลสำหรับสัญญา 6 เดือน

    Llama 2 Pretrained และ Chat (13B)

    21.18 USD

    13.08 USD

    Llama 2 Pretrained (70B)

    21.18 USD

    13.08 USD

    *โมเดล Llama 2 Pre-trained มีเฉพาะใน Provisioned Throughput หลังจากการปรับแต่งเท่านั้น

    โปรดติดต่อทีมบัญชีหรือฝ่ายขายของ AWS ของคุณเพื่อขอดูรายละเอียดเพิ่มเติมเกี่ยวกับหน่วยโมเดล

  • Mistral AI
  • Mistral AI

  • OpenAI
  • OpenAI

  • TwelveLabs
  • TwelveLabs

    ราคาแบบตามความต้องการ

  • Stability AI
  • Stability AI

    ราคาแบบตามความต้องการ

    โมเดลรูปภาพรุ่นก่อนหน้าที่ Stability AI นำเสนอจะมีราคาต่อภาพ ขึ้นอยู่กับจำนวนขั้นตอนและความละเอียดของภาพ

     

    ภูมิภาค: โอเรกอน, เวอร์จิเนียฝั่งเหนือ, โอไฮโอ

    บริการรูปภาพ Stability AI ราคาต่อการสร้างสำหรับแต่ละโมเดล  
    ลบพื้นหลังด้วย Stable Image 0.07 USD  
    วัตถุลบด้วย Stable Image 0.07 USD  
    โครงสร้างการควบคุม Stable Image 0.07 USD  
    ภาพร่างการควบคุม Stable Image 0.07 USD  
    คู่มือรูปแบบ Stable Image 0.07 USD  
    การค้นหาและแทนที่ Stable Image 0.07 USD  
    การแก้ไขรายละเอียดด้วย Stable Image 0.07 USD  
    การค้นหาและปรับสีใหม่ด้วย Stable Image 0.07 USD  
    การถ่ายโอนรูปแบบ Stable Image 0.08 USD  
    การอัปสเกลแบบคงรายละเอียดด้วย Stable Image 0.40 USD  
    การอัปสเกลเชิงสร้างสรรค์ด้วย Stable Image 0.60 USD  
    การอัปสเกลแบบรวดเร็วด้วย Stable Image 0.03 USD  
    การเพิ่มรายละเอียดด้วย Stable Image 0.06 USD  
  • Writer
  • Writer

    ราคาแบบ On-demand

    โมทเดล Writer ราคาต่อโทเค็นอินพุต 1,000 รายการ ราคาต่อโทเค็นเอาต์พุต 1,000 รายการ
    Palmyra X4 0.0025 USD 0.010 USD
    Palmyra X5 0.0006 USD 0.006 USD
  • Qwen
  • Qwen

  • นำเข้าโมเดลที่กำหนดเอง
  • นำเข้าโมเดลที่กำหนดเอง

    • Llama
    • Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.05718 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      Region: ยุโรป (แฟรงก์เฟิร์ต) 

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.07144 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      หมายเหตุ: หน่วยโมเดลแบบกำหนดเองที่จำเป็นในการโฮสต์โมเดลนั้นขึ้นอยู่กับปัจจัยหลายประการ โดยเฉพาะสถาปัตยกรรมโมเดล จำนวนพารามิเตอร์ของโมเดล และความยาวของบริบท จำนวนหน่วยโมเดลแบบกำหนดเองที่ต้องการจะถูกกำหนด ณ เวลาที่นำเข้า สำหรับการอ้างอิง รุ่น Llama 3.1 8B 128K ต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ส่วนรุ่น Llama 3.1 70B 128k ต้องใช้หน่วยโมเดลแบบกำหนดเอง 8 หน่วย

      *เรียกเก็บเงินภายในกรอบเวลา 5 นาที

    • Llama หลายรูปแบบ
    • Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.05718 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      Region: ยุโรป (แฟรงก์เฟิร์ต) 

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.07144 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      หมายเหตุ: หน่วยโมเดลแบบกำหนดเองที่จำเป็นในการโฮสต์โมเดลนั้นขึ้นอยู่กับปัจจัยหลายประการ โดยเฉพาะสถาปัตยกรรมโมเดล จำนวนพารามิเตอร์ของโมเดล และความยาวของบริบท จำนวนหน่วยโมเดลแบบกำหนดเองที่ต้องการจะถูกกำหนด ณ เวลาที่นำเข้า สำหรับการอ้างอิง รุ่น Llama 3.1 8B 128K ต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ส่วนรุ่น Llama 3.1 70B 128k ต้องใช้หน่วยโมเดลแบบกำหนดเอง 8 หน่วย

      *เรียกเก็บเงินภายในกรอบเวลา 5 นาที

    • Mistral
    • Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.05718 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      Region: ยุโรป (แฟรงก์เฟิร์ต) 

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.07144 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      หมายเหตุ: หน่วยโมเดลแบบกำหนดเองที่จำเป็นในการโฮสต์โมเดลนั้นขึ้นอยู่กับปัจจัยหลายประการ โดยเฉพาะสถาปัตยกรรมโมเดล จำนวนพารามิเตอร์ของโมเดล และความยาวของบริบท จำนวนหน่วยโมเดลแบบกำหนดเองที่ต้องการจะถูกกำหนด ณ เวลาที่นำเข้า สำหรับการอ้างอิง รุ่น Llama 3.1 8B 128K ต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ส่วนรุ่น Llama 3.1 70B 128k ต้องใช้หน่วยโมเดลแบบกำหนดเอง 8 หน่วย

      *เรียกเก็บเงินภายในกรอบเวลา 5 นาที

    • Mixtral
    • Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.05718 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      Region: ยุโรป (แฟรงก์เฟิร์ต) 

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.07144 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      หมายเหตุ: หน่วยโมเดลแบบกำหนดเองที่จำเป็นในการโฮสต์โมเดลนั้นขึ้นอยู่กับปัจจัยหลายประการ โดยเฉพาะสถาปัตยกรรมโมเดล จำนวนพารามิเตอร์ของโมเดล และความยาวของบริบท จำนวนหน่วยโมเดลแบบกำหนดเองที่ต้องการจะถูกกำหนด ณ เวลาที่นำเข้า สำหรับการอ้างอิง รุ่น Llama 3.1 8B 128K ต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ส่วนรุ่น Llama 3.1 70B 128k ต้องใช้หน่วยโมเดลแบบกำหนดเอง 8 หน่วย

      *เรียกเก็บเงินภายในกรอบเวลา 5 นาที

    • Flan
    • Region: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.05718 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      Region: ยุโรป (แฟรงก์เฟิร์ต) 

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.07144 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      หมายเหตุ: หน่วยโมเดลแบบกำหนดเองที่จำเป็นในการโฮสต์โมเดลนั้นขึ้นอยู่กับปัจจัยหลายประการ โดยเฉพาะสถาปัตยกรรมโมเดล จำนวนพารามิเตอร์ของโมเดล และความยาวของบริบท จำนวนหน่วยโมเดลแบบกำหนดเองที่ต้องการจะถูกกำหนด ณ เวลาที่นำเข้า สำหรับการอ้างอิง รุ่น Llama 3.1 8B 128K ต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ส่วนรุ่น Llama 3.1 70B 128k ต้องใช้หน่วยโมเดลแบบกำหนดเอง 8 หน่วย

      *เรียกเก็บเงินภายในกรอบเวลา 5 นาที

      การกำหนดราคาอนุมานตามความต้องการ:
      คุณจะถูกเรียกเก็บเงินเป็นช่วงเวลา 5 นาทีสำหรับระยะเวลาที่สำเนาโมเดลของคุณใช้งานอยู่ตั้งแต่การเรียกดำเนินการครั้งแรกที่ประสบความสำเร็จ ปริมาณงานสูงสุดและขีดจำกัดความพร้อมกันต่อสำเนาโมเดลขึ้นอยู่กับปัจจัยต่าง ๆ เช่น การผสมโทเค็นอินพุต/เอาต์พุต ประเภทฮาร์ดแวร์ ขนาดโมเดล สถาปัตยกรรม การเพิ่มประสิทธิภาพการอนุมานและจะถูกกำหนดในระหว่างเวิร์กโฟลว์การนำเข้าโมเดล

      Bedrock จะปรับขนาดจำนวนสำเนาโมเดลโดยอัตโนมัติขึ้นอยู่กับรูปแบบการใช้งานของคุณ หากไม่มีการเรียกดำเนินการเป็นระยะเวลา 5 นาที Bedrock จะลดลงเป็นศูนย์และปรับขนาดสำรองเมื่อคุณเรียกดำเนินการโมเดลของคุณ ขณะปรับขนาดสำรองข้อมูลคุณอาจมีระยะเวลาโคลด์สตาร์ทได้ (ในหลายสิบวินาที) ขึ้นอยู่กับขนาดของโมเดล Bedrock ยังขยายขนาดสำเนาโมเดลหากปริมาณการอนุมานของคุณเกินขีดจำกัดความพร้อมกันของสำเนาโมเดลเดียวอย่างสม่ำเสมอ หมายเหตุ: มีค่าเริ่มต้นสูงสุด 3 สำเนาโมเดลต่อบัญชีต่อโมเดลที่นำเข้าซึ่งสามารถเพิ่มได้ผ่าน Service Quotas

    • Qwen
    • ภูมิภาค: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.05718 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      Region: ยุโรป (แฟรงก์เฟิร์ต) 

      เวอร์ชันหน่วยโมเดลแบบกำหนดเอง v1.0
      ราคาต่อหน่วยโมเดลแบบกำหนดเองต่อนาที* 0.07144 USD
      ต้นทุนพื้นที่จัดเก็บรายเดือนต่อหน่วยโมเดลแบบกำหนดเอง 1.95 USD

      หมายเหตุ: หน่วยโมเดลแบบกำหนดเองที่จำเป็นในการโฮสต์โมเดลนั้นขึ้นอยู่กับปัจจัยหลายประการ โดยเฉพาะสถาปัตยกรรมโมเดล จำนวนพารามิเตอร์ของโมเดล และความยาวของบริบท จำนวนหน่วยโมเดลแบบกำหนดเองที่ต้องการจะถูกกำหนด ณ เวลาที่นำเข้า สำหรับการอ้างอิง รุ่น Llama 3.1 8B 128K ต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ส่วนรุ่น Llama 3.1 70B 128k ต้องใช้หน่วยโมเดลแบบกำหนดเอง 8 หน่วย

      *เรียกเก็บเงินภายในกรอบเวลา 5 นาที

      การกำหนดราคาอนุมานตามความต้องการ:
      คุณจะถูกเรียกเก็บเงินเป็นช่วงเวลา 5 นาทีสำหรับระยะเวลาที่สำเนาโมเดลของคุณใช้งานอยู่ตั้งแต่การเรียกดำเนินการครั้งแรกที่ประสบความสำเร็จ ปริมาณงานสูงสุดและขีดจำกัดความพร้อมกันต่อสำเนาโมเดลขึ้นอยู่กับปัจจัยต่าง ๆ เช่น การผสมโทเค็นอินพุต/เอาต์พุต ประเภทฮาร์ดแวร์ ขนาดโมเดล สถาปัตยกรรม การเพิ่มประสิทธิภาพการอนุมานและจะถูกกำหนดในระหว่างเวิร์กโฟลว์การนำเข้าโมเดล

      Bedrock จะปรับขนาดจำนวนสำเนาโมเดลโดยอัตโนมัติขึ้นอยู่กับรูปแบบการใช้งานของคุณ หากไม่มีการเรียกดำเนินการเป็นระยะเวลา 5 นาที Bedrock จะลดลงเป็นศูนย์และปรับขนาดสำรองเมื่อคุณเรียกดำเนินการโมเดลของคุณ ขณะปรับขนาดสำรองข้อมูลคุณอาจมีระยะเวลาโคลด์สตาร์ทได้ (ในหลายสิบวินาที) ขึ้นอยู่กับขนาดของโมเดล Bedrock ยังขยายขนาดสำเนาโมเดลหากปริมาณการอนุมานของคุณเกินขีดจำกัดความพร้อมกันของสำเนาโมเดลเดียวอย่างสม่ำเสมอ หมายเหตุ: มีค่าเริ่มต้นสูงสุด 3 สำเนาโมเดลต่อบัญชีต่อโมเดลที่นำเข้าซึ่งสามารถเพิ่มได้ผ่าน Service Quotas

รายละเอียดราคาของเครื่องมือและการเพิ่มประสิทธิภาพ

  • Flows
  • Amazon Bedrock Flows

    คุณจะถูกเรียกเก็บค่าบริการตามจำนวนครั้งของการเปลี่ยนโหนดที่จำเป็นในการดำเนินการแอปพลิเคชันของคุณ Bedrock Flows นับการเปลี่ยนโหนดแต่ละครั้งเป็นหนึ่งโหนดในเวิร์กโฟลว์ของคุณที่มีการดำเนินการ คุณจะถูกเรียกเก็บค่าบริการสำหรับจำนวนทั้งหมดของการเปลี่ยนโหนดในทุกโฟลว์ของคุณ

    ค่าธรรมเนียมทั้งหมดจะถูกตรวจวัดรายวันและเรียกเก็บเงินรายเดือนตั้งแต่วันที่ 1 กุมภาพันธ์ 2025

    ราคาต่อการเปลี่ยนโหนด 1,000 โหนด
    0.035 USD

    ค่าบริการเพิ่มเติม

    คุณอาจเสียค่าบริการเพิ่มเติมได้ หากการสั่งงานของแอปพลิเคชันของคุณใช้งานบริการของ AWS หรือถ่ายโอนข้อมูลอื่น ตัวอย่างเช่น หากเวิร์กโฟลว์ของคุณเรียกใช้นโยบายกฎควบคุมระบบ Amazon Bedrock คุณจะถูกเรียกเก็บเงินสำหรับจำนวนหน่วยข้อความที่ประมวลผลโดยนโยบาย 

  • ฐานความรู้
  • การดึงข้อมูลที่มีโครงสร้าง (การสร้าง SQL)

    การดึงข้อมูลที่มีโครงสร้างจะถูกเรียกเก็บเงินสำหรับคำขอแต่ละรายการเพื่อสร้างการสืบค้น SQL การสืบค้น SQL ที่สร้างขึ้นจะใช้เพื่อดึงข้อมูลจากที่เก็บข้อมูลที่มีโครงสร้าง

    โมเดล Rerank

    โมเดล Rerank ได้รับการออกแบบมาเพื่อปรับปรุงความเกี่ยวข้องและความแม่นยำของการตอบสนองในแอปพลิเคชันการดึงข้อมูลเพื่อการสร้างแบบเสริม (RAG) มีการเรียกเก็บเงินต่อการสืบค้น

    **คุณจะถูกเรียกเก็บเงินตามจำนวนการสืบค้นโดยที่การสืบค้นหนึ่งรายการสามารถมีชิ้นส่วนเอกสารได้สูงสุด 100 ชิ้น หากการสืบค้นมีชิ้นส่วนเอกสารมากกว่า 100 ชิ้น จะนับเป็นการสืบค้นหลายรายการ ตัวอย่างเช่น หากคำขอมีเอกสาร 350 ฉบับ จะถือว่าเป็นการสืบค้น 4 รายการ โปรดทราบว่าเอกสารแต่ละฉบับสามารถมีโทเค็นได้สูงสุด 512 โทเค็นเท่านั้น (รวมถึงการสืบค้นและโทเค็นทั้งหมดของเอกสาร) และหากความยาวโทเค็นสูงกว่า 512 โทเค็น จะแบ่งออกเป็นเอกสารหลายฉบับ การสืบค้นเทียบเท่ากับหน่วยค้นหา

  • กฎควบคุมระบบ
  • กฎควบคุมระบบ Amazon Bedrock

    นโยบายกฎควบคุมระบบ*

    ราคา

    ตัวกรองเนื้อหา (เนื้อหาข้อความ)

    0.15 USD ต่อ 1,000 หน่วยข้อความ

    ตัวกรองเนื้อหา (เนื้อหาภาพ)

    0.00075 USD ต่อภาพที่ประมวลผล

    หัวข้อที่ปฏิเสธ

    0.15 USD ต่อ 1,000 หน่วยข้อความ

    ตัวกรองข้อมูลที่ละเอียดอ่อน 

    0.10 USD ต่อ 1,000 หน่วยข้อความ

    ตัวกรองข้อมูลที่ละเอียดอ่อน (นิพจน์ปกติ) 

    ฟรี

    ตัวกรองคำ

    ฟรี

    การตรวจสอบกราวด์ตามบริบท

    0.10 USD ต่อ 1,000 หน่วยข้อความ

    การตรวจสอบการให้เหตุผลอัตโนมัติ

    0.17 USD ต่อ 1,000 หน่วยข้อความ ต่อนโยบายการให้เหตุผลอัตโนมัติ

    ราคาแบบตามความต้องการ

    * นโยบายกฎควบคุมระบบแต่ละข้อเป็นทางเลือกและสามารถเปิดใช้งานได้ตามความต้องการของแอปพลิเคชันของคุณ ค่าธรรมเนียมจะเกิดขึ้นตามประเภทนโยบายที่ใช้ในกฎควบคุมระบบ ตัวอย่างเช่น หากมีการกำหนดค่ากฎควบคุมระบบด้วยตัวกรองเนื้อหาและหัวข้อที่ปฏิเสธ ค่าธรรมเนียมจะเกิดขึ้นสำหรับนโยบายทั้งสองนี้ ในขณะที่ไม่มีค่าใช้จ่ายที่เกี่ยวข้องกับตัวกรองข้อมูลที่ละเอียดอ่อน

    หมายเหตุ: หน่วยข้อความสามารถมีตัวอักษรได้สูงสุด 1000 ตัวอักษร หากการป้อนข้อความมีมากกว่า 1000 ตัวอักษรจะถูกประมวลผลเป็นหน่วยข้อความหลายหน่วยโดยแต่ละตัวมีตัวอักษร 1000 ตัวหรือน้อยกว่า ตัวอย่างเช่น หากการป้อนข้อความมีอักขระ 5,600 ตัว จะถูกเรียกเก็บค่าใช้จ่ายสำหรับหน่วยข้อความ 6 หน่วย

    การตรวจสอบกราวด์ตามบริบทใช้แหล่งอ้างอิงและการสืบค้นเพื่อตรวจสอบว่าการตอบสนองแบบจำลองเป็นพื้นฐานตามแหล่งที่มาและเกี่ยวข้องกับการสืบค้นหรือไม่ จำนวนหน่วยข้อความทั้งหมดที่เรียกเก็บเงินจะถูกคำนวณโดยการรวมอักขระทั้งหมดในแหล่งที่มาการสืบค้นและการตอบสนองแบบจำลอง 

  • การประเมินโมเดล
  • การประเมินโมเดล

    จะมีการเรียกเก็บค่าบริการการประเมินโมเดลสำหรับการอนุมานจากแบบจำลองที่คุณเลือก คะแนนอัลกอริทึมที่สร้างขึ้นโดยอัตโนมัติจะให้บริการโดยไม่มีค่าใช้จ่ายเพิ่มเติม สำหรับการประเมินด้วยมนุษย์ที่คุณนำเวิร์กสตรีมของคุณมาเอง คุณจะถูกเรียกเก็บสำหรับการอนุมานโมเดลในการประเมิน และคิดค่าใช้จ่าย 0.21 USD ต่องานของมนุษย์ที่เสร็จสมบูรณ์

    รุ่น

    ค่าบริการต่อโทเค็นอินพุต 1,000 รายการ

    ราคาต่อโทเค็นเอาต์พุต 1,000 รายการ

    ค่าบริการต่องานของมนุษย์

     

    แบบจำลองที่เลือกสำหรับการประเมิน

    ขึ้นอยู่กับโมเดลที่เลือก

    ขึ้นอยู่กับโมเดลที่เลือก

     

    0.21 USD

     
  • ระบบอัตโนมัติข้อมูล
  • ระบบอัตโนมัติข้อมูล

    ฐานความรู้ของ Amazon Bedrock นำเสนอการผสานรวมระบบอัตโนมัติข้อมูล Bedrock เพื่อให้การตอบสนองที่เกี่ยวข้องและแม่นยำยิ่งขึ้นสำหรับข้อมูลหลายรูปแบบ เมื่อตั้งค่าฐานความรู้ คุณสามารถเลือกระบบอัตโนมัติข้อมูล Bedrock เป็นวิธีการแยกวิเคราะห์เพื่อวิเคราะห์และดึงข้อมูลเชิงลึกที่มีความหมายจากรูปภาพหรือเอกสาร ซึ่งอาจรวมถึงตัวเลข แผนภูมิ และไดอะแกรม ในระหว่างการประมวลผล ระบบอัตโนมัติข้อมูล Bedrock จะดึงข้อมูลที่มีความหมายจากเอกสารและรูปภาพที่ป้อนเข้าไป ซึ่งต่อมาจะถูกนำไปใช้ในขั้นตอนฐานความรู้ในลำดับถัดมาเพื่อทำการตัด การฝัง และการจัดเก็บ เมื่อผสานรวมเข้ากับฐานความรู้แล้ว ระบบอัตโนมัติข้อมูล Bedrock จะส่งมอบผลลัพธ์และคิดค่าบริการสำหรับผลลัพธ์ที่ได้มาตรฐานนั้น

  • การกำหนดเส้นทางพร้อมท์อัจฉริยะ
  • จุดราคา ขอบเขตราคา แผนราคา
    การกำหนดเส้นทางพร้อมท์อัจฉริยะ 1 USD ต่อ 1,000 คำขอ On-Demand

    การกำหนดเส้นทางพร้อมท์อัจฉริยะ

    การกำหนดเส้นทางพร้อมท์อัจฉริยะช่วยให้คุณสามารถใช้การผสมผสานโมเดลพื้นฐาน (FM) จากตระกูลโมเดลเดียวกันเพื่อช่วยเพิ่มประสิทธิภาพในด้านคุณภาพและต้นทุน ตัวอย่างเช่น ด้วยตระกูลโมเดล Claude ของ Anthropic, Amazon Bedrock สามารถกำหนดเส้นทางคำขอระหว่าง Claude 3.5 Sonnet และ Claude 3 Haiku ได้อย่างชาญฉลาดขึ้นอยู่กับความซับซ้อนของพร้อมท์ ในทำนองเดียวกัน Amazon Bedrock สามารถกำหนดเส้นทางคำขอระหว่าง Meta Llama 3.3 70B และ 3.18B และ Nova Pro และ Nova Lite เราเตอร์พร้อมท์จะทำนายว่าโมเดลใดจะให้ประสิทธิภาพที่ดีที่สุดสำหรับแต่ละคำขอ พร้อมทั้งช่วยเพิ่มประสิทธิภาพคุณภาพการตอบสนองและต้นทุน สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับแอปพลิเคชัน เช่น ผู้ช่วยฝ่ายบริการลูกค้า ที่สามารถจัดการกับข้อสอบถามที่ไม่ซับซ้อนได้โดยใช้โมเดลที่เล็กกว่า เร็วกว่า และคุ้มต้นทุนมากกว่า ขณะที่ข้อสอบถามที่ซับซ้อนจะถูกส่งต่อไปยังโมเดลที่มีความสามารถมากกว่า การกำหนดเส้นทางพร้อมท์อัจฉริยะสามารถลดต้นทุนได้ถึง 30 เปอร์เซ็นต์โดยไม่กระทบต่อความแม่นยำ

  • การปรับเพิ่มประสิทธิภาพพร้อมท์
  • การปรับเพิ่มประสิทธิภาพพร้อมท์สำหรับ Amazon Bedrock

    คุณจะถูกเรียกเก็บเงินตามจำนวนโทเค็นในอินพุตพร้อมท์และในพร้อมท์ที่ได้รับการปรับเพิ่มประสิทธิภาพ

    ค่าใช้จ่ายทั้งหมดจะถูกเรียกเก็บรายเดือนตั้งแต่วันที่ 23 เมษายน 2025 

    ราคาต่อ 1,000 โทเค็น
    0.030 USD

ตัวอย่างราคา

  • นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock คือ คำขอให้โมเดล Jurrasic-2 Mid ของ AI21 สรุปการป้อนข้อความอินพุต 10,000 โทเค็นเป็นเอาต์พุต 2,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นคือ = 10,000 โทเค็น/1,000 * 0.0125 USD + 2,000 โทเค็น/1,000 * 0.0125 USD = 0.15 USD

  • ค่าบริการแบบตามความต้องการ

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock แบบรายชั่วโมง คือ คำขอให้โมเดล Amazon Titan Text – Lite สรุปการป้อนข้อความอินพุต 2,000 โทเค็นเป็นเอาต์พุต 1,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นคือ = 2,000 โทเค็น/1,000 * 0.0003 USD + 1,000 โทเค็น/1,000 * 0.0004 USD = 0.001 USD

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock คือ คำขอให้โมเดลพื้นฐาน Amazon Titan Image Generator สร้างภาพขนาด 1024 x 1024 ในขนาดคุณภาพ Standard จำนวน 1,000 ภาพ

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 1,000 ภาพ* 0.01 USD ต่อภาพ = 10 USD

    ค่าบริการการปรับแต่ง (การปรับแต่งอย่างละเอียดและการฝึกล่วงหน้าอย่างต่อเนื่อง)

    นักพัฒนาแอปพลิเคชันปรับแต่งโมเดล Amazon Titan Image Generator โดยใช้คู่รูปภาพและข้อความ 1,000 คู่ หลังการฝึก นักพัฒนาจะใช้อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้ ที่เป็นโมเดลแบบกำหนดเองเป็นเวลา 1 ชั่วโมงเพื่อประเมินประสิทธิภาพของโมเดล โมเดลที่ปรับแต่งอย่างละเอียดจะถูกเก็บไว้เป็นเวลา 1 เดือน หลังการประเมิน นักพัฒนาจะใช้อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้ (สัญญา 1 เดือน) เพื่อโฮสต์โมเดลที่กำหนดเอง

    ค่าใช้จ่ายรายเดือนที่เกิดขึ้นสำหรับการปรับแต่งอย่างละเอียด= การฝึกการปรับแต่งอย่างละเอียด (0.005 USD * 500 * 64) โดยที่ 0.005 USD คือราคาต่อภาพที่เห็น 500 คือจำนวนขั้นตอน และ 64 คือขนาดแบทช์ + พื้นที่จัดเก็บโมเดลแบบกำหนดเองต่อเดือน (1.95 USD) + 1 ชั่วโมงของการอนุมานโมเดลแบบกำหนดเอง (21 USD) = 160 USD + 1.95 USD + 21 = 182.95 USD

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    นักพัฒนาแอปพลิเคชันซื้อหน่วยโมเดล Amazon Titan Text Express สองหน่วยพร้อมสัญญา 1 เดือนเพื่อกรณีการใช้งานสรุปข้อความ

    ค่าใช้จ่ายรายเดือนทั้งหมดที่เกิดขึ้น = 2 หน่วยโมเดล* 18.40 USD/ชั่วโมง* 24 ชั่วโมง* 31 วัน = 27,379.20 USD

    นักพัฒนาแอปพลิเคชันซื้อหน่วยโมเดล Amazon Titan Image Generator พื้นฐานหนึ่งหน่วยพร้อมสัญญา 1 เดือน

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 1 หน่วยโมเดล * 16.20 USD * 24 ชั่วโมง* 31 วัน = 12,052.80 USD

  • ตัวอย่างที่ 1: แชทบอทสนับสนุนลูกค้า
    ผู้พัฒนาแอปพลิเคชันสร้างแชทบอทสนับสนุนลูกค้าและใช้ตัวกรองเนื้อหาเพื่อบล็อกเนื้อหาที่เป็นอันตรายและหัวข้อที่ปฏิเสธเพื่อกรองคำสืบค้นและการตอบสนองที่ไม่พึงประสงค์

    แชทบอทให้บริการแบบสอบถามผู้ใช้จำนวน 1000 รายการต่อชั่วโมง แบบสอบถามผู้ใช้แต่ละรายการมีความยาวป้อนข้อมูลเฉลี่ย 200 ตัวอักษรและได้รับการตอบสนอง FM 1500 ตัวอักษร

    แบบสอบถามผู้ใช้แต่ละตัวที่มีตัวอักษร 200 ตัวสอดคล้องกับ 1 หน่วยข้อความ

    การตอบสนอง FM แต่ละตัวที่มีตัวอักษร 1,500 ตัวสอดคล้องกับ 2 หน่วยข้อความ

    หน่วยข้อความที่ประมวลผลในแต่ละชั่วโมง = (1 + 2) * 1,000 การสืบค้น = 3,000 หน่วยข้อความ

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นต่อชั่วโมงสำหรับตัวกรองเนื้อหาและหัวข้อที่ถูกปฏิเสธ = 3,000 * (0.15 USD + 0.15 USD) / 1,000 = 0.90 USD

     

    ตัวอย่างที่ 2: การสรุปผลการถอดเสียงคอลเซ็นเตอร์
    ผู้พัฒนาแอปพลิเคชันสร้างแอปพลิเคชันเพื่อสรุปการถอดรหัสการแชทระหว่างผู้ใช้และเจ้าหน้าที่สนับสนุน ใช้ตัวกรองข้อมูลที่ละเอียดอ่อนเพื่อแก้ไขข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) ในสรุปที่สร้างขึ้นสำหรับการสนทนา 10,000 รายการ

    สรุปที่สร้างขึ้นแต่ละตัวมีตัวอักษรเฉลี่ย 3,500 ตัวซึ่งสอดคล้องกับ 4 หน่วยข้อความ

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นในการสรุป 10,000 บทสนทนา = 10000 * 4 * (0.1 USD/1000) = 4 USD

     

    ตัวอย่างที่ 3: เครื่องมือตรวจสอบโปรโตคอลทางการแพทย์
    บริษัทเทคโนโลยีการดูแลสุขภาพใช้การตรวจสอบเหตุผลอัตโนมัติในระบบสนับสนุนการตัดสินใจทางคลินิกเพื่อตรวจสอบคำแนะนำการรักษาตามแนวทางการแพทย์

    ระบบประมวลผลผู้ป่วย 5,000 เคสต่อเดือน โดยแต่ละเคสมีการใช้งานดังนี้:

    • สรุปข้อมูลผู้ป่วย: 500 อักขระ (1 หน่วยข้อความ)
    • การประเมินการวินิจฉัย: 2,000 อักขระ (2 หน่วยข้อความ)
    • คำแนะนำในการรักษา: 4,500 อักขระ (5 หน่วยข้อความ)

    หน่วยข้อความที่ประมวลผลต่อเดือน = (1 + 2 + 5) 5,000 เคส = 40,000 หน่วยข้อความ
    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นต่อเดือนสำหรับการตรวจสอบการให้เหตุผลอัตโนมัติ = 40,000 (0.17 USD)/1000 = 6.80 USD

     

  • ตัวอย่างราคา 1 (การจัดอันดับใหม่โดยใช้โมเดล Amazon Rerank 1.0)

    ในเดือนที่กำหนด คุณสร้างคำขอ 2 ล้านรายการไปยัง Rerank API โดยใช้โมเดล Amazon Rerank 1.0 โดยคำขอ 1 ล้านรายการประกอบด้วยเอกสารที่น้อยกว่า 100 ฉบับในแต่ละคำขอ ดังนั้นจะเรียกเก็บเงินแต่ละคำขอเป็นคำขอ 1 รายการ ส่วนคำขอที่เหลืออีก 1 ล้านรายการประกอบด้วยเอกสาร 120-150 ฉบับ ดังนั้นจะเรียกเก็บเงินคำขอแต่ละคำขอเป็นคำขอ 2 รายการ

    ราคาสำหรับคำขอ 1 รายการ = 0.001 USD
    ค่าบริการทั้งหมด = 1,000,000 * 0.001 USD + 1,000,000*2*0.001 USD = 3,000 USD 

    ตัวอย่างราคา 2: (การดึงข้อมูลที่มีโครงสร้าง)

    นักพัฒนาแอปพลิเคชันสร้างแชทบอทสนับสนุนที่สืบค้นข้อมูลที่มีโครงสร้างที่เก็บไว้ใน Amazon Redshift นักพัฒนาสร้างฐานความรู้ Bedrock และเชื่อมต่อกับ Amazon Redshift แชทบอทให้บริการสืบค้นผู้ใช้จำนวน 10,000 รายการต่อชั่วโมง การสืบค้นผู้ใช้แต่ละรายการจะมีค่าใช้จ่าย 0.002 USD ต่อ GenerateQuery API เพื่อสร้าง SQL จากการสืบค้นผู้ใช้

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นสำหรับการสร้าง SQL ต่อชั่วโมง = 0.002 USD * 10,000 = 20 USD
    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นในเดือน = 20 USD*24*30 = 1,440 USD

  • ค่าบริการแบบตามความต้องการ

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock ใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) คือ คำขอให้โมเดล Claude ของ Anthropic สรุปการป้อนข้อความอินพุต 11,000 โทเค็นเป็นเอาต์พุต 4,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 11,000 โทเค็น/1,000 * 0.008 USD + 4,000 โทเค็น/1,000 * 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    นักพัฒนาแอปพลิเคชันซื้อหน่วยโมเดลของ Anthropic Claude Instant หนึ่งหน่วยใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)

    ค่าใช้จ่ายรายเดือนทั้งหมดที่เกิดขึ้น= 1 หน่วยโมเดล* 39.60 USD * 24 ชั่วโมง* 31 วัน = 29,462.40 USD

  • ค่าบริการแบบ On-Demand

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock คือ คำขอให้โมเดล Command ของ Cohere สรุปการป้อนข้อความอินพุต 6,000 โทเค็นเป็นเอาต์พุต 2,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 6,000 โทเค็น/1,000 * 0.0015 USD + 2,000 โทเค็น/1,000 * 0.0020 USD = 0.013 USD

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock คือ คำขอให้โมเดล Command-Light ของ Cohere สรุปการป้อนข้อความอินพุต 6,000 โทเค็นเป็นเอาต์พุต 2,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นคือ = 6,000 โทเค็น/1,000 * 0.0003 USD + 2,000 โทเค็น/1,000 * 0.0006 USD = 0.003 USD

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอให้ทั้ง Embed ภาษาอังกฤษหรือโมเดลหลายภาษาของ Cohere สร้างการฝังสำหรับอินพุต 10,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นคือ = 10,000 โทเค็น/1,000* 0.0001 USD = 0.001 USD

    ค่าบริการการปรับแต่ง (การปรับแต่งอย่างละเอียด)

    นักพัฒนาแอปพลิเคชันปรับแต่งโมเดลคำสั่ง Cohere โดยใช้ข้อมูล 1,000 โทเค็น หลังการฝึก จะใช้อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้โมเดลแบบกำหนดเองเป็นเวลา 1 ชั่วโมงเพื่อประเมินประสิทธิภาพของโมเดล โมเดลที่ปรับแต่งอย่างละเอียดจะถูกเก็บไว้เป็นเวลา 1 เดือน หลังการประเมิน นักพัฒนาจะใช้ อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้ (สัญญา 1 เดือน) เพื่อโฮสต์โมเดลที่กำหนดเอง

    ค่าใช้จ่ายรายเดือนที่เกิดขึ้นสำหรับการปรับแต่งอย่างละเอียดคือ การฝึกปรับแต่งอย่างละเอียด (0.004 USD * 1000) + การจัดเก็บโมเดลแบบกำหนดเองต่อเดือน (1.95 USD) + 1 ชั่วโมงการอนุมานโมเดลแบบกำหนดเอง(49.50 USD) = 55.45 USD

    ค่าใช้จ่ายรายเดือนที่เกิดขึ้นสำหรับอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้ (สัญญา 1 เดือน) ของโมเดลแบบกำหนดเอง = 39.60 USD

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    นักพัฒนาแอปพลิเคชันซื้อหน่วยโมเดล Cohere Command หนึ่งหน่วยพร้อมสัญญา 1 เดือนเพื่อกรณีการใช้งานสรุปข้อความ

    ค่าใช้จ่ายรายเดือนทั้งหมดที่เกิดขึ้น= 1 หน่วยโมเดล* 39.60 USD * 24 ชั่วโมง* 31 วัน = 29,462.40 USD

  • ตัวอย่างราคา: นักพัฒนาแอปพลิเคชันนำเข้าประเภทโมเดล Llama 3.1 ที่กำหนดเองที่มีขนาดพารามิเตอร์ 8B ที่มีความยาวลำดับ 128K ในรีเจี้ยน us-east-1 และลบโมเดลหลังจากผ่านไป 1 เดือน ซึ่งต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ดังนั้น ราคาต่อนาทีจะเท่ากับ 0.1570 USD เนื่องจากต้องใช้หน่วยโมเดลแบบกำหนดเอง 2 หน่วย ค่าใช้จ่ายสำหรับพื้นที่จัดเก็บโมเดลสำหรับหน่วยโมเดลแบบกำหนดเอง 2 หน่วยจะอยู่ที่ 3.90 USD ต่อเดือน

    ไม่มีค่าใช้จ่ายในการนำเข้าโมเดล การเรียกดำเนินการครั้งแรกที่ประสบความสำเร็จคือเวลา 8:03 น. ซึ่งเวลาดังกล่าว การวัดจะเริ่มขึ้น การวัดช่วงเวลา 5 นาทีจะตั้งแต่ 8:03 น. - 8:07 น.; 8:07 น. - 8:11 น. เป็นต้น หากมีการเรียกดำเนินการอย่างน้อยหนึ่งครั้งในช่วงระยะเวลา 5 นาที ช่วงเวลาดังกล่าวจะถือว่าเป็นการใช้งานสำหรับการเรียกเก็บเงิน หากมีการเรียกดำเนินการเวลา 08:03 น. และไม่มีการเรียกอีกต่อไปหลังเวลา 08:07 น. การนับจะหยุดที่เวลา 08:07 น. ในกรณีนี้ จะมีการคำนวณใบเรียกเก็บเงินดังนี้ 0.1570 USD * 5 นาที * 1 ช่วงเวลาห้านาที = 0.785 USD

  • ตัวอย่างราคา 1:
    สมมติว่าคุณประมวลผลเอกสาร 1,000 หน้า โดยใช้เอาต์พุตแบบกำหนดเองของ BDA เอกสารทั้งหมด 1,000 หน้าจะประมวลผลโดยใช้พิมพ์เขียว 1 ซึ่งมีฟิลด์ 15 ช่อง ราคาต่อหน้าสำหรับพิมพ์เขียวใด ๆ ที่มีฟิลด์ 30 ช่องหรือน้อยกว่าคือ 0.040 USD ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 40 USD

    จำนวนหน้าทั้งหมดที่ประมวลผล = 1,000 หน้า
    ราคาต่อหน้าสำหรับพิมพ์เขียวที่มีฟิลด์น้อยกว่า 30 ช่อง = 0.040 USD
    ค่าบริการทั้งหมด = 1,000 * 0.040 USD = 40 USD

     

    ตัวอย่างราคา 2:
    สมมติว่าคุณประมวลผลเอกสาร 2 ฉบับ โดยใช้เอาต์พุตแบบกำหนดเองของ BDA เอกสาร 1 มี 40 หน้า และประมวลผลโดยใช้พิมพ์เขียว 1 ซึ่งมีฟิลด์ 20 ช่อง เอกสาร 2 มี 10 หน้า และประมวลผลโดยใช้พิมพ์เขียว 2 ซึ่งมีฟิลด์ 40 ช่อง ราคาต่อหน้าสำหรับพิมพ์เขียว 1 คือ 0.040 USD เนื่องจากมีฟิลด์ 30 ช่องหรือน้อยกว่า ราคาต่อหน้าสำหรับพิมพ์เขียว 2 คือ 0.045 USD ค่าใช้จ่ายในการประมวลผลสำหรับเอกสาร 1 โดยใช้พิมพ์เขียว 1 คือ 1.60 USD ค่าใช้จ่ายในการประมวลผลสำหรับเอกสาร 2 โดยใช้พิมพ์เขียว 2 คือ 0.45 USD ค่าใช้จ่ายทั้งหมดในการประมวลผลเอกสารทั้งสองจะอยู่ที่ 2.05 USD

    จำนวนหน้าทั้งหมดที่ประมวลผล = 50 หน้า
    ราคาต่อหน้าสำหรับพิมพ์เขียว 1 ที่มีฟิลด์น้อยกว่า 30 ช่อง = 0.040 USD
    ราคาต่อหน้าสำหรับพิมพ์เขียว 2 ที่มี 40 ฟิลด์ = 0.040 USD + (จำนวนของฟิลด์เพิ่มเติมที่เกิน 30 *0.0005 USD ต่อฟิลด์)
    จำนวนฟิลด์เพิ่มเติมที่เกิน 30 = 40 - 30 = 10
    ราคาต่อหน้าสำหรับพิมพ์เขียว 2 ที่มี 40 ฟิลด์ = 0.040 USD + (10 * 0.0005 USD ต่อฟิลด์) = 0.045 USD
    ค่าธรรมเนียมสำหรับเอกสาร 1 โดยใช้พิมพ์เขียว 1 = 40 หน้า x 0.040 USD ต่อหน้า = 1.6 USD
    ค่าธรรมเนียมสำหรับเอกสาร 2 โดยใช้พิมพ์เขียว 2 = 10 หน้า x 0.045 USD ต่อหน้า = 0.45 USD
    ค่าบริการทั้งหมด = ค่าธรรมเนียมสำหรับเอกสาร 1 + ค่าธรรมเนียมสำหรับเอกสาร 2 = 1.6 USD + 0.45 USD = 2.05 USD

     

    ตัวอย่างราคา 3:
    สมมติว่าคุณตั้งค่าฐานความรู้ Bedrock เพื่อใช้ระบบอัตโนมัติข้อมูล Bedrock เป็นตัวแยกวิเคราะห์แล้วป้อนเอกสาร 1,000 หน้าเข้าไป หมายเหตุ โครงสร้างต้นทุนจะแตกต่างกันไปตามตัวเลือกการแยกวิเคราะห์ฐานความรู้ BDA ใช้การกำหนดราคาต่อหน้า ในขณะที่ตัวแยกวิเคราะห์แบบพื้นฐานจะเรียกเก็บเงินตามโทเค็นอินพุตและเอาต์พุต สำหรับบริบท การประมวลผล 1,000 หน้า โดยที่ 30% มีตารางและ 30% มีตัวเลข โดยทั่วไปต้องใช้ 2,900 โทเค็นอินพุตและ 750 โทเค็นเอาต์พุต การบริโภคโทเค็นแตกต่างกันไปตามประเภทเนื้อหา ดังนั้นลูกค้าจึงขอแนะนำให้ทดสอบโดยใช้ข้อมูลของตนเองเพื่อรับการประมาณการที่แม่นยำยิ่งขึ้น การผสานรวมฐานความรู้ Bedrock และระบบอัตโนมัติข้อมูล Bedrock ใช้เอาต์พุตมาตรฐาน โดยที่ราคาต่อหน้าจะเป็น 0.010 USD ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 10 USD

    จำนวนหน้าทั้งหมดที่ประมวลผล = 1,000 หน้า
    ราคาต่อหน้าสำหรับเอาต์พุตมาตรฐาน = 0.010 USD
    ค่าบริการทั้งหมด = 1,000 * 0.010 USD = 10 USD

     

    ตัวอย่างราคา 4:
    สมมติว่าคุณประมวลผลวิดีโอ 60 นาทีโดยใช้เอาต์พุตมาตรฐาน BDA ราคาต่อนาทีสำหรับเอาต์พุตมาตรฐานวิดีโอคือ 0.050 USD ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 3.00 USD

    จำนวนนาทีที่ประมวลผล = 60
    ราคาต่อนาทีสำหรับเอาต์พุตมาตรฐานวิดีโอ = 0.050 USD
    ค่าบริการทั้งหมด = 60 * 0.050 USD = 3.00 USD

     

    ตัวอย่างราคา 5:
    สมมติว่าคุณประมวลผลภาพ 2,000 ภาพ โดยใช้เอาต์พุตแบบกำหนดเองของ BDA ภาพ 1,000 ภาพแรกจะถูกประมวลผลโดยใช้พิมพ์เขียว 1 ซึ่งมีฟิลด์ 10 ช่อง เอกสาร 1,000 หน้าสุดท้ายจะถูกประมวลผลโดยใช้พิมพ์เขียว 2 ซึ่งมีฟิลด์ 40 ช่อง ราคาต่อภาพสำหรับพิมพ์เขียว 1 คือ 0.005 USD เนื่องจากมีฟิลด์ 30 ช่องหรือน้อยกว่า ราคาต่อภาพสำหรับพิมพ์เขียว 2 คือ 0.01 USD ค่าใช้จ่ายในการประมวลผลสำหรับ 1,000 ภาพแรกโดยใช้พิมพ์เขียว 1 คือ 5.00 USD ค่าใช้จ่ายในการประมวลผลสำหรับ 1,000 ภาพที่สองโดยใช้พิมพ์เขียว 2 คือ 10.00 USD ค่าใช้จ่ายทั้งหมดในการประมวลผลภาพทั้งหมด 2,000 ภาพจะอยู่ที่ 15.00 USD

    ค่าใช้จ่ายสำหรับ 1000 ภาพแรก = 1,000 ภาพ * 0.005 USD ต่อภาพ = 5.00 USD
    ค่าใช้จ่ายสำหรับ 1,000 ภาพที่สอง = 1,000 รูปภาพ * (0.005 USD + (จำนวนของฟิลด์เพิ่มเติมที่เกิน 30 *0.0005 USD ต่อฟิลด์))
    = 1,000 * (0.005 USD + ((40-30)*0.0005 USD))
    = 1,000 * (0.005 + (10*0.0005 USD)) = 10.00 USD
    ค่าใช้จ่ายทั้งหมด = 5.00 USD + 10.00 USD = 15.00 USD

     

    ตัวอย่างราคา 6:
    สมมติว่าคุณต้องการใช้เอาต์พุตมาตรฐานของระบบอัตโนมัติข้อมูล Bedrock เพื่อประมวลผลการบันทึกเสียงการประชุม 15,000 นาทีในองค์กรของคุณ ค่าใช้จ่ายทั้งหมดในการประมวลผลเสียงทั้งหมด 15,000 นาทีจะอยู่ที่ 90 USD

    จำนวนนาทีที่ประมวลผล = 15,000 นาที
    ค่าบริการทั้งหมด = 15,000 นาที × 0.006 USD = 90 USD

     

  • ค่าบริการแบบตามความต้องการ

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock แบบรายชั่วโมง คือ คำขอให้โมเดล DeepSeek-R1 สรุปการป้อนข้อความอินพุต 2,000 โทเค็นเป็นเอาต์พุต 1,000 โทเค็น (รวมถึงโทเค็นการให้เหตุผล)

    ค่าใช้จ่ายรวมต่อชั่วโมงที่เกิดขึ้นคือ = 2,000 โทเค็น/1,000 * 0.00135 USD + 1,000 โทเค็น/1,000 * 0.0054 USD = 0.0081 USD

  • ตัวอย่าง: สรุปข่าว
    นักพัฒนาแอปพลิเคชันสร้างโฟลว์เพื่อสรุปข่าวโดยอัตโนมัติสำหรับผู้ค้า โฟลว์ประกอบด้วยโหนดอินพุตที่อยู่ในตำแหน่ง S3 และโหนดดึงข้อมูล S3 ที่ดึงไฟล์ 10 ไฟล์ที่มีบทความจากสำนักข่าวหลัก 10 แห่งใน S3 (การเปลี่ยนโหนด 2 โหนด) จากนั้นจะใช้โหนดอิเทอเรเตอร์ เพื่อเรียกดำเนินการโมเดลที่มีโหนดพร้อมท์เพื่อสรุปแต่ละไฟล์ (+ 10 ไฟล์ x การเปลี่ยนโหนด 2 โหนด) จากนั้นจะรวบรวมผลลัพธ์ทั้งหมดโดยใช้โหนดรวบรวม เขียนผลลัพธ์ไปยัง S3 โดยใช้โหนดจัดเก็บ S3 และเสร็จสมบูรณ์ในโหนดเอาต์พุต (+ การเปลี่ยนโหนด 3 โหนด) พวกเขาเปิดการทำงานของโฟลว์นี้ทุกครึ่งชั่วโมงในทุกวันจันทร์ถึงศุกร์

    จำนวนการเปลี่ยนโหนดต่อการดำเนินการโฟลว์คือ: 2+1+10*2 + 3 = 25 การเปลี่ยนโหนด/การดำเนินการโฟลว์

    จำนวนการดำเนินการโฟลว์ต่อเดือนคือ: 24 ชั่วโมง *2* 5 วัน * 4 สัปดาห์ = 960 การดำเนินการโฟลว์/เดือน

    บิลรายเดือนทั้งหมดคือ 25 * 960 * 0.035 USD/1,000 = 0.84 USD

    ค่าบริการเพิ่มเติม
    นอกจากนี้ใบเรียกเก็บเงินจะรวมถึงค่าใช้จ่ายเพิ่มเติมสำหรับบริการ AWS ที่ใช้ในการดำเนินการเวิร์กโฟลว์ รวมถึงการใช้ Amazon S3 ในโหนดการดึงข้อมูลและการจัดเก็บข้อมูล และการใช้โมเดลพื้นฐานของ Amazon Bedrock ในโหนดพร้อมท์

  • ค่าบริการแบบตามความต้องการ

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock คือ คำขอให้โมเดล Llama 2 Chat (13B) ของ Meta สรุปการป้อนข้อความอินพุต 2,000 โทเค็นเป็นเอาต์พุต 500 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 2,000 โทเค็น/1,000* 0.00075 USD + 500 โทเค็น/1000* 0.001 USD = 0.002 USD

    ค่าบริการการปรับแต่ง (การปรับแต่งอย่างละเอียด)

    นักพัฒนาแอปพลิเคชันปรับแต่งโมเดล Llama 2 ที่ผ่านการฝึกล่วงหน้า (70B) โดยใช้ข้อมูล 1,000 โทเค็น หลังการฝึก จะใช้อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้โมเดลแบบกำหนดเองเป็นเวลา 1 ชั่วโมงเพื่อประเมินประสิทธิภาพของโมเดล โมเดลที่ปรับแต่งอย่างละเอียดจะถูกเก็บไว้เป็นเวลา 1 เดือน หลังการประเมิน นักพัฒนาจะใช้ อัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้ (สัญญา 1 เดือน) เพื่อโฮสต์โมเดลที่กำหนดเอง

    ค่าใช้จ่ายรายเดือนที่เกิดขึ้นสำหรับการปรับแต่งอย่างละเอียดคือ การฝึกปรับแต่งอย่างละเอียด (0.00799 USD * 1000) + การจัดเก็บโมเดลแบบกำหนดเองต่อเดือน (1.95 USD) + 1 ชั่วโมงการอนุมานโมเดลแบบกำหนดเอง (23.50 USD) = 33.44 USD

    ค่าใช้จ่ายรายเดือนที่เกิดขึ้นสำหรับอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้ (สัญญา 1 เดือน) ของโมเดลแบบกำหนดเอง = 21.18 USD

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    นักพัฒนาแอปพลิเคชันซื้อหน่วยโมเดลของ Meta Llama 2 หนึ่งหน่วยพร้อมสัญญา 1 เดือนเพื่อกรณีการใช้งานสรุปข้อความ

    ค่าใช้จ่ายรายเดือนทั้งหมดที่เกิดขึ้นคือ 1 หน่วยโมเดล* 21.18 USD * 24 ชั่วโมง* 31 วัน = 15,757.92 USD

  • ค่าบริการแบบตามความต้องการ

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock แบบรายชั่วโมง คือ คำขอให้โมเดล Mistral 7B สรุปการป้อนข้อความอินพุต 2,000 โทเค็นเป็นเอาต์พุต 1,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 2,000 โทเค็น/1,000 * 0.00015 USD + 1,000 โทเค็น/1,000 * 0.0002 USD = 0.0005 USD

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock แบบรายชั่วโมง คือ คำขอให้โมเดล Mixtral 8x7B สรุปการป้อนข้อความอินพุต 2,000 โทเค็นเป็นเอาต์พุต 1,000 โทเค็น

    ค่าใช้จ่ายรวมต่อชั่วโมงที่เกิดขึ้นคือ = 2,000 โทเค็น/1,000 * 0.00045 USD + 1,000 โทเค็น/1,000 * 0.0007 USD = 0.0016 USD

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock แบบรายชั่วโมง คือ คำขอให้โมเดล Mistral Large สรุปการป้อนข้อความอินพุต 2,000 โทเค็นเป็นเอาต์พุต 1,000 โทเค็น 

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นคือ = 2,000 โทเค็น/1,000 * 0.008 USD + 1,000 โทเค็น/1,000 * 0.024 USD = 0.04 USD

  • ตัวอย่างการประเมินโมเดลที่ 1:

    ราคาแบบ On-demand
    นักพัฒนาแอปพลิเคชันส่งชุดข้อมูลสำหรับการประเมินโมเดลโดยมนุษย์โดยใช้ Anthropic Claude 2.1 และ Anthropic Claude Instant ใน AWS Region สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ)

    ชุดข้อมูลประกอบด้วยพรอมต์ 50 รายการ และนักพัฒนาต้องการให้ผู้ปฏิบัติงานหนึ่งคนให้คะแนนชุดการตอบกลับพรอมต์แต่ละชุด (กำหนดค่าได้ในการสร้างงานการประเมินเป็นพารามิเตอร์ “ผู้ปฏิบัติงานต่อหนึ่งพรอมต์”)

    จะมี 50 งานในงานประเมินนี้ (หนึ่งงานสำหรับแต่ละชุดการตอบสนองแบบแจ้งต่อผู้ปฏิบัติงานแต่ละคน) พรอมต์ 50 รายการรวมกันเป็นโทเค็นอินพุต 5,000 รายการ และการตอบกลับที่เกี่ยวข้องรวมกันเป็น 15,000 โทเค็นสำหรับ Anthropic Claude Instant และ 20,000 โทเค็นสำหรับ Anthropic Claude 2.1

    จะมีค่าใช้จ่ายสำหรับงานการประเมินโมเดลนี้ดังต่อไปนี้

    รายการ จำนวนโทเค็นอินพุต ค่าบริการต่อโทเค็นอินพุต 1,000 รายการ ค่าใช้จ่ายของอินพุต จำนวนโทเค็นเอาต์พุต ค่าบริการต่อโทเค็นเอาต์พุต 1,000 รายการ ค่าใช้จ่ายของเอาต์พุต จำนวนงานของมนุษย์ ค่าบริการต่องานของมนุษย์ ค่าใช้จ่ายของงานของมนุษย์ รวมทั้งหมด
    การอนุมานทันทีของ Claude 5000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20000 0.024 USD 0.48 USD       0.52 USD
    งานของมนุษย์             50 0.21 USD 10.50 USD 10.50 USD
    รวมทั้งหมด                   11.06 USD

    ตัวอย่างการประเมินโมเดลที่ 2:

    ราคาแบบ On-demand
    นักพัฒนาแอปพลิเคชันส่งชุดข้อมูลสำหรับการประเมินโมเดลโดยมนุษย์โดยใช้ Anthropic Claude 2.1 และ Anthropic Claude Instant ใน AWS Region สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ)

    ชุดข้อมูลประกอบด้วยพรอมต์ 50 รายการ และนักพัฒนาต้องการให้ผู้ปฏิบัติงานสองคนให้คะแนนชุดการตอบกลับพรอมต์แต่ละชุด (กำหนดค่าได้ในการสร้างงานการประเมินเป็นพารามิเตอร์ “ผู้ปฏิบัติงานต่อหนึ่งพรอมต์”) งานการประเมินนี้จะมี 100 งาน (1 งานสำหรับแต่ละคู่การตอบกลับพรอมต์ต่อพนักงานแต่ละคน: 2 คน x ชุดการตอบกลับพรอมต์ 50 ชุด = 100 งานของมนุษย์)

    พรอมต์ 50 รายการรวมกันเป็นโทเค็นอินพุต 5,000 รายการ และการตอบกลับที่เกี่ยวข้องรวมกันเป็น 15,000 โทเค็นสำหรับ Anthropic Claude Instant และ 20,000 โทเค็นสำหรับ Anthropic Claude 2.1

    จะมีค่าใช้จ่ายสำหรับงานการประเมินโมเดลนี้ดังต่อไปนี้

    รายการ จำนวนโทเค็นอินพุต ค่าบริการต่อโทเค็นอินพุต 1,000 รายการ ค่าใช้จ่ายของอินพุต จำนวนโทเค็นเอาต์พุต ค่าบริการต่อโทเค็นเอาต์พุต 1,000 รายการ ค่าใช้จ่ายของเอาต์พุต จำนวนงานของมนุษย์ ค่าบริการต่องานของมนุษย์ ค่าใช้จ่ายของงานของมนุษย์ รวมทั้งหมด
    การอนุมานทันทีของ Claude 5000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.0400 USD 20000 0.024 USD 0.48 USD       0.52 USD
    งานของมนุษย์             100 0.21 USD 21.00 USD 21.00 USD
    รวมทั้งหมด                   21.56 USD
  • ตัวอย่าง: การสรุปข่าว
    นักพัฒนาแอปพลิเคชันสร้างพร้อมท์เพื่อสรุปข่าวสำหรับผู้ค้าที่ใช้ Claude 3.5 พร้อมท์ดั้งเดิมประกอบด้วย 429 โทเค็น พร้อมท์ที่ปรับเพิ่มประสิทธิภาพมี 511 โทเค็น และมีคำแนะนำและตัวอย่างที่เฉพาะเจาะจงมากขึ้นเพื่อสร้างคำตอบที่กระชับมากขึ้นจาก FM เขาใช้พร้อมท์ที่ปรับเพิ่มประสิทธภาพที่มี 511 โทเค็นเป็นอินพุตสำหรับเครื่องมือเพิ่มประสิทธิภาพพร้อมท์ และสร้างตัวแปรใหม่ 2 ตัวสำหรับ Claude 3.7 และ Nova Pro ที่มี 582 โทเค็นและ 579 โทเค็น

    จำนวนโทเค็นอินพุตและเอาต์พุตทั้งหมดสำหรับการปรับเพิ่มประสิทธิภาพพร้อมท์: 429 + 511 + 511 + 582 + 511 + 579 = 3,123

    บิลรายเดือนทั้งหมดคือ: 3,123 / 1000 * 0.03 USD = 0.09 USD

  • ค่าบริการแบบ On-Demand

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอไปยังโมเดล SDXL เพื่อสร้างภาพ 512 x 512 ด้วยขนาดสเต็ป 70 (คุณภาพระดับพรีเมียม)

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 1 ภาพ* 0.036 USD ต่อภาพ = 0.036 USD

    นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอไปยังโมเดล SDXL 1.0 เพื่อสร้างภาพ 1024 x 1024 ด้วยขนาดสเต็ป 70 (คุณภาพระดับพรีเมียม)

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 1 ภาพ* 0.08 USD ต่อภาพ = 0.08 USD

    ราคาอัตราการโอนถ่ายข้อมูลที่จัดเตรียมไว้

    นักพัฒนาแอปพลิเคชันซื้อหน่วยโมเดล SDXL1.0 หนึ่งหน่วยพร้อมสัญญา 1 เดือน

    ค่าใช้จ่ายรวมที่เกิดขึ้น = 1 * 49.86 USD * 24 ชั่วโมง* 31 วัน = 37,095.84 USD

  • ราคาแบบตามความต้องการ

    นักพัฒนาแอปพลิเคชันเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอไปยังโมเดล Pegasus 1.2 เพื่ออธิบายว่าวิดีโอยาว 10 วินาทีเกี่ยวข้องกับอะไร โดยใช้เอาต์พุต 2,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 10 วินาที* 0.00049 USD + 2,000 โทเค็น / 1000 * 0.0075 USD = 0.0199 USD


    ผู้พัฒนาแอปพลิเคชันเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอไปยังโมเดล Marengo Embed [3.0 หรือ 2.7] เพื่อฝังวิดีโอ 10 รายการโดยมีระยะเวลารวม 100 นาที

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 100 นาที (ซึ่งเท่ากับ 6,000 วินาที) * 0.00070 USD = 4.2 USD


    นักพัฒนาแอปพลิเคชันเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอไปยังโมเดล Marengo Embed 3.0 โดยให้ข้อความและรูปภาพร่วมกันเพื่อสร้างการฝังที่สามารถใช้เพื่อค้นหาคลิปที่มีกระเป๋าที่แสดงในภาพที่กำหนดในคลังเนื้อหาแบบฝังที่สร้างไว้โดยใช้ตัวอย่างข้างต้น 

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 1 คำขอข้อความ* 0.00007 USD +1 คำขอรูปภาพ* 0.0001 USD = 0.00017 USD


    นักพัฒนาแอปพลิเคชันเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock: คำขอไปยังโมเดล Marengo Embed [3.0 หรือ 2.7]โดยให้ข้อความเพื่อสร้างการฝังที่สามารถใช้เพื่อค้นหาคลิปที่ตรงกันในคลังเนื้อหาแบบฝังที่สร้างไว้โดยใช้ตัวอย่างข้างต้น 

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้น = 1 คำขอข้อความ* 0.00007 USD = 0.00007 USD

  • นักพัฒนาแอปพลิเคชันทำการเรียกใช้ API ต่อไปนี้ไปยัง Amazon Bedrock คือ คำขอให้โมเดล Palmyra X5 ของ Writer สรุปการป้อนข้อความอินพุต 10,000 โทเค็นเป็นเอาต์พุต 2,000 โทเค็น

    ค่าใช้จ่ายทั้งหมดที่เกิดขึ้นคือ = 10,000 โทเค็น/1,000 * 0.003 USD + 2,000 โทเค็น/1,000 * 0.015 USD = 0.06 USD