Amazon Bedrock เปิดตัวระดับบริการอนุมานขั้น Priority และ Flex
วันนี้ Amazon Bedrock เปิดตัวบริการอนุมานใหม่สองระดับเพื่อเพิ่มประสิทธิภาพต้นทุนและประสิทธิภาพสำหรับเวิร์กโหลด AI ที่แตกต่างกัน ระดับ Flexใหม่ เสอราคาที่คุ้มค่าสำหรับแอปพลิเคชันที่ไม่ถือว่าสำคัญด้านเวลา เช่น การประเมินโมเดลและการสรุปเนื้อหา ในขณะที่ระดับ Priority ให้ประสิทธิภาพระดับพรีเมียมและการประมวลผลพิเศษสำหรับแอปพลิเคชันที่มีความสำคัญต่อภารกิจ สำหรับรุ่นส่วนใหญ่ที่รองรับ Priority Tier ลูกค้าสามารถรับความล่าช้าของโทเค็นเอาต์พุตต่อวินาที (OTPS) ได้ดีขึ้นถึง 25% เมื่อเทียบกับระดับมาตรฐาน สิ่งเหล่านี้จะเข้าร่วมกับระดับ มาตรฐาน ที่มีอยู่สำหรับแอปพลิเคชัน AI ในชีวิตประจำวันที่มีประสิทธิภาพที่เชื่อถือได้
ระดับบริการเหล่านี้ตอบสนองต่อความท้าทายสำคัญที่องค์กรต้องเผชิญเมื่อปรับใช้ AI ในระดับใหญ๋ ระดับ Flex ได้รับการออกแบบมาสำหรับเวิร์กโหลดแบบไม่โต้ตอบซึ่งสามารถทนต่อความล่าช้าที่ยาวนานขึ้นทำให้เหมาะสำหรับการประเมินโมเดล สรุปเนื้อหา การติดฉลากและคำอธิบายประกอบ และเวิร์กโฟลว์ตัวแทนหลายขั้นตอน และมีราคาส่วนลดเมื่อเทียบกับระดับมาตรฐาน ในช่วงที่มีความต้องการสูง คำขอ Flex จะได้รับความสำคัญต่ำกว่าเมื่อเทียบกับระดับมาตรฐาน ระดับ Priority เหมาะอย่างยิ่งสำหรับการใช้งานที่สำคัญสำหรับภารกิจ การโต้ตอบกับผู้ใช้ปลายทางแบบเรียลไทม์ และประสบการณ์แบบโต้ตอบซึ่งการตอบสนองที่สม่ำเสมอและรวดเร็วเป็นสิ่งสำคัญ ในช่วงที่มีความต้องการสูง คำขอ Priority จะได้รับลำดับความสำคัญในการประมวลผลในราคาพรีเมี่ยมเหนือระดับบริการอื่น ระดับบริการใหม่เหล่านี้มีให้บริการในวันนี้สำหรับรุ่นพื้นฐานชั้นนำมากมาย รวมถึง OpenAI (gpt-oss-20b, gpt-oss-120b), DeepSeek (DeepSeek V3.1), Qwen3 (Coder-480B-A35B-Instruct, Coder-30B-A3B-Instruct, 32B dense, Qwen3-235B-A22B-2507) และ Amazon Nova (Nova Pro และ Nova Premier) ด้วยตัวเลือกใหม่เหล่านี้ Amazon Bedrock ช่วยให้ลูกค้าสามารถควบคุมการปรับสมดุลต้นทุนกับข้อกำหนดด้านประสิทธิภาพการทำงานได้มากขึ้น ทำให้พวกเขาสามารถปรับขนาดเวิร์กโหลด AI ได้อย่างประหยัดในขณะที่รับประกันประสบการณ์ผู้ใช้ที่เหมาะสมที่สุดสำหรับแอปพลิเคชันที่สำคัญที่สุด
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ AWS Region ที่มีระดับบริการอนุมานของ Amazon Bedrock แบบ Priority และ Flex ให้บริการแล้ว โปรดดูตาราง AWS Region
เรียนรู้เพิ่มเติมเกี่ยวกับระดับบริการในบล็อกข่าวและเอกสารของเรา