Amazon Bedrock führt die Reserved-Dienstebene ein
Heute hat Amazon Bedrock eine neue Reserved-Dienstebene für Workloads eingeführt, die eine vorhersehbare Leistung und garantierte Token-Kapazität pro Minute erfordern. Die Reserved-Ebene bietet die Möglichkeit, priorisierte Rechenkapazität zu reservieren, sodass die Service-Level für Ihre geschäftskritischen Anwendungen jederzeit vorhersehbar sind. Sie bietet auch die Flexibilität, verschiedene Kapazitäten für Ein- und Ausgabe-Token pro Minute zuzuweisen, um den genauen Anforderungen Ihrer Workload gerecht zu werden und die Kosten steuern zu können. Dies ist besonders hilfreich, da viele Workloads asymmetrische Token-Nutzungsmuster haben. Beispielsweise verbrauchen Zusammenfassungsaufgaben viele Eingabe-Token, generieren aber weniger Ausgabe-Token, während Inhaltserstellungsaufgaben weniger Eingabe- und mehr Ausgabekapazität benötigen. Wenn Ihre Anwendung mehr Token pro Minute benötigt, als Sie reserviert haben, geht der Dienst automatisch zur Pay-as-you-go-Standardebene über, um einen unterbrechungsfreien Betrieb zu gewährleisten. Die Reserved-Ebene zielt auf eine Betriebszeit von 99,5 % für Modellantworten ab und ist ab sofort für Anthropic Claude Sonnet 4.5 verfügbar. Kunden können Kapazitäten für einen Zeitraum von 1 Monat oder 3 Monaten reservieren. Kunden zahlen einen Festpreis pro 1.000 Token pro Minute und erhalten eine monatliche Rechnung.
Mit der Reserved-Dienstebene bietet Amazon Bedrock seinen Kunden weiterhin eine größere Auswahl und hilft ihnen, Anwendungen und Agenten zu entwickeln, zu skalieren und bereitzustellen, die die Produktivität und das Kundenerlebnis verbessern und gleichzeitig Leistungs- und Kostenanforderungen miteinander in Einklang bringen.
Weitere Informationen zu den AWS-Regionen, in denen Amazon Bedrock Reserved verfügbar ist, finden Sie in der Dokumentation. Wenden Sie sich an Ihr AWS-Kontoteam, um Zugriff auf die Reserved-Ebene zu erhalten.