Amazon Bedrock erweitert Support für Service Quotas
Amazon Bedrock ist ein vollständig verwalteter Service, der sicheren, unternehmensgerechten Zugriff auf leistungsstarke Basismodelle führender KI-Unternehmen bietet und es Ihnen ermöglicht, generative KI-Anwendungen zu erstellen und zu skalieren. Amazon Bedrock-Kunden können jetzt Inferenzquoten für den Bedrock-Mantle-Endpunkt über AWS Service Quotas einsehen. Dies bietet Kunden eine vertraute, konsistente Methode, die Limits für diesen Endpunkt zu verfolgen, so wie sie es bereits für den Bedrock-Runtime-Endpunkt und andere AWS-Services tun, und gibt ihnen einen klaren Überblick über die Grenzwerte, die für ihre Workloads gelten.
Der Bedrock-Mantle-Endpunkt unterstützt die OpenAI Responses API, OpenAI Chat Completions API und die Anthropic Messages API, sodass Kunden bestehende OpenAI- oder Anthropic-basierte Anwendungen auf Amazon Bedrock mit minimalen Codeänderungen ausführen können. AWS Service Quotas macht jetzt Kontingente für Eingabe-Tokens pro Minute pro Modell und Ausgabe-Tokens pro Minute für unterstützte Modelle auf dem Endpunkt verfügbar.
Mit dieser Markteinführung erhalten Kunden einen Überblick darüber, wie viele Grenzen sie am Bedrock-Mantle-Endpunkt haben, und können proaktiv den Produktionsmaßstab planen. Öffnen Sie zunächst die AWS Service Quotas-Konsole, wählen Sie Amazon Bedrock aus und suchen Sie nach „Bedrock Mantle“, um Ihre aktuellen Kontingente anzuzeigen. Um eine Erhöhung eines dieser Kontingente zu beantragen, folgen Sie dem Standardverfahren zur Erhöhung des Limits von Amazon Bedrock. Service Quotas-Support für den Bedrock-Mantle-Endpunkt ist in allen AWS-Regionen verfügbar, in denen der Endpunkt angeboten wird: USA Ost (Nord-Virginia, Ohio), USA West (Oregon), Asien-Pazifik (Mumbai, Tokio, Sydney, Jakarta), Europa (Frankfurt, Irland, London, Mailand, Stockholm) und Südamerika (São Paulo). Weitere Informationen finden Sie unter Quotas für Amazon Bedrock.