Amazon Bedrock amplia il supporto per Service Quotas
Amazon Bedrock è un servizio completamente gestito che offre accesso sicuro e di livello aziendale a modelli di fondazione ad alte prestazioni forniti da aziende leader nel campo dell'IA, consentendo di sviluppare e scalare applicazioni di IA generativa in modo efficiente. I clienti di Amazon Bedrock possono ora visualizzare le quote di inferenza per l'endpoint bedrock-mantle tramite AWS Service Quotas. Ciò offre ai clienti una modalità familiare e coerente per verificare i limiti di questo endpoint, esattamente come già avviene per l'endpoint bedrock-runtime e per gli altri servizi AWS, garantendo una visibilità chiara sui limiti applicati ai propri carichi di lavoro.
L'endpoint bedrock-mantle supporta l'API Responses di OpenAI, l'API Chat Completions e l'API Messages di Anthropic, consentendo ai clienti di eseguire applicazioni esistenti basate su OpenAI o Anthropic su Amazon Bedrock con modifiche minime al codice. AWS Service Quotas ora espone le quote di token di input al minuto e di token di output al minuto per ciascun modello supportato sull'endpoint.
Con questo lancio, i clienti ottengono una visibilità chiara sui limiti applicati al proprio endpoint bedrock-mantle e possono pianificare in modo proattivo la scalabilità in produzione. Per iniziare, apri la console AWS Service Quotas, scegli Amazon Bedrock e cerca "Bedrock Mantle" per visualizzare le quote correnti. Per richiedere un aumento di una di queste quote, segui la procedura standard di aumento dei limiti di Amazon Bedrock. Il supporto di Service Quotas per l'endpoint bedrock-mantle è disponibile in tutte le regioni AWS in cui l'endpoint è supportato: Stati Uniti orientali (Virginia settentrionale, Ohio), Stati Uniti occidentali (Oregon), Asia Pacifico (Mumbai, Tokyo, Sydney, Giacarta), Europa (Francoforte, Irlanda, Londra, Milano, Stoccolma) e Sud America (San Paolo). Per ulteriori informazioni, consulta Quotas per Amazon Bedrock.