Le istanze gestite di Amazon ECS ora supportano AWS Trainium e AWS Inferentia

Inserito il: 3 giu 2026

Le istanze gestite di Amazon Elastic Container Service (Amazon ECS) ora supportano AWS Trainium e AWS Inferentia, acceleratori di IA appositamente progettati per offrire prestazioni scalabili ed efficienza delle tariffe per l'addestramento e l'inferenza su un'ampia gamma di attività di IA generativa. Le istanze gestite di Amazon ECS sono un'opzione di calcolo completamente gestita, progettata per eliminare il sovraccarico operativo legato alla gestione dell'infrastruttura, garantendo al contempo l'accesso a tutte le funzionalità di Amazon EC2. Delegando le operazioni infrastrutturali ad AWS, le istanze ECS gestite contribuiscono ad avviare e scalare rapidamente i carichi di lavoro, migliorando le prestazioni e riducendo il costo totale di proprietà.

Le istanze ECS gestite offrono le prestazioni applicative richieste e la semplicità operativa necessaria. È ora possibile creare un provider di capacità delle istanze gestite di Amazon ECS e selezionare i tipi di istanza accelerata desiderati, tra cui Inferentia2, Trainium1 e Trainium2, quindi aggiungere la configurazione NEURON_CORE=all alla sezione ResourceRequirement della definizione dell'attività. Ciò indicherà ad Amazon ECS di avviare le istanze specificate e di eseguire una singola attività per istanza, allocando automaticamente tutte le risorse dell'acceleratore all'attività per ottenere prestazioni ottimali.

Per iniziare a usare le istanze ECS gestite, utilizza la console AWS, il server MCP di Amazon ECS o i tuoi strumenti infrastructure-as-code preferiti per abilitarle in un cluster Amazon ECS nuovo o esistente. In aggiunta ai normali costi di Amazon EC2, sarà previsto un addebitato per la gestione delle risorse di calcolo sottoposte a provisioning. Per ulteriori informazioni sulle istanze gestite di Amazon ECS, consultare la pagina della funzionalità, la documentazione e il post sul lancio nel blog AWS News.