Le istanze del notebook Amazon SageMaker ora supportano le istanze basate su Trainium1 e Inferentia2

Inserito il: 15 nov 2024

Siamo lieti di annunciare la disponibilità al pubblico delle istanze EC2 basate su Trainium1 e Inferentia2 sulle istanze notebook SageMaker.

Le istanze Trn1 di Amazon EC2, con chip di AWS Trainium, e le istanze Inf2, con chip di AWS Inferentia, sono costruite appositamente per l'addestramento e l'inferenza di deep learning ad alte prestazioni, rispettivamente. Le istanze Trn1 offrono risparmi sui costi rispetto ad altre istanze Amazon EC2 comparabili per l'addestramento di modelli di IA generativa da oltre 100 miliardi di parametri come i modelli linguistici di grandi dimensioni (LLM) e la diffusione latente. Le istanze Inf2 forniscono inferenza ad alte prestazioni e a basso costo per l'IA generativa, inclusi LLM e trasformatori di visione. È possibile utilizzare le istanze Trn1 e Inf2 su un'ampia gamma di applicazioni, come riepilogo del testo, generazione di codice, risposta a domande, generazione di immagini e video, consigli e rilevamento di frodi.

Le istanze Amazon EC2 Trn1 sono disponibili per le istanze notebook SageMaker nelle regioni AWS Stati Uniti orientali (Virginia settentrionale e Ohio) e Stati Uniti occidentali (Oregon). Le istanze Trn1n di Amazon EC2 sono disponibili per le istanze notebook SageMaker nelle regioni AWS Stati Uniti orientali (Virginia settentrionale e Ohio). Le istanze Inf2 di Amazon EC2 sono disponibili per le istanze notebook SageMaker nelle regioni AWS Stati Uniti occidentali (Oregon), AWS Stati Uniti orientali (Virginia settentrionale e Ohio), AWS Europa (Irlanda), AWS Europa (Francoforte), AWS Asia Pacifico (Tokyo), AWS Asia Pacifico (Sydney), AWS Asia Pacifico (Mumbai), AWS Europa (Londra), AWS Asia Pacifico (Singapore), AWS Europa (Stoccolma), AWS Europa (Parigi) e AWS Sud America (San Paolo).

Consulta la guida per sviluppatori per le istruzioni sulla configurazione e sull'utilizzo delle istanze del notebook SageMaker.