Las instancias de cuaderno de Amazon SageMaker ahora admiten instancias basadas en Trainium1 e Inferentia 2
Nos complace anunciar la disponibilidad general de las instancias EC2 basadas en Trainium1 e Inferentia2 en las instancias de SageMaker Notebook.
Las instancias Trn1 de Amazon EC2, con chips de AWS Trainium, y las instancias Inf2, con chips de AWS Inferentia, están diseñadas específicamente para el entrenamiento y la inferencia de aprendizaje profundo de alto rendimiento, respectivamente. Las instancias Trn1 ofrecen ahorros de costos en comparación con otras instancias Amazon EC2 comparables para entrenar más de 100 000 millones de modelos de IA generativa de parámetros, como los modelos de lenguaje de gran tamaño (LLM) y la difusión latente. Las instancias Inf2 ofrecen inferencias de bajo costo y alto rendimiento para la IA generativa, incluidos los LLM y los transformadores de visión. Puede utilizar las instancias Trn1 e Inf2 en un amplio conjunto de aplicaciones, como el resumen de texto, la generación de código, la respuesta a preguntas, la generación de imágenes y videos, la recomendación y la detección de fraudes.
Las instancias Trn1 de Amazon EC2 están disponibles para los cuadernos de SageMaker en las regiones Este de EE. UU. (Norte de Virginia y Ohio) y Oeste de EE. UU. (Oregón) de AWS. Las instancias TRN1n de Amazon EC2 están disponibles para SageMaker NBI en la región este de EE. UU (norte de Virginia y Ohio) de AWS. Las instancias Inf2 de Amazon EC2 están disponibles para SageMaker NBI en las siguientes regiones de AWS: Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia y Ohio), UE (Irlanda), UE (Fráncfort), Asia Pacífico (Tokio), Asia Pacífico (Sídney), Asia Pacífico (Bombay), UE (Londres), Asia Pacífico (Singapur), UE (París) y Sudamérica (São Paulo).
Consulte la guías para desarrolladores y obtenga instrucciones sobre la configuración y el uso de las instancias de cuadernos de SageMaker.