Las instancias administradas de Amazon ECS ahora son compatibles con AWS Trainium y AWS Inferentia
Las instancias administradas de Amazon Elastic Container Service (Amazon ECS) ahora son compatibles con AWS Trainium y AWS Inferentia, aceleradores de IA diseñados específicamente para ofrecer un rendimiento escalable y una rentabilidad para el entrenamiento y la inferencia en una amplia gama de cargas de trabajo de IA generativas. Las instancias administradas de Amazon ECS son una opción de procesamiento totalmente administrada diseñada para eliminar la sobrecarga de administración de la infraestructura y, al mismo tiempo, brindarle acceso a todas las capacidades de Amazon EC2. Al transferir las operaciones de infraestructura a AWS, las instancias administradas de ECS lo ayudan a lanzar y escalar rápidamente sus cargas de trabajo, a la vez que mejoran el rendimiento y reducen el costo total de propiedad.
Con las instancias administradas de ECS, obtiene el rendimiento de las aplicaciones que desea y la simplicidad que necesita. Ahora puede crear un proveedor de capacidad de instancias administradas de ECS y seleccionar los tipos de instancias aceleradas que desee, incluidos Inferentia2, Trainium1 y Trainium2, y luego agregar la configuración NEURON_CORE=all a la sección ResourceRequirement de la definición de la tarea. Esto indicará a Amazon ECS que lance las instancias que haya especificado y que coloque una sola tarea por instancia, asignando automáticamente todos los recursos del acelerador a su carga de trabajo para lograr un rendimiento óptimo.
Para empezar a utilizar las instancias administradas de ECS, utilice la consola de AWS, el servidor MCP de Amazon ECS o sus herramientas favoritas de infraestructura como código para habilitarlas en un clúster de ECS nuevo o existente. Se le cobrará por la administración del procesamiento aprovisionado, además de los costos habituales de Amazon EC2. Para obtener más información sobre las instancias administradas de ECS, visite la página de características, la documentación y el blog de lanzamiento de AWS News.