Amazon SageMaker lanza la inferencia de modelos con varios adaptadores

Publicado en: 25 de nov de 2024

Hoy, Amazon SageMaker presenta nuevas capacidades de inferencia con varios adaptadores que ofrecen interesantes posibilidades a los clientes que utilizan modelos de lenguaje previamente entrenados. Esta característica le permite implementar cientos de adaptadores del modelo LoRa (adaptación de rango bajo) ajustados en un solo punto de enlace, cargando dinámicamente los adaptadores apropiados en milisegundos según la solicitud. Esto le permite alojar de manera eficiente muchos adaptadores LoRa especializados basados en un modelo base común, lo que brinda un alto rendimiento y ahorros de costos en comparación con la implementación de modelos separados.

Con la inferencia de múltiples adaptadores, puede personalizar rápidamente los modelos previamente entrenados para satisfacer las diversas necesidades empresariales. Por ejemplo, las empresas de marketing y SaaS pueden personalizar las aplicaciones de inteligencia artificial y machine learning (IA/ML) utilizando las imágenes, el estilo de comunicación y los documentos únicos de cada cliente para generar contenido personalizado en segundos. Del mismo modo, las empresas de sectores como los servicios financieros y de salud pueden reutilizar un modelo base común impulsado por LoRa para abordar una variedad de tareas especializadas, desde el diagnóstico médico hasta la detección de fraudes, simplemente cambiando el adaptador adecuado con ajuste de precisión. Esta flexibilidad y eficiencia abren nuevas oportunidades para implementar una IA potente y adaptable en toda la organización.

Esta características de inferencia de múltiples adaptadores está disponible de forma general en las siguientes regiones: Asia-Pacífico (Tokio, Seúl, Bombay, Singapur, Sídney, Yakarta), Canadá (centro), Europa (Fráncfort, Estocolmo, Irlanda, Londres), Oriente Medio (Emiratos Árabes Unidos), América del Sur (São Paulo), Este de EE. UU. (Norte de Virginia, Ohio) y Oeste de EE. UU. (Oregón).

Para empezar, consulte la guía para desarrolladores de Amazon SageMaker para obtener información sobre el uso de LoRa y la administración de los adaptadores de modelos.