- AWS›
- Soluciones›
- Historias de clientes
Optimización de los costos y el rendimiento de la IA generativa mediante el uso de Amazon SageMaker con Forethought Technologies
Descubra cómo Forethought Technologies, un proveedor de soluciones de IA generativa para el servicio de atención al cliente, redujo los costes hasta en un 80 por ciento con Amazon SageMaker.
Métricas clave
Información general
Forethought Technologies (Forethought), un proveedor de software de servicio de atención al cliente, quería mejorar sus costos y disponibilidad de machine learning (ML) a medida que ganaba nuevos clientes. La empresa ya utilizaba Amazon Web Services (AWS) para el entrenamiento y la inferencia de modelos de ML y quería ser cada vez más eficiente y escalable con su pequeño equipo de infraestructura en la nube.
Para lograr sus objetivos, Forethought migró la inferencia y el alojamiento de modelos de aprendizaje automático a Amazon SageMaker, que se utiliza para crear, entrenar e implementar modelos de aprendizaje automático para prácticamente cualquier caso de uso con infraestructuras, herramientas y flujos de trabajo totalmente gestionados. Con Amazon SageMaker, Forethought mejoró la disponibilidad y los tiempos de respuesta a los clientes, a la vez que redujo sus costos de ML hasta en un 80 por ciento.
Acerca de Forethought Technologies
Forethought Technologies es una startup de los Estados Unidos que ofrece un conjunto de IA generativa para el servicio de atención al cliente que utiliza machine learning para transformar el ciclo de vida de la atención al cliente. La empresa genera más de 30 millones de interacciones con los clientes al año.
Oportunidad | Usar Amazon SageMaker a fin de brindar soporte a más clientes a un costo más bajo para Forethought
El conjunto de soluciones de servicio de atención al cliente de Forethought funciona con IA generativa, un tipo de IA que puede crear nuevos contenidos e ideas, como conversaciones, historias, imágenes, vídeos y música. En el centro del producto de Forethought se encuentra su tecnología SupportGPT, que utiliza modelos de lenguaje de gran tamaño y sistemas de recuperación de información para impulsar más de 30 millones de interacciones con los clientes cada año. Mediante la automatización, la empresa reduce la carga de los equipos de atención al cliente al ayudar a los usuarios con IA conversacional. Muchos de los clientes de Forethought utilizan su producto durante los periodos de mayor actividad, como los días festivos o las campañas fiscales, a fin de gestionar más problemas con menos agentes de atención al cliente. Forethought ofrece modelos de ML hiperpersonalizados para sus clientes y, a menudo, entrena varios modelos por cliente para adaptarse a casos de uso individuales.
Forethought se fundó en 2017 en los Estados Unidos e inicialmente utilizaba varios proveedores de nube para alojar sus productos y Amazon SageMaker para entrenar modelos de ML. En sus dos primeros años, la empresa creó una solución para su inferencia de aprendizaje automático mediante Amazon Elastic Kubernetes Service (Amazon EKS), un servicio de Kubernetes gestionado para ejecutar Kubernetes en la nube de AWS y de forma local. A medida que la empresa seguía creciendo y ganando nuevos clientes, quería mejorar la disponibilidad de su solución y reducir los costos.
Para satisfacer sus necesidades de escalabilidad, disponibilidad y optimización de costos, Forethought decidió migrar su inferencia de ML a Amazon SageMaker y la empresa comenzó a utilizar características adicionales de Amazon SageMaker para mejorar sus productos. En este proceso, Forethought diseñó su canalización para beneficiarse de las mejoras de latencia y disponibilidad que podía lograr con Amazon SageMaker. “Desde el equipo de Amazon SageMaker y en general, para cualquier cosa que necesitemos, nos ponen en contacto con las personas adecuadas para que podamos utilizar AWS con éxito”, afirma Jad Chamoun, Director of Core Engineering en Forethought.
Solución | Reducir los costos y mejorar la disponibilidad con la inferencia de Amazon SageMaker
Forethought migró su inferencia de aprendizaje automático de Amazon EKS a terminales multimodelo de Amazon SageMaker Model Deployment, una solución escalable y rentable para implementar grandes cantidades de modelos. Un ejemplo de esta característica en acción en la solución de Forethought es el autocompletado de las palabras siguientes en una oración cuando un usuario escribe. La empresa utiliza los puntos de conexión multimodelo de Amazon SageMaker para ejecutar varios modelos de ML en un único punto de conexión de inferencia. Esto mejora la escalabilidad y la eficiencia de los recursos de hardware, como las GPU. La empresa también redujo los costos mediante el uso de los puntos de conexión multimodelo de Amazon SageMaker. “Con Amazon SageMaker, podemos brindar asistencia a los clientes a un costo menor por cliente”, afirma Chamoun. “Al migrar a los puntos de conexión multimodelo de Amazon SageMaker, redujimos nuestros costos hasta en un 66 por ciento y, al mismo tiempo, proporcionamos una mejor latencia y mejores tiempos de respuesta a los clientes”.
Forethought también usa la inferencia sin servidor de Amazon SageMaker, una opción de inferencia personalizada, para implementar y escalar modelos de ML sin configurar ni administrar ninguna de las infraestructuras subyacentes. El uso de la inferencia sin servidor de Amazon SageMaker por parte de Forethought gira en torno a pequeños modelos y clasificadores que se adaptan perfectamente a cada caso de uso del cliente, como la determinación automática de la prioridad de un ticket de asistencia. Al migrar algunos de sus clasificadores a la inferencia sin servidor de Amazon SageMaker, Forethought ahorró alrededor de un 80 por ciento en los costos de nube relacionados.
El equipo de infraestructura de nube de Forethought está formado por tres personas. Ejecutar y administrar todos los modelos de ML y los clústeres de Kubernetes suponía una sobrecarga de trabajo para un equipo pequeño. Con Amazon SageMaker, la empresa puede escalar tanto como quiera con el personal que tiene. “Ejecutamos varias instancias en los puntos de conexión multimodelo de Amazon SageMaker”, afirma Chamoun. “Podemos compartir los recursos de manera más eficiente y, al mismo tiempo, ofrecer una mejor disponibilidad que en el pasado”.
Con Amazon SageMaker, el equipo de Forethought ya no tiene que preocuparse por las excepciones de memoria o la disponibilidad, problemas a los que los tres ingenieros hubieran tenido que dedicar mucho tiempo. Como la empresa configuró las canalizaciones automatizadas para los modelos de lenguaje con Amazon SageMaker, los equipos de Forethought y sus clientes pueden interactuar con los datos que desean entrenar y enviarlos. “No tener que participar en la formación, la implantación y el escalado fue clave para que pudiéramos trabajar en otros puntos que tienen más impacto para la empresa”, dice Chamoun. Forethought ahora ejecuta más del 80 por ciento de su inferencia de GPU en Amazon SageMaker entre los puntos de conexión multimodelo de Amazon SageMaker y la inferencia sin servidor de Amazon SageMaker.
Resultado | Continuar con la hiperpersonalización con AWS
Forethought sigue creciendo y ofreciendo modelos de ML hiperpersonalizados para más clientes. La empresa sigue recurriendo a AWS para mejorar su infraestructura e innovar su producto. Forethought forma parte del Programa global para empresas emergentes de AWS, un programa de comercialización al que solo se puede acceder mediante invitación y que apoya a las empresas emergentes en fase intermedia o avanzada que han recaudado fondos institucionales, han conseguido adaptarse al mercado de sus productos y están listas para crecer. La empresa está haciendo correr la voz sobre su producto, que ahora está en AWS Marketplace.
“Ya sean nuestros servicios de búsqueda, nuestras inferencias para modelos de ML específicos o el chat con nuestros bots de atención al cliente, todo lo que tenemos utiliza Amazon SageMaker”, afirma Chamoun.
Al migrar a los puntos de enlace multimodelo de Amazon SageMaker, redujimos nuestros costos hasta en un 66% y, al mismo tiempo, proporcionamos una mejor latencia y mejores tiempos de respuesta a los clientes.
Jad Chamoun
Director de Ingeniería Central, Forethought TechnologiesIntroducción
¿Ha encontrado lo que buscaba hoy?
Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios