Human-in-the-loop es el proceso de aprovechar las aportaciones humanas a lo largo del ciclo de vida del ML para mejorar la precisión y la relevancia de los modelos. Los humanos pueden llevar a cabo una variedad de tareas, desde la generación y anotación de datos hasta la revisión, personalización y evaluación de los modelos. La intervención humana es especialmente importante para las aplicaciones de IA generativa, en las que los humanos suelen ser tanto los solicitantes como los consumidores del contenido. Por lo tanto, es fundamental que las personas capaciten a los modelos fundacionales (FM) para que respondan las solicitudes de los usuarios de manera precisa, segura y relevante. Los comentarios humanos se pueden aplicar para ayudarlo a completar varias tareas. En primer lugar, crear conjuntos de datos de entrenamiento etiquetados de alta calidad para aplicaciones de IA generativa, mediante el aprendizaje supervisado (en el que un humano simula el estilo, la longitud y la precisión de la forma en que un modelo debe responder a las solicitudes del usuario) y el aprendizaje por refuerzo con comentarios humanos (en el que un humano categoriza y clasifica las respuestas del modelo). En segundo lugar, utilizar datos generados por personas para personalizar los FM para tareas específicas o con datos específicos de su empresa y dominio y hacer que la salida del modelo sea relevante para usted. Y, por último, utilizar la evaluación y la comparación humanas para seleccionar el FM que mejor se adapte a su caso de uso y a los requisitos del proyecto.
Amazon SageMaker Ground Truth ofrece el conjunto más completo de capacidades de human-in-the-loop. Hay dos formas de utilizar Amazon SageMaker Ground Truth: una oferta de autoservicio y una oferta administrada por AWS. En la oferta de autoservicio, los anotadores de datos, los creadores de contenido y los ingenieros de solicitudes (internos, administrados por el proveedor o que aprovechan al público) pueden utilizar nuestra interfaz de usuario de código mínimo para acelerar las tareas de human-in-the-loop y, al mismo tiempo, tener la flexibilidad para crear y gestionar sus propios flujos de trabajo personalizados. En la oferta administrada por AWS (SageMaker Ground Truth Plus), nos encargamos de las tareas más pesadas por usted, que incluyen la selección y la administración del personal adecuado para su caso de uso. SageMaker Ground Truth Plus diseña y personaliza un flujo de trabajo integral (que incluye pasos detallados de entrenamiento de la fuerza laboral y de control de calidad) y proporciona un equipo calificado administrado por AWS que está capacitado en las tareas específicas y cumple con los requisitos de calidad, seguridad y conformidad de los datos.
Las capacidades human-in-the-loop desempeñan un papel importante en la creación y mejora de aplicaciones de IA generativas basadas en el FM. Una fuerza laboral humana altamente calificada que esté capacitada sobre las pautas de las tareas puede proporcionar comentarios, orientación, aportes y evaluar actividades como generar datos de demostración para entrenar a los FM, corregir y mejorar las respuestas de las muestras, ajustar un modelo basado en datos de la empresa y el sector, actuar como protección contra la toxicidad y los sesgos, etc. Por lo tanto, las capacidades de human-in-the-loop pueden mejorar la precisión y el rendimiento del modelo.
Para comenzar a utilizar Amazon SageMaker Ground Truth Plus (oferta administrada de AWS), rellene el formulario de requisitos del proyecto. Nuestro equipo se pondrá en contacto para hablar sobre su proyecto human-in-the-loop.
Para comenzar con Amazon SageMaker Ground Truth (oferta de autoservicio), inicie sesión en la consola de administración de AWS y navegue hasta la consola de SageMaker. Una vez allí, seleccione Labeling jobs (Trabajos de etiquetado) en Ground Truth. Aquí, podrá crear un trabajo de etiquetado. Primero, como parte del flujo de creación de trabajos de etiquetado, usted debe proporcionar un puntero al bucket S3 que contiene el conjunto de datos que quiere etiquetar. Ground Truth ofrece plantillas para tareas comunes de etiquetado en las que solo necesita hacer clic en algunas opciones y proporcionar instrucciones mínimas de etiquetado de sus datos. La otra alternativa es crear su propia plantilla personalizada. El último paso para crear un trabajo de etiquetado consta en elegir una de las tres opciones de personal humano: (1) personal público con participación colectiva, (2) un conjunto seleccionado de proveedores de servicios de etiquetado de datos de terceros o (3) empleados propios. También tiene la opción de habilitar el etiquetado automatizado de datos.
De forma predeterminada, Amazon SageMaker Ground Truth cifra los datos almacenados en un bucket de Amazon S3 en reposo y en tránsito. Además, el acceso a los datos se controla con AWS Identity and Access Management (IAM). SageMaker Ground Truth no almacena ni copia sus datos fuera de su entorno de AWS (creados por usted o mediante el servicio administrado de AWS), y estos permanecen bajo su control. Además, Ground Truth es compatible con estándares de conformidad, tales como el Reglamento General de Protección de Datos (GDPR), y proporciona registros y auditorías de todos los accesos a sus datos mediante Amazon CloudWatch y Amazon CloudTrail. Para más información, consulte la documentación de Amazon SageMaker Ground Truth.
Con Amazon SageMaker Ground Truth Plus (oferta administrada por AWS), puede acceder a una fuerza laboral experta y bajo demanda que está capacitada en sus tareas específicas de AI/ML, puede escalar dinámicamente sus flujos de trabajo hacia arriba o hacia abajo en función de los requisitos específicos del proyecto y puede ayudarle a cumplir sus requisitos de calidad, seguridad y cumplimiento de los datos. Nuestro equipo trabajará con usted para comprender las habilidades que requiere su proyecto y dotarlo de la fuerza laboral adecuada.
Para obtener información actualizada sobre los precios, consulte la página de precios de SageMaker Ground Truth. Los proyectos de SageMaker Ground Truth Plus tienen un precio individual y nuestro equipo revisará las opciones de precios con usted después de que envíe el formulario de requisitos del proyecto. La tabla de regiones de AWS enumera todas las regiones de AWS en las que está disponible actualmente Amazon SageMaker Ground Truth.