Publicado en: Dec 1, 2021
Hoy, nos entusiasma anunciar la disponibilidad general de Amazon SageMaker Ground Truth Plus, un nuevo servicio de etiquetado de datos inmediato que le permite crear conjuntos de datos de formación de alta calidad con rapidez y que reduce los costos hasta en un 40 %.
Para formar un modelo de machine learning (ML), los científicos de datos necesitan grandes conjuntos de datos etiquetados de alta calidad. A medida que crece la adopción del ML, aumentan las necesidades de etiquetado. Esto obliga a los científicos de datos a dedicar semanas a la creación de flujos de trabajo de etiquetado de datos y a la administración de personal de etiquetado de datos. Desafortunadamente, esto frena la innovación y aumenta los costos. Para garantizar que los científicos de datos puedan dedicar su tiempo a la creación, la formación y la implementación de modelos de ML, los científicos de datos suelen encargar a otros equipos internos, conformados por gerentes de operaciones de datos y gerentes de programas, la producción de conjuntos de datos de formación de alta calidad. Sin embargo, estos equipos por lo general no tienen acceso a las habilidades necesarias para entregar conjuntos de datos de formación de alta calidad, lo que afecta a los resultados del ML. ¿Y si pudiera depender de un servicio inmediato que le permitiera crear conjuntos de datos de formación de alta calidad a escala sin consumir recursos internos? Entre en Amazon SageMaker Ground Truth Plus.
Amazon SageMaker Ground Truth Plus facilita a los científicos de datos, así como a los gerentes de empresas, por ejemplo, a los gerentes de operaciones de datos y los gerentes de programas, la creación de conjuntos de datos de formación de alta calidad, ya que elimina el trabajo pesado e indiferenciado asociado a la creación de aplicaciones de etiquetado de datos y la administración del personal de etiquetado. Todo lo que tiene que hacer es proporcionar los datos junto con los requisitos de etiquetado para que Ground Truth Plus configure y administre el flujo de trabajo de etiquetado de datos en función de estos requisitos. A partir de ahí, personal experto y formado en diversas tareas de ML se encarga del etiquetado de datos. Para utilizar Ground Truth Plus no es necesario tener una gran experiencia en ML ni conocimientos sobre el diseño de flujos de trabajo y administración de la calidad.
Ground Truth Plus utiliza técnicas de ML, como el aprendizaje activo, el preetiquetado y la validación automática. Esto aumenta la calidad del conjunto de datos de salida y disminuye los costos de etiquetado de datos. Ground Truth Plus proporciona transparencia de las operaciones de etiquetado de datos y administración de la calidad. Con él, puede revisar el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados. Ground Truth Plus puede utilizarse para diversos casos de uso, como la visión artificial, el procesamiento de lenguaje natural y el reconocimiento del habla.
Amazon SageMaker Ground Truth Plus está disponible de manera general en la región de AWS Este de EE. UU. (Norte de Virginia). Para obtener más información sobre Amazon SageMaker Ground Truth Plus, lea la publicación del blog, consulte la documentación de Ground Truth Plus y visite la página web de etiquetado de datos de SageMaker o vaya a la consola de Ground Truth Plus para comenzar.