Etiquetado de datos de Amazon SageMaker

Crear conjuntos de datos de alta calidad para el entrenamiento de los modelos de machine learning

Amazon SageMaker presenta dos ofertas de etiquetado de datos: Amazon SageMaker Ground Truth Plus y Amazon SageMaker Ground Truth. Ambas opciones permiten identificar datos sin procesar, como imágenes, archivos de texto y videos y agregar etiquetas informativas para crear conjuntos de datos de formación de alta calidad para modelos de machine learning (ML).

Amazon SageMaker Ground Truth Plus

Con Amazon SageMaker Ground Truth Plus puede crear fácilmente conjuntos de datos de formación de alta calidad sin tener que crear aplicaciones de etiquetado o administrar el personal de etiquetado por su cuenta. Amazon SageMaker Ground Truth Plus ayuda a reducir los costos de etiquetado de datos hasta en un 40 %. Amazon SageMaker Ground Truth Plus proporciona personal experto formado en tareas de machine learning (ML) que pueden ayudar a cumplir con los objetivos de seguridad y privacidad de los datos y las exigencias de cumplimiento. Solo tiene que cargar los datos y Amazon SageMaker Ground Truth Plus crea flujos de trabajo de etiquetado de datos y administra el personal.

Amazon SageMaker Ground Truth

Si busca flexibilidad al crear y administrar los flujos de trabajo de etiquetado de datos y el personal encargado del etiquetado de datos, puede utilizar Amazon SageMaker Ground Truth. SageMaker Ground Truth es un servicio de etiquetado de datos que facilita el etiquetado de los datos y brinda la opción de utilizar anotadores humanos mediante Amazon Mechanical Turk, proveedores externos o su propio personal privado.

Cómo funciona

  • Etiquetar datos con SageMaker Ground Truth Plus
  • Etiquetado de datos con SageMaker Ground Truth Plus
  • Comparación de características
  • Etiquetar datos con SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth Plus ayuda a crear conjuntos de datos de formación de alta calidad sin tener que crear aplicaciones de etiquetado o administrar el personal de etiquetado por su cuenta.

    Cómo funciona Amazon SageMaker Ground Truth Plus
  • Etiquetado de datos con SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth ayuda a crear sus propios flujos de trabajo de etiquetado de datos y a administrar el personal de etiquetado de datos.

    Cómo funciona Amazon SageMaker Ground Truth
  • Comparación de características
  • Categoría Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    Flujos de trabajo de etiquetado de datos Flujos de trabajo personalizados o 30+ incorporados para texto, imágenes, video y nubes de puntos en 3D. Usted administra los flujos de trabajo de etiquetado de datos y la calidad del etiquetado de datos. Expertos de AWS configuran los flujos de trabajo y los administran de acuerdo con las exigencias de calidad y de plazos de entrega.
    Usuario Científicos de datos e ingenieros en machine learning (ML) Científicos de datos, ingenieros en machine learning (ML), gerentes de operaciones de datos y gerentes de programa
    Personal Usted elige: proveedores de terceros, Amazon Mechanical Turk o su propio personal privado Personal experto que puede ayudar a cumplir con los objetivos de seguridad y privacidad de los datos y con las exigencias de cumplimiento 
    Técnicas de etiquetado de machine learning (ML)  Aprendizaje activo  Aprendizaje activo, preetiquetado y validación automática 

Beneficios

Mejora de la calidad de los conjuntos de datos de formación

Las ofertas de etiquetado de datos de Amazon SageMaker proporcionan técnicas de etiquetado de machine learning (ML) menos propensas a los errores manuales y ayudan a mejorar la calidad de los conjuntos de datos de formación. Amazon SageMaker Ground Truth Plus cuenta con un flujo de trabajo de etiquetado de varias etapas que incluye modelos de machine learning (ML) para el preetiquetado, validación automática del etiquetado humano para detectar errores y etiquetas de baja calidad y características de etiquetado auxiliar (p. ej: quiebre de cuboides 3D, predicción del contenido siguiente en el etiquetado de videos y herramientas de segmentación automática). Si administra sus propios flujos de trabajo de etiquetado de datos, SageMaker Ground Truth proporciona características de etiquetado automático como la segmentación automática, el quiebre de cuboides 3D y la fusión de sensores con cuadros de video en 2D.  Además, SageMaker Ground Truth proporciona la función de etiquetado de datos automático que utiliza el aprendizaje activo y solo envía datos etiquetados a los usuarios humanos si el modelo no puede etiquetarlos de manera segura.

Elegir el personal de etiquetado de datos

Con las ofertas de etiquetado de datos de Amazon SageMaker, puede elegir el personal de etiquetado de datos. Con SageMaker Ground Truth Plus, un personal experto y formado en tareas de machine learning (ML) etiqueta los datos en función de las exigencias de calidad y plazos de entrega. Con SageMaker Ground Truth, tiene opciones para trabajar con etiquetadores tanto dentro como fuera de la organización. Puede enviar trabajos de etiquetado a etiquetadores internos o bien acceder a un grupo de más de 500 000 contratistas independientes que ya ejecutan tareas relacionadas con machine learning (ML) con Amazon Mechanical Turk. Si los datos requieren confidencialidad o habilidades especiales, también puede elegir proveedores cuyos procedimientos de calidad y seguridad hayan sido previamente evaluados por AWS.

Aumentar la visibilidad de las operaciones de etiquetado de datos

Las ofertas de etiquetado de datos de Amazon SageMaker permiten ganar transparencia en las operaciones de etiquetado de datos y en la administración de la calidad para que pueda verificar que se cumplen las exigencias en materia de calidad. SageMaker Ground Truth Plus proporciona paneles interactivos e interfaces de usuario, para monitorear el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados.

Recibir datos etiquetados de alta calidad de forma rápida

Con las ofertas de etiquetado de datos de Amazon SageMaker, puede recibir datos etiquetados de alta calidad de forma rápida. Con SageMaker Ground Truth Plus, solo tiene que cargar los datos en Amazon S3, junto con las exigencias de seguridad, privacidad y cumplimiento. Luego, los expertos de AWS configuran el flujo de trabajo del etiquetado de datos y un personal experto completa las tareas de etiquetado.

Introducción a Amazon SageMaker Ground Truth Plus