Etiquetado de datos de Amazon SageMaker

Crear conjuntos de datos de alta calidad para el entrenamiento de los modelos de machine learning

Mejorar la calidad de los conjuntos de datos de entrenamiento

Elegir el personal de etiquetado de datos

Aumentar la visibilidad de las operaciones de etiquetado de datos

Recibir datos etiquetados de alta calidad de forma rápida

Amazon SageMaker le permite identificar datos sin procesar, como imágenes, archivos de texto y videos; agregar etiquetas informativas y generar datos sintéticos etiquetados para crear conjuntos de datos de entrenamiento de alta calidad para sus modelos de machine learning (ML). SageMaker ofrece dos opciones, Amazon SageMaker Ground Truth Plus y Amazon SageMaker Ground Truth, que le proporcionan la flexibilidad de usar una fuerza de trabajo experta para crear y administrar flujos de trabajo de etiquetado de datos en su nombre o administrar sus propios flujos de trabajo de etiquetado de datos.

Amazon SageMaker Ground Truth Plus

Con SageMaker Ground Truth Plus, puede crear conjuntos de datos de entrenamiento de alta calidad sin tener que crear aplicaciones de etiquetado o gestionar personal de etiquetado por su cuenta. SageMaker Ground Truth Plus ayuda a reducir los costos de etiquetado de datos hasta en un 40 %. SageMaker Ground Truth Plus proporciona personal experto formado en tareas de ML que puede ayudar a satisfacer sus requisitos de seguridad de datos, privacidad y cumplimiento. Carga sus datos y luego SageMaker Ground Truth Plus crea y gestiona los flujos de trabajo de etiquetado de datos y la mano de obra en su nombre.

Amazon SageMaker Ground Truth

Si quiere la flexibilidad de crear y gestionar sus propios flujos de trabajo de etiquetado de datos y personal, puede usar SageMaker Ground Truth. SageMaker Ground Truth es un servicio de etiquetado de datos que facilita el etiquetado de datos y le da la opción de usar anotadores humanos a través de Amazon Mechanical Turk, proveedores de terceros o su propio personal privado.

También puede generar datos sintéticos etiquetados sin necesidad de recoger o etiquetar manualmente datos reales. SageMaker Ground Truth puede generar cientos de miles de imágenes sintéticas etiquetadas automáticamente en su nombre.

Cómo funciona

  • Etiquetar datos con SageMaker Ground Truth Plus
  • Etiquetado de datos con SageMaker Ground Truth Plus
  • Generar datos sintéticos etiquetados
  • Comparación de características
  • Etiquetar datos con SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth Plus ayuda a crear conjuntos de datos de formación de alta calidad sin tener que crear aplicaciones de etiquetado o administrar el personal de etiquetado por su cuenta.

    Cómo funciona Amazon SageMaker Ground Truth Plus
  • Etiquetado de datos con SageMaker Ground Truth Plus
  • Amazon SageMaker Ground Truth ayuda a crear sus propios flujos de trabajo de etiquetado de datos y a administrar el personal de etiquetado de datos.

    Cómo funciona Amazon SageMaker Ground Truth
  • Generar datos sintéticos etiquetados
  • Amazon SageMaker Ground Truth le ayuda a generar datos sintéticos etiquetados.

    Generar datos sintéticos etiquetados
  • Comparación de características
  • Categoría Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    Flujos de trabajo de etiquetado de datos Flujos de trabajo personalizados o más de 30 integrados para texto, imágenes, video y nubes de puntos 3D. Administra sus flujos de trabajo de etiquetado de datos y la calidad del etiquetado de datos Flujos de trabajo personalizados o más de 30 integrados para texto, imágenes, video y nubes de puntos 3D. Administra sus flujos de trabajo de etiquetado de datos y la calidad del etiquetado de datos
    Usuario Científicos de datos e ingenieros en machine learning (ML) Científicos de datos, ingenieros en machine learning (ML), gerentes de operaciones de datos y gerentes de programa
    Personal Usted elige: proveedores de terceros, Amazon Mechanical Turk o su propio personal privado Personal experto que puede ayudarle a cumplir con los requisitos de seguridad de datos, privacidad y cumplimiento de la normativa 
    Técnicas de etiquetado de ML  Aprendizaje activo Aprendizaje activo, preetiquetado y validación automática 
    Generación de datos sintéticos Admitido Admitido

Beneficios

Mejorar la calidad de los conjuntos de datos de entrenamiento

Las ofertas de etiquetado de datos de Amazon SageMaker proporcionan técnicas de etiquetado de ML que son menos propensas a los errores manuales, incluida la generación de datos sintéticos, y ayudan a mejorar la calidad de los conjuntos de datos de entrenamiento. Amazon SageMaker Ground Truth Plus cuenta con un flujo de trabajo de etiquetado de varios pasos que incluye modelos de ML para el preetiquetado, la validación automática del etiquetado humano para detectar errores y etiquetas de baja calidad, y características de etiquetado de asistencia (por ejemplo, ajuste de cubo 3D, predicción de siguiente en el etiquetado de video y herramientas de autosegmentación). Si administra sus propios flujos de trabajo de etiquetado de datos, SageMaker Ground Truth proporciona características de etiquetado automático como la segmentación automática, el quiebre de cuboides 3D y la fusión de sensores con cuadros de video en 2D. Además, SageMaker Ground Truth proporciona la función de etiquetado de datos automático que utiliza el aprendizaje activo y solo envía datos etiquetados a los usuarios humanos si el modelo no puede etiquetarlos de manera segura.

Elegir el personal de etiquetado de datos

Con las ofertas de etiquetado de datos de Amazon SageMaker, tiene dos opciones para etiquetar datos. En primer lugar, con SageMaker Ground Truth Plus, personal experto y formado en tareas de ML etiqueta sus datos de acuerdo con sus requisitos de calidad y tiempo de entrega. En segundo lugar, con SageMaker Ground Truth, puede crear y gestionar sus flujos de trabajo de etiquetado de datos. Tiene opciones para trabajar con etiquetadores dentro y fuera de su organización. Por ejemplo, puede enviar trabajos de etiquetado a sus propios etiquetadores, o puede acceder a un personal de más de 500 000 contratistas independientes que ya hacen tareas relacionadas con ML a través de Amazon Mechanical Turk. Si los datos requieren confidencialidad o habilidades especiales, también puede usar proveedores preseleccionados por AWS en cuanto a calidad y procedimientos de seguridad. Si tiene que acceder a datos sintéticos para que sus conjuntos de datos de entrenamiento sean más completos para entrenar modelos de ML, los artistas digitales de AWS usan activos e imágenes proporcionados por el cliente para generar datos sintéticos que se etiquetan automáticamente en su nombre.

Aumentar la visibilidad de las operaciones de etiquetado de datos

Las ofertas de etiquetado de datos de Amazon SageMaker permiten ganar transparencia en las operaciones de etiquetado de datos y en la administración de la calidad para que pueda verificar que se cumplen las exigencias en materia de calidad. SageMaker Ground Truth Plus proporciona paneles interactivos e interfaces de usuario, para monitorear el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados.

Recibir datos etiquetados de alta calidad de forma rápida

Con las ofertas de etiquetado de datos de Amazon SageMaker, puede recibir datos etiquetados de alta calidad de forma rápida. Con SageMaker Ground Truth Plus, carga sus datos en Amazon S3 junto con los requisitos de seguridad, privacidad y cumplimiento. Posteriormente, los expertos de AWS configurarán el flujo de trabajo de etiquetado de datos y una plantilla de expertos completará sus tareas de etiquetado. Si necesita acceso a datos sintéticos, especifique sus requisitos de imagen o proporcione activos 3D e imágenes de referencia para que SageMaker Ground Truth pueda generar datos sintéticos etiquetados de gran precisión para el entrenamiento de modelos de ML.

Precios de Amazon SageMaker Ground Truth
¿Tiene preguntas?

Página de preguntas frecuentes sobre el etiquetado de datos de Amazon SageMaker.

Más información 
Regístrese para obtener una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Registrarse 
Comience a crear en la consola
Comience a crear en la consola

Comience a crear con el etiquetado de datos de Amazon SageMaker en la consola de administración de AWS.

Iniciar sesión