Etiquetado de datos de Amazon SageMaker
Crear conjuntos de datos de alta calidad para el entrenamiento de los modelos de machine learning
Elegir el personal de etiquetado de datos
Aumentar la visibilidad de las operaciones de etiquetado de datos
Recibir datos etiquetados de alta calidad de forma rápida
Amazon SageMaker le permite identificar datos sin procesar, como imágenes, archivos de texto y videos; agregar etiquetas informativas y generar datos sintéticos etiquetados para crear conjuntos de datos de entrenamiento de alta calidad para sus modelos de machine learning (ML). SageMaker ofrece dos opciones, Amazon SageMaker Ground Truth Plus y Amazon SageMaker Ground Truth, que le proporcionan la flexibilidad de usar una fuerza de trabajo experta para crear y administrar flujos de trabajo de etiquetado de datos en su nombre o administrar sus propios flujos de trabajo de etiquetado de datos.
Amazon SageMaker Ground Truth Plus
Con SageMaker Ground Truth Plus, puede crear conjuntos de datos de entrenamiento de alta calidad sin tener que crear aplicaciones de etiquetado o gestionar personal de etiquetado por su cuenta. SageMaker Ground Truth Plus ayuda a reducir los costos de etiquetado de datos hasta en un 40 %. SageMaker Ground Truth Plus proporciona personal experto formado en tareas de ML que puede ayudar a satisfacer sus requisitos de seguridad de datos, privacidad y cumplimiento. Carga sus datos y luego SageMaker Ground Truth Plus crea y gestiona los flujos de trabajo de etiquetado de datos y la mano de obra en su nombre.Amazon SageMaker Ground Truth
Si quiere la flexibilidad de crear y gestionar sus propios flujos de trabajo de etiquetado de datos y personal, puede usar SageMaker Ground Truth. SageMaker Ground Truth es un servicio de etiquetado de datos que facilita el etiquetado de datos y le da la opción de usar anotadores humanos a través de Amazon Mechanical Turk, proveedores de terceros o su propio personal privado.
También puede generar datos sintéticos etiquetados sin necesidad de recoger o etiquetar manualmente datos reales. SageMaker Ground Truth puede generar cientos de miles de imágenes sintéticas etiquetadas automáticamente en su nombre.
Cómo funciona
-
Etiquetar datos con SageMaker Ground Truth Plus
-
Etiquetado de datos con SageMaker Ground Truth Plus
-
Generar datos sintéticos etiquetados
-
Comparación de características
-
Etiquetar datos con SageMaker Ground Truth Plus
-
Amazon SageMaker Ground Truth Plus ayuda a crear conjuntos de datos de formación de alta calidad sin tener que crear aplicaciones de etiquetado o administrar el personal de etiquetado por su cuenta.
-
Etiquetado de datos con SageMaker Ground Truth Plus
-
Amazon SageMaker Ground Truth ayuda a crear sus propios flujos de trabajo de etiquetado de datos y a administrar el personal de etiquetado de datos.
-
Generar datos sintéticos etiquetados
-
Amazon SageMaker Ground Truth le ayuda a generar datos sintéticos etiquetados.
-
Comparación de características
-
Categoría Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus Flujos de trabajo de etiquetado de datos Flujos de trabajo personalizados o más de 30 integrados para texto, imágenes, video y nubes de puntos 3D. Administra sus flujos de trabajo de etiquetado de datos y la calidad del etiquetado de datos Flujos de trabajo personalizados o más de 30 integrados para texto, imágenes, video y nubes de puntos 3D. AWS administra sus flujos de trabajo de etiquetado de datos y la calidad del etiquetado de datos Usuario Científicos de datos e ingenieros en machine learning (ML) Científicos de datos, ingenieros en machine learning (ML), gerentes de operaciones de datos y gerentes de programa Personal Usted elige: proveedores de terceros, Amazon Mechanical Turk o su propio personal privado Personal experto que puede ayudarle a cumplir con los requisitos de seguridad de datos, privacidad y cumplimiento de la normativa Técnicas de etiquetado de ML Aprendizaje activo Aprendizaje activo, preetiquetado y validación automática Generación de datos sintéticos Admitido Admitido
Beneficios
Mejorar la calidad de los conjuntos de datos de entrenamiento
Las ofertas de etiquetado de datos de Amazon SageMaker proporcionan técnicas de etiquetado de ML que son menos propensas a los errores manuales, incluida la generación de datos sintéticos, y ayudan a mejorar la calidad de los conjuntos de datos de entrenamiento. Amazon SageMaker Ground Truth Plus cuenta con un flujo de trabajo de etiquetado de varios pasos que incluye modelos de ML para el preetiquetado, la validación automática del etiquetado humano para detectar errores y etiquetas de baja calidad, y características de etiquetado de asistencia (por ejemplo, ajuste de cubo 3D, predicción de siguiente en el etiquetado de video y herramientas de autosegmentación). Si administra sus propios flujos de trabajo de etiquetado de datos, SageMaker Ground Truth proporciona características de etiquetado automático como la segmentación automática, el quiebre de cuboides 3D y la fusión de sensores con cuadros de video en 2D. Además, SageMaker Ground Truth proporciona la función de etiquetado de datos automático que utiliza el aprendizaje activo y solo envía datos etiquetados a los usuarios humanos si el modelo no puede etiquetarlos de manera segura.
Elegir el personal de etiquetado de datos
Con las ofertas de etiquetado de datos de Amazon SageMaker, tiene dos opciones para etiquetar datos. En primer lugar, con SageMaker Ground Truth Plus, personal experto y formado en tareas de ML etiqueta sus datos de acuerdo con sus requisitos de calidad y tiempo de entrega. En segundo lugar, con SageMaker Ground Truth, puede crear y gestionar sus flujos de trabajo de etiquetado de datos. Tiene opciones para trabajar con etiquetadores dentro y fuera de su organización. Por ejemplo, puede enviar trabajos de etiquetado a sus propios etiquetadores, o puede acceder a un personal de más de 500 000 contratistas independientes que ya hacen tareas relacionadas con ML a través de Amazon Mechanical Turk. Si los datos requieren confidencialidad o habilidades especiales, también puede usar proveedores preseleccionados por AWS en cuanto a calidad y procedimientos de seguridad. Si tiene que acceder a datos sintéticos para que sus conjuntos de datos de entrenamiento sean más completos para entrenar modelos de ML, los artistas digitales de AWS usan activos e imágenes proporcionados por el cliente para generar datos sintéticos que se etiquetan automáticamente en su nombre.
Aumentar la visibilidad de las operaciones de etiquetado de datos
Las ofertas de etiquetado de datos de Amazon SageMaker permiten ganar transparencia en las operaciones de etiquetado de datos y en la administración de la calidad para que pueda verificar que se cumplen las exigencias en materia de calidad. SageMaker Ground Truth Plus proporciona paneles interactivos e interfaces de usuario, para monitorear el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados.
Recibir datos etiquetados de alta calidad de forma rápida
Con las ofertas de etiquetado de datos de Amazon SageMaker, puede recibir datos etiquetados de alta calidad de forma rápida. Con SageMaker Ground Truth Plus, carga sus datos en Amazon S3 junto con los requisitos de seguridad, privacidad y cumplimiento. Posteriormente, los expertos de AWS configurarán el flujo de trabajo de etiquetado de datos y una plantilla de expertos completará sus tareas de etiquetado. Si necesita acceso a datos sintéticos, especifique sus requisitos de imagen o proporcione activos 3D e imágenes de referencia para que SageMaker Ground Truth pueda generar datos sintéticos etiquetados de gran precisión para el entrenamiento de modelos de ML.

Página de preguntas frecuentes sobre el etiquetado de datos de Amazon SageMaker.

Obtenga acceso instantáneo a la capa gratuita de AWS.

Comience a crear con el etiquetado de datos de Amazon SageMaker en la consola de administración de AWS.
Novedades
- Fecha (de más reciente a más antigua)