Aspectos generales

P: ¿Qué es Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth le permite etiquetar de manera fácil, precisa y eficaz los conjuntos de datos necesarios para entrenar a los sistemas de aprendizaje automático. SageMaker Ground Truth puede etiquetar automáticamente una parte del conjunto de datos de acuerdo con las etiquetas realizadas de forma manual por el etiquetado humano. Puede elegir utilizar personal con participación colaborativa de Amazon Mechanical Turk de más de 500 000 etiquetadores, sus propios empleados o uno de los proveedores externos preseleccionados de Amazon que figuran en AWS Marketplace. SageMaker Ground Truth utiliza algoritmos innovadores y técnicas de experiencia de usuario (UX) para mejorar la precisión del etiquetado realizado por personas. Con el tiempo, el modelo mejora progresivamente al aprender de manera continua de las etiquetas creadas por personas, para aumentar el etiquetado automático.

P: ¿Qué es el etiquetado automatizado de datos?

R: El etiquetado automatizado de datos es el etiquetado de datos que se realiza mediante el aprendizaje automático. Amazon SageMaker Ground Truth primero seleccionará una muestra aleatoria de datos y la enviará a personas para su etiquetado. Luego, los resultados se utilizan para entrenar un modelo de etiquetado que intenta etiquetar automáticamente una nueva muestra de datos sin procesar. Las etiquetas se confirman cuando el modelo puede etiquetar los datos con una puntuación de confianza que cumple con un umbral elevado o lo supera. Cuando la puntuación de confianza no alcanza dicho umbral, los datos se envían a etiquetadores humanos. Algunos de los datos etiquetados por personas se utilizan a fin de generar un nuevo conjunto de datos de entrenamiento para el modelo de etiquetado, y el modelo se vuelve a entrenar automáticamente para mejorar su precisión. Este proceso se repite con cada muestra de datos sin procesar por etiquetarse. Con cada iteración, el modelo de etiquetado se torna más capaz de etiquetar automáticamente datos sin procesar y así, se envían menos datos a las personas.

Uso de Amazon SageMaker Ground Truth

P: ¿Por qué debería utilizar Amazon SageMaker Ground Truth?

R: Antes de construir, entrenar y desplegar modelos de aprendizaje automático, usted necesita datos. Los modelos exitosos se construyen sobre la base de datos de entrenamiento de alta calidad, y la recopilación y el etiquetado de los conjuntos de datos de entrenamiento implica mucho tiempo y esfuerzo. Para construir los conjuntos de datos de entrenamiento, los etiquetadores humanos deben evaluar una gran cantidad de imágenes u otros tipos de datos, y luego identificar y etiquetar objetos particulares en cada tipo de datos. Estas tareas de etiquetado se distribuyen entre varios etiquetadores humanos, lo que agrega gastos generales y costos significativos. Si hay etiquetas incorrectas, el sistema aprenderá de la información incorrecta y realizará predicciones inexactas.

Amazon SageMaker Ground Truth resuelve este problema al facilitar el etiquetado eficaz y altamente preciso de datos mediante los datos almacenados en Amazon S3, así como una combinación de etiquetado automatizado de datos y etiquetado realizado por personas.

P: ¿Cómo comienzo a utilizar Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth ofrece una experiencia administrada en la que es posible configurar un trabajo completo de etiquetado de datos en pocos pasos. Para utilizar Amazon SageMaker Ground Truth, inicie sesión en la consola de administración de AWS y navegue hasta la consola de SageMaker. Una vez allí, seleccione Labeling jobs (Trabajos de etiquetado) en Ground Truth. Aquí, podrá crear un trabajo de etiquetado. Primero, como parte del flujo de creación de trabajos de etiquetado, usted debe proporcionar un puntero al bucket S3 que contiene el conjunto de datos que quiere etiquetar. Ground Truth ofrece plantillas para tareas comunes de etiquetado en las que solo necesita hacer clic en algunas opciones y proporcionar instrucciones mínimas de etiquetado de datos. La otra alternativa es crear su propia plantilla personalizada. El último paso para crear un trabajo de etiquetado consta en elegir una de las tres opciones de personal humano: (1) personal público con participación colectiva, (2) un conjunto seleccionado de proveedores que proporcionan servicios de etiquetado de datos y (3) empleados propios. También tiene la opción de habilitar el etiquetado automatizado de datos.

P:  ¿Cómo se administran mis conjuntos de datos de entrenamiento con Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth administra los metadatos, las etiquetas asociadas y una taxonomía de etiquetas y conjuntos de datos. Puede utilizar fácilmente el SDK de AWS mediante un bloc de notas de SageMaker o la consola de Ground Truth dentro de la consola de SageMaker para consultar y administrar sus conjuntos de datos y etiquetas. Consulte la documentación de Amazon SageMaker Ground Truth para obtener más información.

P:  ¿Cómo ayuda Amazon SageMaker Ground Truth a aumentar la precisión de mis conjuntos de datos de entrenamiento?

R: Amazon SageMaker Ground Truth ofrece las siguientes características para ayudar a los clientes a aumentar la precisión del etiquetado de datos realizado por personas:

(a) Consolidación de anotaciones: esto contrarresta el error/sesgo de trabajadores individuales al enviar cada objeto de datos a varios trabajadores y, luego, consolidar sus respuestas (llamadas “anotaciones”) en una sola etiqueta. Luego, toma las anotaciones y las compara mediante un algoritmo de consolidación de anotaciones. Primero, este algoritmo detecta las anotaciones de valores atípicos que no se tienen en cuenta. Luego, realiza una consolidación ponderada de las anotaciones y asigna mayores ponderaciones a anotaciones más confiables. El resultado es una etiqueta única para cada objeto.

(b) Prácticas recomendadas de la interfaz de anotación: estas son características de las interfaces de anotación que permiten a los trabajadores realizar sus tareas con mayor precisión. Los empleados son propensos a errores y sesgos, y las interfaces bien diseñadas mejoran su precisión. Una práctica recomendada es mostrar instrucciones breves junto con ejemplos de etiquetas correctas e incorrectas en un panel lateral fijo. Otra práctica recomendada es oscurecer el área fuera del cuadro delimitador cuando los trabajadores dibujan el cuadro delimitador en una imagen.

P:  ¿Cómo garantiza Amazon SageMaker Ground Truth la seguridad y protección de mis datos?

R: De manera predeterminada, Amazon SageMaker Ground Truth cifra sus datos en reposo y en tránsito. Además, el acceso a sus datos se puede controlar con AWS Identity and Access Management (IAM). Ground Truth no almacena ni copia sus datos fuera de su entorno de AWS, y estos permanecen bajo su control. Además, Ground Truth es compatible con estándares de conformidad, tales como el Reglamento General de Protección de Datos (GDPR), y proporciona capacidades exhaustivas de registro y auditoría mediante Amazon CloudWatch y Amazon CloudTrail. Consulte la documentación de Amazon SageMaker Ground Truth para obtener más información.  

P:   ¿Cómo puedo acceder al personal humano mediante Amazon SageMaker Ground Truth?

R: En SageMaker Ground Truth, puede elegir cualquiera de las tres opciones de personal: (1) personal público con participación colectiva mediante Amazon Mechanical Turk; (2) proveedores externos disponibles mediante AWS Marketplace; y (3) empleados propios. Consulte la documentación de Amazon SageMaker Ground Truth para obtener más información.  

Precios y disponibilidad

P: ¿Cuánto cuesta Amazon SageMaker Ground Truth?

R: Para obtener información actualizada sobre los precios, consulte la página de precios de SageMaker Ground Truth.

P: ¿En qué regiones de AWS se encuentra disponible Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth está actualmente disponible en las regiones de AWS como el Norte de Virginia, Ohio, Oregón, Irlanda y Tokio.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Más información sobre los precios de Amazon SageMaker Ground Truth

Comience a usar Amazon SageMaker Ground Truth sin compromisos iniciales o contratos a largo plazo. Para obtener más información, consulte la página de precios de Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Inscríbase para obtener una cuenta gratuita

Obtenga acceso automáticamente a la capa gratuita de AWS. 

Inscribirse 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Empiece a crear en la consola

Comience a crear con Amazon SageMaker Ground Truth en la consola de administración de AWS.

Iniciar sesión