Aspectos generales

P: ¿Qué es Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth le permite etiquetar de manera fácil, precisa y eficaz los conjuntos de datos necesarios para entrenar a los sistemas de aprendizaje automático. SageMaker Ground Truth puede etiquetar automáticamente una parte del conjunto de datos de acuerdo con las etiquetas realizadas de forma manual por el etiquetado humano. Puede elegir utilizar personal con participación colaborativa de Amazon Mechanical Turk de más de 500 000 etiquetadores, sus propios empleados o uno de los proveedores de servicio de etiquetado de datos de terceros que figuran en AWS Marketplace preseleccionados por Amazon. SageMaker Ground Truth utiliza algoritmos innovadores y técnicas de experiencia de usuario (UX) para mejorar la precisión del etiquetado realizado por personas. Con el tiempo, el modelo mejora progresivamente al aprender de manera continua de las etiquetas creadas por personas, para aumentar el etiquetado automático.

P: ¿Qué es el etiquetado automatizado de datos?

R: El etiquetado automatizado de datos es el etiquetado de datos que se realiza mediante el aprendizaje automático. Amazon SageMaker Ground Truth primero seleccionará una muestra aleatoria de datos y la enviará a personas para su etiquetado. Luego, los resultados se utilizan para entrenar un modelo de etiquetado que intenta etiquetar automáticamente una nueva muestra de datos sin procesar. Las etiquetas se confirman cuando el modelo puede etiquetar los datos con una puntuación de confianza que cumple con un umbral elevado o lo supera. Cuando la puntuación de confianza no alcanza dicho umbral, los datos se envían a etiquetadores humanos. Algunos de los datos etiquetados por personas se utilizan a fin de generar un nuevo conjunto de datos de entrenamiento para el modelo de etiquetado, y el modelo se vuelve a entrenar automáticamente para mejorar su precisión. Este proceso se repite con cada muestra de datos sin procesar por etiquetarse. Con cada iteración, el modelo de etiquetado se torna más capaz de etiquetar automáticamente datos sin procesar y así, se envían menos datos a las personas.

Uso de Amazon SageMaker Ground Truth

P: ¿Por qué debería utilizar Amazon SageMaker Ground Truth?

R: Antes de construir, entrenar y desplegar modelos de aprendizaje automático, usted necesita datos. Los modelos exitosos se construyen sobre la base de datos de entrenamiento de alta calidad, y la recopilación y el etiquetado de los conjuntos de datos de entrenamiento implica mucho tiempo y esfuerzo. Para construir los conjuntos de datos de entrenamiento, los etiquetadores humanos deben evaluar una gran cantidad de imágenes u otros tipos de datos, y luego identificar y etiquetar objetos particulares en cada tipo de datos. Estas tareas de etiquetado se distribuyen entre varios etiquetadores humanos, lo que agrega gastos generales y costos significativos. Si hay etiquetas incorrectas, el sistema aprenderá de la información incorrecta y realizará predicciones inexactas.

Amazon SageMaker Ground Truth resuelve este problema al facilitar el etiquetado eficaz y altamente preciso de datos mediante los datos almacenados en Amazon S3, así como una combinación de etiquetado automatizado de datos y etiquetado realizado por personas.

P: ¿Cómo comienzo a utilizar Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth ofrece una experiencia administrada en la que es posible configurar un trabajo completo de etiquetado de datos en pocos pasos. Para utilizar Amazon SageMaker Ground Truth, inicie sesión en la consola de administración de AWS y navegue hasta la consola de SageMaker. Una vez allí, seleccione Labeling jobs (Trabajos de etiquetado) en Ground Truth. Aquí, podrá crear un trabajo de etiquetado. Primero, como parte del flujo de creación de trabajos de etiquetado, usted debe proporcionar un puntero al bucket S3 que contiene el conjunto de datos que quiere etiquetar. Ground Truth ofrece plantillas para tareas comunes de etiquetado en las que solo necesita hacer clic en algunas opciones y proporcionar instrucciones mínimas de etiquetado de sus datos. La otra alternativa es crear su propia plantilla personalizada. El último paso para crear un trabajo de etiquetado consta en elegir una de las tres opciones de personal humano: (1) personal público con participación colectiva, (2) un conjunto seleccionado de proveedores de servicios de etiquetado de datos de terceros o (3) empleados propios. También tiene la opción de habilitar el etiquetado automatizado de datos.

P:  ¿Cómo se administran mis conjuntos de datos de entrenamiento con Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth administra los metadatos, las etiquetas asociadas y una taxonomía de etiquetas y conjuntos de datos. Puede utilizar fácilmente el SDK de AWS mediante un bloc de notas de SageMaker o la consola de Ground Truth dentro de la consola de SageMaker para consultar y administrar sus conjuntos de datos y etiquetas. Consulte la documentación de Amazon SageMaker Ground Truth para obtener más información.

P:  ¿Cómo ayuda Amazon SageMaker Ground Truth a aumentar la precisión de mis conjuntos de datos de entrenamiento?

R: Amazon SageMaker Ground Truth ofrece las siguientes características para ayudarlo a aumentar la precisión del etiquetado de datos realizado por personas:

(a) Consolidación de anotaciones: esto contrarresta el error/sesgo de trabajadores individuales al enviar cada objeto de datos a varios trabajadores y, luego, consolidar sus respuestas (llamadas “anotaciones”) en una sola etiqueta. Luego, toma las anotaciones y las compara mediante un algoritmo de consolidación de anotaciones. Primero, este algoritmo detecta las anotaciones de valores atípicos que no se tienen en cuenta. Luego, realiza una consolidación ponderada de las anotaciones y asigna mayores ponderaciones a anotaciones más confiables. El resultado es una etiqueta única para cada objeto.

(b) Prácticas recomendadas de la interfaz de anotación: estas son características de las interfaces de anotación que permiten a los trabajadores realizar sus tareas con mayor precisión. Los empleados son propensos a errores y sesgos, y las interfaces bien diseñadas mejoran su precisión. Una práctica recomendada es mostrar instrucciones breves junto con ejemplos de etiquetas correctas e incorrectas en un panel lateral fijo. Otra práctica recomendada es oscurecer el área fuera del cuadro delimitador cuando los trabajadores dibujan el cuadro delimitador en una imagen.

P:  ¿Cómo garantiza Amazon SageMaker Ground Truth la seguridad y protección de mis datos?

R: De manera predeterminada, Amazon SageMaker Ground Truth cifra sus datos en reposo y en tránsito. Además, el acceso a sus datos se puede controlar con AWS Identity and Access Management (IAM). Ground Truth no almacena ni copia sus datos fuera de su entorno de AWS, y estos permanecen bajo su control. Además, Ground Truth es compatible con estándares de conformidad, tales como el Reglamento General de Protección de Datos (GDPR), y proporciona capacidades exhaustivas de registro y auditoría mediante Amazon CloudWatch y Amazon CloudTrail. Consulte la documentación de Amazon SageMaker Ground Truth para obtener más información.

P:   ¿Cómo puedo acceder al personal humano mediante Amazon SageMaker Ground Truth?

R: En SageMaker Ground Truth, puede elegir cualquiera de las tres opciones de personal: (1) personal público con participación colectiva mediante Amazon Mechanical Turk, (2) proveedores de servicio de etiquetado de datos de terceros que están disponibles mediante AWS Marketplace y (3) empleados propios. Consulte la documentación de Amazon SageMaker Ground Truth para obtener más información.  

P: ¿Puede procesar datos confidenciales el proveedor de servicios de etiquetado de datos de Amazon SageMaker Ground Truth?

R:  Sí, el proveedor de servicios de etiquetado de datos de Amazon SageMaker Ground Truth puede procesar datos confidenciales. El acuerdo de servicios estándar entre los clientes de AWS y el proveedor externo de servicios de etiquetado de datos contiene protecciones básicas de la información confidencial. Revise esos términos antes de compartir cualquier tipo de información confidencial con el proveedor de servicios. Los términos se encuentran en la página de anuncio del proveedor de servicios en AWS Marketplace.

P:   ¿Cuáles son los estándares de seguridad que los proveedores de servicios de etiquetado de datos de Amazon SageMaker Ground Truth deben cumplir?

R:  Los proveedores de servicios de etiquetado de datos deben cumplir el Service Organization Control 2 (SOC 2, Control de Organización de Servicio 2) y obtener su certificación cada año. El informe SOC 2 es una descripción del entorno de control del proveedor de servicios basada en los criterios de los servicios de confianza del American Institute of Certified Public Accountants (AICPA, Instituto Estadounidense de Contadores Públicos Certificados). Los criterios mencionados son la seguridad, la disponibilidad, la integridad de procesamiento, la confidencialidad y la privacidad.

Además del SOC 2, los proveedores de servicios tienen la obligación de llevar a cabo estos controles de seguridad adicionales para mantener la seguridad de los datos del cliente.

Controles de tecnología:
Los proveedores de servicios deben utilizar el software apropiado para bloquear cualquier intento de descarga o copia de archivos o datos de sus sistemas, y evitar el acceso no autorizado a ellos. También se exige que los proveedores de servicios prohíban que su personal almacene o copie los datos relacionados con tareas de los clientes.

Controles de seguridad de red:
Es obligatorio que la red de los proveedores de servicios esté diseñada para evitar el acceso remoto a los datos relacionados con sus tareas. Además, se bloquea el software de uso compartido de archivos entre pares en la red del proveedor y se debe diseñar el firewall de forma que brinde una alta disponibilidad.

Controles de empleados:
Los proveedores de servicios deben garantizar la existencia de acuerdos de confidencialidad (NDA) con sus empleados. Además, deben adoptar políticas estrictas para evitar que se filtre información y que los empleados la transfieran mediante papel, USB, teléfonos móviles o cualquier otro medio.

Controles de acceso físico:
Los proveedores de servicios deben mantener medidas de control del acceso físico para evitar el acceso no autorizado a su sitio de producción. Entre ellas, se puede incluir un torniquete con autenticación biométrica, la identificación de los empleados con insignias, etc.

P:   ¿Cómo se asegura AWS de que los proveedores de servicios cumplen con estos estándares de seguridad?

R:  AWS solicita que los proveedores de servicios proporcionen sus informes de certificación de SOC 2 antes de incluirlos en Marketplace y verifica los siguientes aspectos:

Autenticidad (en el caso de que el auditor del proveedor de servicios cuente con la certificación del AICPA)

Periodo del informe (fecha de validez de la certificación de SOC 2)

Sitio de producción (el lugar físico donde el personal del proveedor de servicios ejecutará las tareas de etiquetado de Amazon SageMaker Ground Truth)

P:   ¿Con qué frecuencia se verifican los estándares de seguridad de los proveedores de servicios?

R: Los estándares de seguridad de cada proveedor de servicio se verifican anualmente para asegurar que cumplan con los requisitos obligatorios.

P:   ¿Existe alguna excepción a la verificación por parte de AWS?

R:  No. Si el proveedor de servicios no cumple los estándares de seguridad, se lo eliminará de la lista de AWS Marketplace. La eliminación del proveedor de la lista se completará en 24 horas, y se notificará a todos los clientes activos por correo electrónico.

P:   En caso de que un proveedor de servicios ofrezca el etiquetado de datos en varios sitios de producción, ¿deben verificarse todos los sitios?

R:  Sí, todos los sitios deben cumplir los estándares de seguridad obligatorios.

P:   ¿Qué sucede si hay una filtración de datos en el sitio de producción del proveedor de servicios?

R:  El proveedor de servicios debe informar a AWS y a los clientes afectados dentro de las 24 horas de detección de cualquier caso real o sospecha de eventos no autorizados de acceso, pérdida, daño, recopilación, adquisición, uso, transmisión o divulgación de la información del cliente. El proveedor de servicios solucionará cada incidente de seguridad de inmediato y brindará los detalles de la investigación interna por escrito a AWS y a los clientes afectados.

Uso de proveedores de servicio de etiquetado de datos de terceros

P: ¿Puede procesar datos confidenciales el proveedor de servicios de etiquetado de datos de Amazon SageMaker Ground Truth?

R:  Sí, el proveedor de servicios de etiquetado de datos de Amazon SageMaker Ground Truth puede procesar datos confidenciales. El acuerdo de servicios estándar entre los clientes de AWS y el proveedor externo de servicios de etiquetado de datos contiene protecciones básicas de la información confidencial. Revise esos términos antes de compartir cualquier tipo de información confidencial con el proveedor de servicios. Los términos se encuentran en la página de anuncio del proveedor de servicios en AWS Marketplace.

P:   ¿Cuáles son los estándares de seguridad que los proveedores de servicios de etiquetado de datos de Amazon SageMaker Ground Truth deben cumplir?

R:  Los proveedores de servicios de etiquetado de datos deben cumplir el Service Organization Control 2 (SOC 2, Control de Organización de Servicio 2) y obtener su certificación cada año. El informe SOC 2 es una descripción del entorno de control del proveedor de servicios basada en los criterios de los servicios de confianza del American Institute of Certified Public Accountants (AICPA, Instituto Estadounidense de Contadores Públicos Certificados). Los criterios mencionados son la seguridad, la disponibilidad, la integridad de procesamiento, la confidencialidad y la privacidad.

Además del SOC 2, los proveedores de servicios tienen la obligación de llevar a cabo estos controles de seguridad adicionales para mantener la seguridad de los datos del cliente.

Controles de tecnología:
Los proveedores de servicios deben utilizar el software apropiado para bloquear cualquier intento de descarga o copia de archivos o datos de sus sistemas, y evitar el acceso no autorizado a ellos. También se exige que los proveedores de servicios prohíban que su personal almacene o copie los datos relacionados con tareas de los clientes.

Controles de seguridad de red:
Es obligatorio que la red de los proveedores de servicios esté diseñada para evitar el acceso remoto a los datos relacionados con tareas de los clientes. Además, se bloquea el software de uso compartido de archivos entre pares en la red del proveedor y se debe diseñar el firewall de forma que brinde una alta disponibilidad.

Controles de empleados:
Los proveedores de servicios deben garantizar la existencia de acuerdos de confidencialidad (NDA) con sus empleados. Además, deben adoptar políticas estrictas para evitar que se filtre información y que los empleados la transfieran mediante papel, USB, teléfonos móviles o cualquier otro medio.

Controles de acceso físico:
Los proveedores de servicios deben mantener medidas de control del acceso físico para evitar el acceso no autorizado a su sitio de producción. Entre ellas, se puede incluir un torniquete con autenticación biométrica, la identificación de los empleados con insignias, etc.

P:   ¿Cómo se asegura AWS de que los proveedores de servicios cumplen con estos estándares de seguridad?

R:  AWS solicita que los proveedores de servicios proporcionen sus informes de certificación de SOC 2 antes de incluirlos en Marketplace y verifica los siguientes aspectos:

Autenticidad (en el caso de que el auditor del proveedor de servicios cuente con la certificación del AICPA)

Periodo del informe (fecha de validez de la certificación de SOC 2)

Sitio de producción (el lugar físico donde el personal del proveedor de servicios ejecutará las tareas de etiquetado de Amazon SageMaker Ground Truth)

P:   ¿Con qué frecuencia se verifican los estándares de seguridad de los proveedores de servicios?

R:  Cada año se verifica que los proveedores de servicios continúen cumpliendo los estándares de seguridad.

P:   ¿Existe alguna excepción a la verificación por parte de AWS?

R:  No. Si el proveedor de servicios no cumple los estándares de seguridad, se lo eliminará de la lista de AWS Marketplace. La eliminación del proveedor de la lista se completará en 24 horas, y se notificará a todos los clientes activos por correo electrónico.

P:   En caso de que un proveedor de servicios ofrezca el etiquetado de datos en varios sitios de producción, ¿deben verificarse todos los sitios?

R:  Sí, todos los sitios deben cumplir los estándares de seguridad obligatorios.

P:   ¿Qué sucede si hay una filtración de datos en el sitio de producción del proveedor de servicios?

R:  El proveedor de servicios informará a AWS y a los clientes afectados dentro de las 24 horas de detección de cualquier caso real o sospecha de eventos no autorizados de acceso, pérdida, daño, recopilación, adquisición, uso, transmisión o divulgación de la información del cliente. El proveedor de servicios solucionará cada incidente de seguridad de inmediato y brindará los detalles de la investigación interna por escrito a AWS y a los clientes afectados.

Precios y disponibilidad

P: ¿Cuánto cuesta Amazon SageMaker Ground Truth?

R: Para obtener información actualizada sobre los precios, consulte la página de precios de SageMaker Ground Truth.

P: ¿En qué regiones de AWS se encuentra disponible Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth está actualmente disponible en las regiones de AWS como el Norte de Virginia, Ohio, Oregón, Irlanda, Tokio y Sídney.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Más información sobre los precios de Amazon SageMaker Ground Truth

Comience a usar Amazon SageMaker Ground Truth sin compromisos iniciales o contratos a largo plazo. Para obtener más información, consulte la página de precios de Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Inscríbase para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Empiece a crear en la consola

Comience a crear con Amazon SageMaker Ground Truth en la consola de administración de AWS.

Iniciar sesión