Amazon SageMaker Ground Truth Plus
Aspectos generales
P: ¿Qué es Amazon SageMaker Ground Truth Plus?
Amazon SageMaker Ground Truth Plus le permite crear fácilmente conjuntos de datos de entrenamiento de alta calidad sin tener que crear aplicaciones de etiquetado o administrar personal de etiquetado por su cuenta. Una vez que proporciona los datos junto con los requisitos de etiquetado, SageMaker Ground Truth Plus se encarga de configurar los flujos de trabajo de etiquetado de datos y de gestionarlos en su nombre, de acuerdo con sus requisitos. A partir de allí, el personal experto y formado en diversas tareas de machine learning (ML) se encarga del etiquetado de datos. Ground Truth Plus utiliza técnicas de machine learning (ML), como el aprendizaje activo, el preetiquetado y la validación automática. Esto aumenta la calidad del conjunto de datos de salida y disminuye los costos de etiquetado de datos. Ground Truth Plus proporciona transparencia de las operaciones de etiquetado de datos y administración de la calidad. Con él, puede revisar el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados. Ground Truth Plus puede utilizarse para diversos casos de uso, como la visión artificial, el procesamiento de lenguaje natural y el reconocimiento del habla.
P: ¿Por qué debería usar Amazon SageMaker Ground Truth Plus?
Para entrenar un modelo de machine learning (ML), los científicos de datos necesitan grandes conjuntos de datos etiquetados de alta calidad. A medida que crece la adopción del ML, aumentan las necesidades de etiquetado. Esto obliga a los científicos de datos a dedicar semanas a la creación de flujos de trabajo de etiquetado de datos y a la administración de personal de etiquetado de datos. Desafortunadamente, esto frena la innovación y aumenta los costos. Para garantizar que los científicos de datos puedan dedicar su tiempo a la creación, la formación y la implementación de modelos de ML, los científicos de datos suelen encargar a otros equipos internos, conformados por gerentes de operaciones de datos y gerentes de programas, la producción de conjuntos de datos de formación de alta calidad. Sin embargo, estos equipos por lo general no tienen acceso a las habilidades necesarias para entregar conjuntos de datos de formación de alta calidad, lo que afecta los resultados del machine learning (ML).
Amazon SageMaker Ground Truth Plus facilita a los científicos de datos, así como a los gerentes de empresas, por ejemplo, los gerentes de operaciones de datos y los gerentes de programas, la creación de conjuntos de datos de formación de alta calidad, ya que elimina el trabajo pesado e indiferenciado asociado a la creación de aplicaciones de etiquetado de datos y la administración del personal de etiquetado. Todo lo que tiene que hacer es proporcionar los datos junto con los requisitos de etiquetado para que Ground Truth Plus configure y administre el flujo de trabajo de etiquetado de datos en función de estos requisitos. A partir de ahí, personal experto y formado en diversas tareas de ML se encarga del etiquetado de datos. Para utilizar Ground Truth Plus no es necesario tener una gran experiencia en machine learning (ML) ni conocimientos sobre el diseño de flujos de trabajo y la administración de la calidad.
P: ¿Cómo comienzo a usar Amazon SageMaker Ground Truth Plus?
Para comenzar a utilizar Amazon SageMaker Ground Truth Plus, rellene el formulario de requisitos del proyecto. Nuestro departamento le contactará para discutir su proyecto de etiquetado de datos.
P: ¿Cómo ayuda Amazon SageMaker Ground Truth Plus a administrar los conjuntos de datos de entrenamiento?
Amazon SageMaker Ground Truth Plus proporciona una mayor transparencia en las operaciones de etiquetado de datos y en la gestión de la calidad. Por ejemplo, SageMaker Ground Truth Plus proporciona una vista de proyecto, que puede usar para supervisar el progreso del conjunto de datos de entrenamiento en diferentes proyectos. Además, un panel de métricas en tiempo real permite realizar un seguimiento detallado de las métricas del proyecto, incluido el rendimiento diario. SageMaker Ground Truth Plus también proporciona una interfaz de usuario que permite inspeccionar la calidad de las etiquetas y brindar una retroalimentación en tiempo real. Finalmente, con el modo streaming, puede lograr plazos de entrega de etiquetas el mismo día o en el lapso de una hora para ciertos tipos de cargas de trabajo.
P: ¿Cómo Amazon SageMaker Ground Truth Plus ayuda a aumentar la precisión de los conjuntos de datos de formación?
Ground Truth Plus utiliza una diversidad de técnicas para aumentar la precisión de los conjuntos de datos de formación:
- Técnicas de ML: Ground Truth Plus utiliza técnicas de machine learning (ML), incluido el aprendizaje activo, el preetiquetado y la validación automática, lo cual mejora la calidad del resultado del conjunto de datos y reduce los costos de etiquetado de datos. Un flujo de trabajo de etiquetado de varios pasos incluye modelos de ML para el aprendizaje activo que permiten a Ground Truth Plus reducir los costos al seleccionar qué elementos se van a etiquetar y en qué modelos de machine learning (ML) se van a preetiquetar los datos seleccionados para reducir el esfuerzo humano. Ground Truth Plus utiliza la validación automática para identificar potenciales errores que luego son enviados para pasar por una etapa adicional de revisión humana. Esto mejora significativamente la calidad de las etiquetas al identificar los errores humanos.
- Interfaz de etiquetado intuitivo: Ground Truth Plus utiliza características de etiquetado auxiliares como (1) quiebre, que quiebra un cuboide 3D imperfecto para cubrir con precisión el objeto que se encuentra alrededor. (2) Segmentación automática, que completa el esténcil de un objeto con tan solo unos clics en los cuatro puntos extremos.
Privacidad de datos
P: ¿Cómo garantiza Amazon SageMaker Ground Truth Plus la seguridad y protección de los datos?
De forma predeterminada, Amazon SageMaker Ground Truth Plus cifra los datos almacenados en un bucket de Amazon S3 en reposo y en tránsito. Además, el acceso a los datos se controla con AWS Identity and Access Management (IAM). Los datos se almacenan en una cuenta independiente de AWS y se crea un bucket de Amazon S3 para el proyecto. Amazon SageMaker Ground Truth Plus no almacena ni copia los datos fuera del entorno de AWS creado. AWS registra y audita todos los accesos a los datos mediante el registro de acceso de Amazon S3 y AWS CloudTrail.
P: ¿Quién tiene acceso al contenido que procesa y almacena Amazon SageMaker Ground Truth Plus?
Los empleados autorizados de AWS y el personal experto que etiquete sus datos tendrán acceso a su contenido procesado por Amazon SageMaker Ground Truth Plus. El personal experto que etiqueta los datos los revisa y los etiqueta mediante el portal seguro del empleado de SageMaker Ground Truth. El acceso mediante el portal del empleado permite a los empleados solo revisar y etiquetar los datos, pero no modificarlos ni eliminarlos. Su confianza, su privacidad y su seguridad son nuestra prioridad más importante. Implementamos técnicas apropiadas y controles físicos, que incluyen el cifrado en tránsito y en reposo, diseñados para prevenir el acceso no autorizado al contenido o su divulgación.
P: ¿Se almacenan las entradas de datos (imágenes, archivos de textos, videos, etc.) procesadas por Amazon SageMaker Ground Truth Plus? ¿Cómo las usa AWS?
Amazon SageMaker Ground Truth Plus almacena el contenido en bruto y procesado solo durante la duración de sus proyectos y eliminará el contenido asociado a su proyecto de etiquetado de datos si así lo solicita. Amazon SageMaker Ground Truth Plus usa el contenido exclusivamente para brindar y mantener el servicio. Amazon SageMaker Ground Truth Plus nunca utiliza el contenido o algún modelo formado de ese contenido para el beneficio de otros clientes.
P: ¿El contenido procesado por Amazon SageMaker Ground Truth Plus se traslada fuera de la región de AWS donde uso Amazon SageMaker Ground Truth Plus?
Cualquier contenido procesado por Amazon SageMaker Ground Truth Plus se cifra y se almacena en reposo en la región de AWS en la que está usando Amazon SageMaker Ground Truth Plus. A menos que especifique lo contrario en cualquier requisito de localización de datos acordado mutuamente a través de una declaración de trabajo, se puede acceder a su contenido fuera de la región de AWS en la que se almacena su contenido para llevar a cabo el servicio de etiquetado.
P: ¿Puedo solicitar la eliminación de datos (imágenes, archivos de textos, videos, etc.) almacenados por Amazon SageMaker Ground Truth Plus?
Sí. Para solicitar la eliminación de las entradas de datos sin procesar y procesados asociados a su proyecto de etiquetado de datos, contacte con AWS Support.
P: ¿Seguiré siendo el propietario del contenido que procesa y almacena Amazon SageMaker Ground Truth Plus?
Sí. Siempre retendrá la titularidad del contenido, que se usará únicamente con su consentimiento.
P: ¿Puedo procesar datos de información sanitaria protegida (PHI) con Amazon SageMaker Ground Truth Plus?
No. Actualmente, Amazon SageMaker Ground Truth Plus no es un servicio apto para HIPAA.
Personal
P: ¿Qué es un personal experto de Amazon SageMaker Ground Truth Plus?
Con Ground Truth Plus, el etiquetado lo realiza un personal altamente cualificado, diverso y elástico que está formado en tareas de machine learning (ML) y que puede satisfacer una amplia variedad de necesidades, incluidas la seguridad de datos, la privacidad y el cumplimiento. El personal está dividido en dos niveles. 1/ El personal de Amazon consta de empleados que Amazon emplea y administra, ya que Amazon es dueño de las operaciones, la calidad y los SLA de los plazos de entrega en su nombre. 2/Personal del proveedor: consta de empleados provenientes de una lista seleccionada de proveedores terceros que se especializan en ofrecer servicios de etiquetado de datos y Amazon es dueño de la calidad y los SLA de los plazos de entrega en su nombre.
P: ¿Quién decide el nivel del personal que será utilizado para el proyecto de Amazon SageMaker Ground Truth Plus?
Usted puede decidir el tipo de personal que utilizará para un proyecto. A menos que nos dé instrucciones de utilizar un personal específico, podemos utilizar el personal de Amazon, el personal de los proveedores o una combinación de ambos para cumplir con la calidad, el plazo de entrega y los requisitos de seguridad del proyecto.
P: ¿Cuáles son los cambios que implementa el personal de los proveedores que tengo que conocer en relación con la COVID-19?
En vista de la COVID-19, algunos proveedores de servicios han implementado una política de trabajo a distancia para la salud y la seguridad de sus empleados.
P: ¿Qué estándares de seguridad debe cumplir el personal del proveedor?
Los proveedores de servicios están obligados a someterse anualmente a una certificación de cumplimiento SOC 2 o ISO 27001 por parte de un auditor externo independiente.
El informe SOC 2 es una descripción del entorno de control del proveedor de servicios según los Criterios de Servicios Fiduciarios del Instituto Americano de Contadores Públicos Certificados (AICPA): seguridad, disponibilidad, integridad del procesamiento, confidencialidad y privacidad.
La certificación ISO 27001 está basada en la International Organization for Standardization (ISO, Organización Internacional de Normalización) y la International Electrotechnical Commission (IEC, Comisión Electrotécnica Internacional), que detalla los requisitos para establecer, implementar, mantener y continuar con la mejora de los sistemas de administración de seguridad de la información (ISMS).
Además de obtener independientemente el SOC 2 o la ISO 27001, los proveedores de servicios deben tener controles adicionales de seguridad, que se describen a continuación, para ayudar a mantener seguros los datos.
Controles de tecnología:
Los proveedores de servicios deben utilizar el software apropiado para bloquear cualquier intento de descarga o copia de archivos o datos de los sistemas y evitar el acceso no autorizado a ellos. También se exige que los proveedores de servicios prohíban que su personal almacene o copie los datos relacionados con tareas de los clientes.
Controles de seguridad de red:
Es obligatorio que la red de los proveedores de servicios esté diseñada para evitar el acceso remoto a los datos relacionados con tareas de los clientes. Además, se bloquea el software de uso compartido de archivos entre pares en la red del proveedor y se debe diseñar el firewall de forma que brinde una alta disponibilidad.
Controles de empleados:
Los proveedores de servicios deben garantizar la existencia de acuerdos de confidencialidad (NDA) con los empleados. Además, deben adoptar políticas estrictas para evitar que se filtre información y que los empleados la transfieran mediante papel, USB, teléfonos móviles o cualquier otro medio.
Controles de acceso físico:
Los proveedores de servicios deben mantener medidas de control del acceso físico para evitar el acceso no autorizado al sitio de producción. Entre ellas, se pueden incluir torniquetes con autenticación biométrica, la identificación de los empleados mediante insignias, etc.
P: ¿Cómo ayuda AWS a que el personal de los proveedores cumpla con estos estándares de seguridad?
AWS solicita a los proveedores de servicios que presenten sus informes de certificación SOC 2 o ISO 27001 antes de formar parte de la plantilla de proveedores de Amazon SageMaker Ground Truth Plus. Los informes SOC de AWS y las certificaciones ISO no cubren el personal del proveedor.
Amazon SageMaker Ground Truth
Aspectos generales | Uso de Amazon SageMaker Ground Truth | Proveedores de servicio de etiquetado de datos de terceros | Precios y disponibilidad | Generación de datos sintéticos
Aspectos generales
P: ¿Qué es Amazon SageMaker Ground Truth?
Amazon SageMaker Ground Truth le facilita el etiquetado eficiente y preciso de los conjuntos de datos necesarios para el entrenamiento de sistemas de machine learning. SageMaker Ground Truth puede etiquetar automáticamente una parte del conjunto de datos en función de las etiquetas hechas manualmente por etiquetadores humanos. Puede elegir utilizar personal con participación colaborativa de Amazon Mechanical Turk de más de 500 000 etiquetadores, sus propios empleados o uno de los proveedores de servicio de etiquetado de datos de terceros que figuran en AWS Marketplace preseleccionados por Amazon. SageMaker Ground Truth utiliza algoritmos innovadores y técnicas de experiencia del usuario (UX) para mejorar la precisión del etiquetado realizado por personas. Con el tiempo, el modelo mejora progresivamente al aprender de manera continua de las etiquetas creadas por personas, para aumentar el etiquetado automático.
P: ¿Qué es el etiquetado automatizado de datos?
El etiquetado automatizado de datos es el etiquetado de datos mediante machine learning. Amazon SageMaker Ground Truth seleccionará primero una muestra aleatoria de datos y la enviará a los humanos para que la etiqueten. Luego, los resultados se utilizan para entrenar un modelo de etiquetado que intenta etiquetar automáticamente una nueva muestra de datos sin procesar. Las etiquetas se confirman cuando el modelo puede etiquetar los datos con una puntuación de confianza que cumple con un umbral elevado o lo supera. Cuando la puntuación de confianza no alcanza dicho umbral, los datos se envían a etiquetadores humanos. Algunos de los datos etiquetados por personas se utilizan a fin de generar un nuevo conjunto de datos de entrenamiento para el modelo de etiquetado, y el modelo se vuelve a entrenar automáticamente para mejorar su precisión. Este proceso se repite con cada muestra de datos sin procesar por etiquetarse. Con cada iteración, el modelo de etiquetado se torna más capaz de etiquetar automáticamente datos sin procesar y así, se envían menos datos a las personas.
Uso de Amazon SageMaker Ground Truth
P: ¿Por qué debería usar Amazon SageMaker Ground Truth?
Antes de crear, entrenar e implantar modelos de machine learning, se necesitan datos. Los modelos exitosos se construyen a partir de datos de entrenamiento de alta calidad, y la recopilación y etiquetado de los conjuntos de datos de entrenamiento implica mucho tiempo y esfuerzo. Para construir los conjuntos de datos de entrenamiento, los etiquetadores humanos deben evaluar una gran cantidad de imágenes u otros tipos de datos, y luego identificar y etiquetar objetos particulares en cada tipo de datos. Estas tareas de etiquetado se distribuyen entre varios etiquetadores humanos, lo que agrega gastos generales y costos significativos. Si hay etiquetas incorrectas, el sistema aprenderá de la información incorrecta y realizará predicciones inexactas.
Amazon SageMaker Ground Truth resuelve este problema al facilitar el etiquetado eficaz y altamente preciso de datos mediante los datos almacenados en Amazon S3, así como una combinación de etiquetado automatizado de datos y etiquetado realizado por personas.
P: ¿Cómo comienzo a utilizar Amazon SageMaker Ground Truth?
Amazon SageMaker Ground Truth ofrece una experiencia administrada en la que puede configurar todo un trabajo de etiquetado de datos con solo unos pocos pasos. Para comenzar con Amazon SageMaker Ground Truth, inicie sesión en la consola de administración de AWS y navegue hasta la consola de SageMaker. Una vez allí, seleccione Labeling jobs (Trabajos de etiquetado) en Ground Truth. Aquí, podrá crear un trabajo de etiquetado. Primero, como parte del flujo de creación de trabajos de etiquetado, usted debe proporcionar un puntero al bucket S3 que contiene el conjunto de datos que quiere etiquetar. Ground Truth ofrece plantillas para tareas comunes de etiquetado en las que solo necesita hacer clic en algunas opciones y proporcionar instrucciones mínimas de etiquetado de sus datos. La otra alternativa es crear su propia plantilla personalizada. El último paso para crear un trabajo de etiquetado consta en elegir una de las tres opciones de personal humano: (1) personal público con participación colectiva, (2) un conjunto seleccionado de proveedores de servicios de etiquetado de datos de terceros o (3) empleados propios. También tiene la opción de habilitar el etiquetado automatizado de datos.
P: ¿Cómo se administran mis conjuntos de datos de entrenamiento con Amazon SageMaker Ground Truth?
Amazon SageMaker Ground Truth administra los metadatos, las etiquetas asociadas y una taxonomía de sus etiquetas y conjuntos de datos. Puede usar fácilmente el AWS SDK a través de un bloc de notas de SageMaker o la consola de Ground Truth dentro de la consola de SageMaker para consultar y administrar sus conjuntos de datos y etiquetas. Para más información, consulte la documentación de Amazon SageMaker Ground Truth.
P: ¿Cómo ayuda Amazon SageMaker Ground Truth a aumentar la precisión de mis conjuntos de datos de entrenamiento?
Amazon SageMaker Ground Truth ofrece las siguientes características para ayudarle a aumentar la precisión del etiquetado de datos hecho por humanos:
(a) Consolidación de anotaciones: esto contrarresta el error o sesgo de trabajadores individuales al enviar cada objeto de datos a varios trabajadores y, luego, consolidar sus respuestas (llamadas “anotaciones”) en una sola etiqueta. Luego, toma las anotaciones y las compara mediante un algoritmo de consolidación de anotaciones. Primero, este algoritmo detecta las anotaciones de valores atípicos que no se tienen en cuenta. Luego, realiza una consolidación ponderada de las anotaciones y asigna mayores ponderaciones a anotaciones más confiables. El resultado es una etiqueta única para cada objeto.
(b) Prácticas recomendadas de la interfaz de anotación: estas son características de las interfaces de anotación que permiten a los trabajadores realizar sus tareas con mayor precisión. Los empleados son propensos a errores y sesgos, y las interfaces bien diseñadas mejoran su precisión. Una práctica recomendada es mostrar instrucciones breves junto con ejemplos de etiquetas correctas e incorrectas en un panel lateral fijo. Otra práctica recomendada es oscurecer el área fuera del cuadro delimitador cuando los trabajadores dibujan el cuadro delimitador en una imagen.
P: ¿Cómo garantiza Amazon SageMaker Ground Truth la seguridad y protección de mis datos?
De forma predeterminada, Amazon SageMaker Ground Truth cifra sus datos en reposo y en tránsito. Además, el acceso a sus datos se puede controlar con AWS Identity and Access Management (IAM). Ground Truth no almacena ni copia sus datos fuera de su entorno de AWS, y estos permanecen bajo su control. Además, Ground Truth es compatible con estándares de conformidad, tales como el Reglamento General de Protección de Datos (GDPR), y proporciona capacidades exhaustivas de registro y auditoría mediante Amazon CloudWatch y Amazon CloudTrail. Para más información, consulte la documentación de Amazon SageMaker Ground Truth.
P: ¿Cómo puedo acceder al personal humano mediante Amazon SageMaker Ground Truth?
Desde SageMaker Ground Truth, puede elegir cualquiera de las tres opciones de personal: (1) personal público de convocatoria abierta a través de Amazon Mechanical Turk, (2) proveedores de servicios de etiquetado de datos de terceros disponibles a través de AWS Marketplace; y (3) sus propios empleados. Para más información, consulte la documentación de Amazon SageMaker Ground Truth.
Uso de proveedores de servicio de etiquetado de datos de terceros
P: ¿Puede procesar datos confidenciales los proveedores de servicios de etiquetado de datos de Amazon SageMaker Ground Truth?
Sí, los proveedores de servicios de etiquetado de datos de Amazon SageMaker Ground Truth pueden procesar datos confidenciales. El acuerdo de servicio estándar entre los clientes de AWS y el proveedor de servicios de etiquetado de datos de terceros contiene algunas protecciones básicas para su información confidencial. Revise esos términos antes de compartir cualquier tipo de información confidencial con el proveedor de servicios. Los términos se encuentran en la página de anuncio del proveedor de servicios en AWS Marketplace.
P: Estoy colaborando con un proveedor de servicios externo a través de AWS Marketplace. ¿Cuáles son los cambios más importantes que están implementando los proveedores de servicio con motivo de la COVID-19?
A la luz de la rápida evolución del impacto de la COVID-19, algunos proveedores de servicios han implementado una política de trabajo a distancia para la salud y la seguridad de sus empleados temporalmente. Durante este tiempo, las normas de seguridad, incluido el cumplimiento de la norma SOC 2 y los controles de seguridad adicionales indicados en las siguientes preguntas frecuentes, pueden no ser aplicables a los proveedores de servicios afectados. Los proveedores de servicios afectados han actualizado sus listados de AWS Marketplace para reflejar esto y no procesarán los datos de los clientes de entornos de trabajo remotos sin el consentimiento explícito del cliente.
P: ¿Cuáles son los estándares de seguridad que los proveedores de servicios de etiquetado de datos de Amazon SageMaker Ground Truth deben cumplir?
Los proveedores de servicios de etiquetado de datos están obligados a pasar por el cumplimiento y la certificación SOC 2 anualmente. El informe SOC 2 es una descripción del entorno de control del proveedor de servicios según los Criterios de Servicios Fiduciarios del Instituto Americano de Contadores Públicos Certificados (AICPA): seguridad, disponibilidad, integridad del procesamiento, confidencialidad y privacidad.
Además del SOC 2, los proveedores de servicios tienen la obligación de llevar a cabo estos controles de seguridad adicionales para mantener la seguridad de los datos del cliente.
Controles de tecnología:
Los proveedores de servicios deben utilizar el software apropiado para bloquear cualquier intento de descarga o copia de archivos o datos de sus sistemas, y evitar el acceso no autorizado a ellos. También se exige que los proveedores de servicios prohíban que su personal almacene o copie los datos relacionados con tareas de los clientes.
Controles de seguridad de red:
Es obligatorio que la red de los proveedores de servicios esté diseñada para evitar el acceso remoto a los datos relacionados con tareas de los clientes. Además, se bloquea el software de uso compartido de archivos entre pares en la red del proveedor y se debe diseñar el firewall de forma que brinde una alta disponibilidad.
Controles de empleados:
Los proveedores de servicios deben garantizar la existencia de acuerdos de confidencialidad (NDA) con sus empleados. Además, deben adoptar políticas estrictas para evitar que se filtre información y que los empleados la transfieran mediante papel, USB, teléfonos móviles o cualquier otro medio.
Controles de acceso físico:
Los proveedores de servicios deben mantener medidas de control del acceso físico para evitar el acceso no autorizado a su sitio de producción. Entre ellas, se puede incluir un torniquete con autenticación biométrica, la identificación de los empleados con insignias, etc.
P: ¿Cómo se asegura AWS de que los proveedores de servicios cumplen con estos estándares de seguridad?
AWS solicita a los proveedores de servicios que presenten sus informes de certificación SOC 2 antes de figurar en el mercado y lo confirma:
Autenticidad (en el caso de que el auditor del proveedor de servicios cuente con la certificación del AICPA);
Periodo del informe (fecha de validez de la certificación de SOC 2)
Sitio de producción (el lugar físico donde el personal del proveedor de servicios ejecutará las tareas de etiquetado de Amazon SageMaker Ground Truth)
P: ¿Con qué frecuencia se verifican los estándares de seguridad de los proveedores de servicios?
Los estándares de seguridad de cada proveedor de servicios se revisan anualmente para garantizar que cumplen los requisitos obligatorios.
P: ¿Existe alguna excepción a la verificación por parte de AWS?
No. Si el proveedor de servicios no cumple con los estándares de seguridad, entonces su listado se eliminará de AWS Marketplace. La eliminación del listado se completará en el plazo de 24 horas y todos los clientes activos recibirán una notificación por correo electrónico.
P: En caso de que un proveedor de servicios ofrezca el etiquetado de datos en varios sitios de producción, ¿deben verificarse todos los sitios?
Sí, todos los sitios deben cumplir las normas de seguridad requeridas.
P: ¿Qué sucede si hay una filtración de datos en el sitio de producción del proveedor de servicios?
El proveedor de servicios informará a AWS y a los clientes afectados en el plazo de 24 horas de la detección de cualquier acceso, recopilación, adquisición, uso, transmisión, divulgación, corrupción o pérdida de información del cliente no autorizada, ya sea real o presunta. El proveedor de servicios solucionará cada incidente de seguridad con prontitud y proporcionará a AWS y a los clientes afectados detalles por escrito sobre la investigación interna.
Precios y disponibilidad
P: ¿Cuánto cuesta Amazon SageMaker Ground Truth?
Para obtener información actualizada sobre los precios, consulte la página de precios de SageMaker Ground Truth.
P: ¿En qué regiones de AWS se encuentra disponible Amazon SageMaker Ground Truth?
La tabla de regiones de AWS enumera todas las regiones de AWS en las que está disponible actualmente Amazon SageMaker Ground Truth.
Generación de datos sintéticos
P: ¿Cómo puedo generar datos sintéticos etiquetados?
Amazon SageMaker Ground Truth puede generar datos sintéticos etiquetados en su nombre. Puede especificar sus necesidades de imágenes sintéticas o proporcionar activos 3D e imágenes de referencia, como imágenes de diseño asistido por computación (CAD), y los artistas digitales de AWS crean imágenes desde cero o usan activos proporcionados por el cliente. Las imágenes generadas imitan la pose y la colocación de los objetos, incluyen variaciones del objeto o de la escena y, opcionalmente, agregan inclusiones específicas, como rasguños, abolladuras y otras alteraciones, lo que elimina el largo proceso de recopilación de datos o la necesidad de dañar las piezas para adquirir imágenes. SageMaker Ground Truth puede generar cientos de miles de imágenes sintéticas etiquetadas automáticamente con gran precisión.
P: ¿Por qué debería usar datos sintéticos etiquetados?
La obtención de datos para el entrenamiento de modelos de machine learning (ML) requiere mucho tiempo y esfuerzo. Para algunos tipos de datos, como los escenarios raros o muy variables, la recopilación de datos puede ser cara o incluso imposible. Por ejemplo, identificar los defectos de fabricación requiere una gran cantidad de imágenes. Además, los modelos de ML tienen que entrenarse para reconocer escenarios que no se dan con frecuencia, como los defectos raros. Para identificar los defectos raros, los modelos de ML necesitan imágenes de los defectos; sin embargo, como estos eventos ocurren con poca frecuencia, estos datos suelen crearse manualmente, lo que puede requerir el daño de piezas costosas. Por último, las imágenes deben etiquetarse manualmente.
Al usar SageMaker Ground Truth, puede generar datos sintéticos que se etiquetan automáticamente, lo que reduce el tiempo y el gasto que supone la recopilación y el etiquetado de los datos de entrenamiento. A continuación, puede usar datos sintéticos para entrenar modelos de ML en una amplia gama de casos de uso de la visión artificial, como la detección de objetos, anomalías y defectos.
P: ¿Cómo genera SageMaker Ground Truth datos sintéticos etiquetados?
Hay un proceso de tres pasos para generar datos sintéticos etiquetados. En primer lugar, proporciona activos en 3D, imágenes de referencia o requisitos de imagen. En segundo lugar, los artistas digitales convierten esas entradas en activos 3D, a los que agregan inclusiones como rasguños, abolladuras y texturas. En tercer lugar, SageMaker Ground Truth genera imágenes sintéticas y las etiqueta automáticamente.
P: ¿Puedo usar SageMaker Ground Truth para generar datos sintéticos etiquetados si no tengo imágenes o activos 3D?
Sí, existe una biblioteca de activos 3D de más de 1 millón de objetos que puede usarse para apoyar la creación de datos sintéticos en su nombre. También puede usar un pequeño conjunto de imágenes preetiquetadas para crear nuevos conjuntos de datos sintéticos. Si tiene imágenes de fondo o ejemplos de los datos que necesita, eso puede agilizar la creación de datos sintéticos de gran precisión.

Comience a utilizar el etiquetado de datos de Amazon SageMaker sin compromisos iniciales ni contratos a largo plazo.

Obtenga acceso instantáneo a la capa gratuita de AWS.

Comience a crear con el etiquetado de datos de Amazon SageMaker en la consola de administración de AWS.