Amazon SageMaker Ground Truth Plus

Personal experto

Con Amazon SageMaker Ground Truth Plus, el etiquetado lo realiza personal experto formado en tareas de machine learning (ML) que pueden ayudar a cumplir con los objetivos de seguridad y privacidad de los datos y las exigencias de cumplimiento. Por ejemplo, si necesita personas capacitadas en el etiquetado de archivos de audio, puede especificar esta exigencia en las directivas que proporciona a SageMaker Ground Truth Plus y el servicio seleccionará automáticamente etiquetadores que cuenten con esas capacidades.

Administración del etiquetado de datos de extremo a extremo

Con Amazon SageMaker Ground Truth Plus puede crear fácilmente conjuntos de datos de formación de alta calidad sin tener que crear aplicaciones de etiquetado o administrar el personal de etiquetado por su cuenta. Puede cargar datos junto con las exigencias de etiquetado en Amazon S3. Una vez que cargue los datos, SageMaker Ground Truth Plus se encarga de la configuración de los flujos de trabajo del etiquetado de datos y trabaja con ellos.

Técnicas de etiquetado de machine learning (ML)

Amazon SageMaker Ground Truth Plus utiliza técnicas de machine learning (ML), incluido el aprendizaje activo, el preetiquetado y la validación automática, lo cual aumenta la calidad del resultado del conjunto de datos y reduce los costos del etiquetado de datos. Un flujo de trabajo de etiquetado de varios pasos incluye modelos de machine learning (ML) para el aprendizaje activo que permiten a Ground Truth Plus reducir los costos al seleccionar cuáles elementos (puede ser una imagen, una grabación de audio, una sección de un texto, etc.) se van a etiquetar y cuáles modelos de machine learning (ML) van a preetiquetar los datos seleccionados para reducir el esfuerzo humano. Ground Truth Plus utiliza la validación automática para identificar potenciales errores que luego son enviados para pasar por una etapa adicional de revisión humana. Esto mejora significativamente la calidad de las etiquetas al identificar los errores humanos. Además, Ground Truth Plus utiliza características de etiquetado auxiliares como “quiebre automático de cuboides 3D”, “predicción del contenido siguiente en el etiquetado de videos” y “segmentación automática” a través de una interfaz de usuario intuitiva a fin de reducir el tiempo necesario para realizar tareas de etiquetado de datos, al mismo tiempo que mejora la calidad.

Paneles interactivos

SageMaker Ground Truth Plus proporciona paneles interactivos e interfaces de usuario, para monitorear el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados.

Amazon SageMaker Ground Truth

Nubes de puntos en 3D

Las nubes de puntos en tres dimensiones (3D) son capturadas principalmente mediante dispositivos de detección de luz y rango (LIDAR) para generar una visualización 3D de un espacio físico en un punto único en el tiempo. SageMaker Ground Truth incluye flujos de trabajo de etiquetado integrados para sus datos de nube de puntos en 3D que incluyen la detección de objetos, el seguimiento de objetos y la segmentación semántica.

Detección de objetos

Con el flujo de trabajo de detección de objetos puede identificar y etiquetar objetos de su interés dentro de una nube de puntos en 3D. Por ejemplo, en un caso de uso de un vehículo autónomo, puede etiquetar vehículos, carriles y peatones con precisión.

Detección de objetos de Amazon SageMaker Ground Truth

Seguimiento de objetos

Con el flujo de trabajo de seguimiento de objetos puede controlar la trayectoria de objetos de su interés. Por ejemplo, un vehículo autónomo necesita controlar el movimiento de otros vehículos, carriles y peatones. Ground Truth permite controlar la trayectoria de estos objetos en una secuencia de datos de nube de puntos en 3D.

Seguimiento de objetos de Amazon SageMaker Ground Truth

Segmentación semántica

Con el flujo de trabajo de segmentación semántica, puede segmentar los puntos de una nube de puntos en 3D en categorías previamente especificadas. Por ejemplo, en el caso de los vehículos autónomos, Ground Truth podría categorizar la presencia de calles, follaje y estructuras.

Segmentación semántica de Amazon SageMaker Ground Truth

Video

SageMaker Ground Truth admite casos de uso de etiquetado de video común con flujos de trabajo incorporados, incluidos la detección de objetos de video, el seguimiento de objetos de video y la clasificación de videoclips.

Detección de objetos de video

Con el flujo de trabajo de detección de objetos de video, puede identificar objetos de su interés dentro de una secuencia de fotogramas. Por ejemplo, al crear un sistema de percepción para un vehículo autónomo, puede detectar otros vehículos en la escena cercano a este.

Detección de objetos de video de Amazon SageMaker Ground Truth

Seguimiento de objetos de video

Con el flujo de trabajo de seguimiento de objetos de video, puede seguir la trayectoria de objetos de su interés dentro de una secuencia de fotogramas. Por ejemplo, en el caso de uso de un evento deportivo, puede etiquetar a los jugadores mientras dure el juego.

Seguimiento de objetos de video de Amazon SageMaker Ground Truth

Clasificación de videoclip

Con el flujo de trabajo de clasificación de videoclip, puede clasificar un archivo de video en categorías especificadas anteriormente. Por ejemplo, puede seleccionar categorías especificadas anteriormente que describan mejor el video, como un evento deportivo o congestión del tráfico en una intersección muy transitada.

Clasificación de videoclips de Amazon SageMaker Ground Truth

Imágenes

SageMaker Ground Truth provee flujos de trabajo de etiquetado integrados para sus datos de imágenes que incluyen la clasificación de imágenes, la detección de objetos y la segmentación semántica.

Clasificación de imágenes

La clasificación de imágenes consiste en identificar una imagen en función de su representación en el mundo real. El proceso incluye la categorización de imágenes con un conjunto predefinido de etiquetas. La clasificación de imágenes es útil para los modelos de detección de escenas que deben considerar el contexto completo de la imagen. Por ejemplo, podemos crear un modelo de clasificación de imágenes para vehículos autónomos que detecte diferentes objetos reales, como otros vehículos, peatones, semáforos y señales de tránsito.

Clasificación de imágenes de Amazon SageMaker Ground Truth

Detección de objetos

Puede usar el flujo de trabajo de detección de objetos para identificar y etiquetar objetos de su interés (p. ej., vehículos, peatones, perros, gatos) en imágenes. La tarea de etiquetado consiste en dibujar un cuadro delimitador, un cuadrado de dos dimensiones (2D), alrededor de los objetos de interés dentro de una imagen. Los modelos de visión artificial entrenados a partir de imágenes con cuadros delimitadores etiquetados aprenden que los píxeles ubicados dentro del cuadro corresponden al objeto especificado.

Detección de objetos de Amazon SageMaker Ground Truth

Segmentación semántica

Puede usar el flujo de trabajo de segmentación semántica para etiquetar las partes exactas de una imagen que corresponden a las etiquetas que su modelo necesita aprender. Provee datos de entrenamiento de alta precisión porque los píxeles individuales están etiquetados. Por ejemplo, la forma irregular de un automóvil se puede capturar con exactitud gracias a la segmentación semántica.

Segmentación semántica de Amazon SageMaker Ground Truth

Texto

SageMaker Ground Truth ofrece flujos de trabajo de etiquetado integrados para los datos de textos, incluida la clasificación de textos y el reconocimiento de entidades nombradas.

Clasificación de textos

La clasificación de textos incluye la categorización de cadenas de texto con un conjunto predefinido de etiquetas. La categorización de textos con diferentes etiquetas se utiliza a menudo para modelos de procesamiento de lenguaje natural (NLP) que identifican cosas como temas (por ej., descripciones de productos, comentarios de películas) u opiniones.

Clasificación de textos de Amazon SageMaker Ground Truth

Reconocimiento de entidades nombradas

El reconocimiento de entidades nombradas (NER) incluye la filtración de datos de textos para encontrar frases que se denominan entidades nombradas, y la categorización de cada una de ellas con una etiqueta, como “persona”, “organización” o “marca”. Por lo tanto, en la oración “Recientemente me suscribí a Amazon Prime”, “Amazon Prime” sería la entidad nombrada y se podría categorizar como “marca”.

Reconocimiento de entidades nombradas de Amazon SageMaker Ground Truth

Flujos de trabajo personalizados

Puede crear un flujo de trabajo de etiquetado propio en Ground Truth. Un flujo de trabajo personalizado tiene tres componentes: (1) una plantilla de interfaz de usuario que ofrece a los responsables del etiquetado todas las instrucciones y herramientas que necesitan para hacer la tarea de etiquetado, (2) cualquier lógica de preprocesamiento encapsulada en una función de AWS Lambda y (3) cualquier lógica de posprocesamiento encapsulada en una función de AWS Lambda. Se encuentra disponible una amplia selección de plantillas de interfaz de usuario y también es posible cargar una plantilla de Javascript o HTML propia. La función de Lambda de preprocesamiento puede proveer los datos que se van a etiquetar y agregar cualquier contexto adicional destinado al responsable del etiquetado y la función de Lambda de posprocesamiento se puede usar para insertar un algoritmo de optimización de la precisión. El algoritmo puede evaluar la calidad de las anotaciones realizadas manualmente o puede encontrar consenso en cuanto a lo que está “bien” cuando los mismos datos se proveen a diferentes responsables de etiquetado. Puede cargar los tres componentes con la consola de SageMaker Ground Truth.

Cree su flujo de trabajo personalizado en Ground Truth

Mano de obra

SageMaker Ground Truth admite varias opciones para que un grupo de trabajadores etiqueten datos: (1) empleados propios, (2) proveedores de servicios de etiquetado de datos externos disponibles mediante AWS Marketplace y (3) mano de obra con convocatoria abierta mediante Amazon Mechanical Turk.

Mechanical Turk
Mechanical Turk
Privado
Privado
Proveedores
Proveedores

Generación de datos sintéticos

Amazon SageMaker Ground Truth admite la generación de datos sintéticos. SageMaker Ground Truth puede generar cientos de miles de imágenes sintéticas etiquetadas, lo que ayuda a mejorar la precisión del etiquetado y a eliminar la necesidad de etiquetar manualmente los datos. En primer lugar, especifique sus requisitos de imagen o proporcione activos 3D e imágenes de referencia, como imágenes de diseño asistido por computación (CAD). Después, los artistas digitales de AWS crean imágenes que imitan la pose y la colocación de los objetos, e incluyen variaciones de objetos o escenas. Además, los artistas digitales de AWS agregan opcionalmente inclusiones específicas para crear imágenes que no suelen incluirse en los conjuntos de datos de formación.
Imagen de generación de datos sintéticos
Precios de Amazon SageMaker Ground Truth
Más información sobre los precios del etiquetado de datos de Amazon SageMaker

Comience a utilizar el etiquetado de datos de Amazon SageMaker sin compromisos iniciales ni contratos a largo plazo.

Más información 
Regístrese para obtener una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Registrarse 
Comience a crear en la consola
Comience a crear en la consola

Comience a crear con el etiquetado de datos de Amazon SageMaker en la consola de administración de AWS.

Iniciar sesión