Amazon SageMaker Ground Truth Plus
Personal experto
Con Amazon SageMaker Ground Truth Plus, el etiquetado lo realiza personal experto formado en tareas de machine learning (ML) que pueden ayudar a cumplir con los objetivos de seguridad y privacidad de los datos y las exigencias de cumplimiento. Por ejemplo, si necesita personas capacitadas en el etiquetado de archivos de audio, puede especificar esta exigencia en las directivas que proporciona a SageMaker Ground Truth Plus y el servicio seleccionará automáticamente etiquetadores que cuenten con esas capacidades.
Administración del etiquetado de datos de extremo a extremo
Con Amazon SageMaker Ground Truth Plus puede crear fácilmente conjuntos de datos de formación de alta calidad sin tener que crear aplicaciones de etiquetado o administrar el personal de etiquetado por su cuenta. Puede cargar datos junto con las exigencias de etiquetado en Amazon S3. Una vez que cargue los datos, SageMaker Ground Truth Plus se encarga de la configuración de los flujos de trabajo del etiquetado de datos y trabaja con ellos.
Técnicas de etiquetado de machine learning (ML)
Amazon SageMaker Ground Truth Plus utiliza técnicas de machine learning (ML), incluido el aprendizaje activo, el preetiquetado y la validación automática, lo cual aumenta la calidad del resultado del conjunto de datos y reduce los costos del etiquetado de datos. Un flujo de trabajo de etiquetado de varios pasos incluye modelos de machine learning (ML) para el aprendizaje activo que permiten a Ground Truth Plus reducir los costos al seleccionar cuáles elementos (puede ser una imagen, una grabación de audio, una sección de un texto, etc.) se van a etiquetar y cuáles modelos de machine learning (ML) van a preetiquetar los datos seleccionados para reducir el esfuerzo humano. Ground Truth Plus utiliza la validación automática para identificar potenciales errores que luego son enviados para pasar por una etapa adicional de revisión humana. Esto mejora significativamente la calidad de las etiquetas al identificar los errores humanos. Además, Ground Truth Plus utiliza características de etiquetado auxiliares como “quiebre automático de cuboides 3D”, “predicción del contenido siguiente en el etiquetado de videos” y “segmentación automática” a través de una interfaz de usuario intuitiva a fin de reducir el tiempo necesario para realizar tareas de etiquetado de datos, al mismo tiempo que mejora la calidad.
Paneles interactivos
SageMaker Ground Truth Plus proporciona paneles interactivos e interfaces de usuario, para monitorear el progreso de los conjuntos de datos de formación en varios proyectos, hacer un seguimiento de las métricas del proyecto, como el rendimiento diario, inspeccionar la calidad de las etiquetas y proporcionar comentarios sobre los datos etiquetados.
Amazon SageMaker Ground Truth
Nubes de puntos en 3D | Video | Imágenes | Texto | Flujos de trabajo personalizados | Personal | Generación de datos sintéticos
Nubes de puntos en 3D
Las nubes de puntos en tres dimensiones (3D) son capturadas principalmente mediante dispositivos de detección de luz y rango (LIDAR) para generar una visualización 3D de un espacio físico en un punto único en el tiempo. SageMaker Ground Truth incluye flujos de trabajo de etiquetado integrados para sus datos de nube de puntos en 3D que incluyen la detección de objetos, el seguimiento de objetos y la segmentación semántica.
Detección de objetos
Con el flujo de trabajo de detección de objetos puede identificar y etiquetar objetos de su interés dentro de una nube de puntos en 3D. Por ejemplo, en un caso de uso de un vehículo autónomo, puede etiquetar vehículos, carriles y peatones con precisión.

Seguimiento de objetos
Con el flujo de trabajo de seguimiento de objetos puede controlar la trayectoria de objetos de su interés. Por ejemplo, un vehículo autónomo necesita controlar el movimiento de otros vehículos, carriles y peatones. Ground Truth permite controlar la trayectoria de estos objetos en una secuencia de datos de nube de puntos en 3D.

Segmentación semántica
Con el flujo de trabajo de segmentación semántica, puede segmentar los puntos de una nube de puntos en 3D en categorías previamente especificadas. Por ejemplo, en el caso de los vehículos autónomos, Ground Truth podría categorizar la presencia de calles, follaje y estructuras.

Video
SageMaker Ground Truth admite casos de uso de etiquetado de video común con flujos de trabajo incorporados, incluidos la detección de objetos de video, el seguimiento de objetos de video y la clasificación de videoclips.
Detección de objetos de video
Con el flujo de trabajo de detección de objetos de video, puede identificar objetos de su interés dentro de una secuencia de fotogramas. Por ejemplo, al crear un sistema de percepción para un vehículo autónomo, puede detectar otros vehículos en la escena cercano a este.

Seguimiento de objetos de video
Con el flujo de trabajo de seguimiento de objetos de video, puede seguir la trayectoria de objetos de su interés dentro de una secuencia de fotogramas. Por ejemplo, en el caso de uso de un evento deportivo, puede etiquetar a los jugadores mientras dure el juego.

Clasificación de videoclip
Con el flujo de trabajo de clasificación de videoclip, puede clasificar un archivo de video en categorías especificadas anteriormente. Por ejemplo, puede seleccionar categorías especificadas anteriormente que describan mejor el video, como un evento deportivo o congestión del tráfico en una intersección muy transitada.

Imágenes
SageMaker Ground Truth provee flujos de trabajo de etiquetado integrados para sus datos de imágenes que incluyen la clasificación de imágenes, la detección de objetos y la segmentación semántica.
Clasificación de imágenes
La clasificación de imágenes consiste en identificar una imagen en función de su representación en el mundo real. El proceso incluye la categorización de imágenes con un conjunto predefinido de etiquetas. La clasificación de imágenes es útil para los modelos de detección de escenas que deben considerar el contexto completo de la imagen. Por ejemplo, podemos crear un modelo de clasificación de imágenes para vehículos autónomos que detecte diferentes objetos reales, como otros vehículos, peatones, semáforos y señales de tránsito.

Detección de objetos
Puede usar el flujo de trabajo de detección de objetos para identificar y etiquetar objetos de su interés (p. ej., vehículos, peatones, perros, gatos) en imágenes. La tarea de etiquetado consiste en dibujar un cuadro delimitador, un cuadrado de dos dimensiones (2D), alrededor de los objetos de interés dentro de una imagen. Los modelos de visión artificial entrenados a partir de imágenes con cuadros delimitadores etiquetados aprenden que los píxeles ubicados dentro del cuadro corresponden al objeto especificado.

Segmentación semántica
Puede usar el flujo de trabajo de segmentación semántica para etiquetar las partes exactas de una imagen que corresponden a las etiquetas que su modelo necesita aprender. Provee datos de entrenamiento de alta precisión porque los píxeles individuales están etiquetados. Por ejemplo, la forma irregular de un automóvil se puede capturar con exactitud gracias a la segmentación semántica.

Texto
SageMaker Ground Truth ofrece flujos de trabajo de etiquetado integrados para los datos de textos, incluida la clasificación de textos y el reconocimiento de entidades nombradas.
Clasificación de textos
La clasificación de textos incluye la categorización de cadenas de texto con un conjunto predefinido de etiquetas. La categorización de textos con diferentes etiquetas se utiliza a menudo para modelos de procesamiento de lenguaje natural (NLP) que identifican cosas como temas (por ej., descripciones de productos, comentarios de películas) u opiniones.

Reconocimiento de entidades nombradas
El reconocimiento de entidades nombradas (NER) incluye la filtración de datos de textos para encontrar frases que se denominan entidades nombradas, y la categorización de cada una de ellas con una etiqueta, como “persona”, “organización” o “marca”. Por lo tanto, en la oración “Recientemente me suscribí a Amazon Prime”, “Amazon Prime” sería la entidad nombrada y se podría categorizar como “marca”.

Flujos de trabajo personalizados
Puede crear un flujo de trabajo de etiquetado propio en Ground Truth. Un flujo de trabajo personalizado tiene tres componentes: (1) una plantilla de interfaz de usuario que ofrece a los responsables del etiquetado todas las instrucciones y herramientas que necesitan para hacer la tarea de etiquetado, (2) cualquier lógica de preprocesamiento encapsulada en una función de AWS Lambda y (3) cualquier lógica de posprocesamiento encapsulada en una función de AWS Lambda. Se encuentra disponible una amplia selección de plantillas de interfaz de usuario y también es posible cargar una plantilla de Javascript o HTML propia. La función de Lambda de preprocesamiento puede proveer los datos que se van a etiquetar y agregar cualquier contexto adicional destinado al responsable del etiquetado y la función de Lambda de posprocesamiento se puede usar para insertar un algoritmo de optimización de la precisión. El algoritmo puede evaluar la calidad de las anotaciones realizadas manualmente o puede encontrar consenso en cuanto a lo que está “bien” cuando los mismos datos se proveen a diferentes responsables de etiquetado. Puede cargar los tres componentes con la consola de SageMaker Ground Truth.

Mano de obra
SageMaker Ground Truth admite varias opciones para que un grupo de trabajadores etiqueten datos: (1) empleados propios, (2) proveedores de servicios de etiquetado de datos externos disponibles mediante AWS Marketplace y (3) mano de obra con convocatoria abierta mediante Amazon Mechanical Turk.



Generación de datos sintéticos


Comience a utilizar el etiquetado de datos de Amazon SageMaker sin compromisos iniciales ni contratos a largo plazo.

Obtenga acceso instantáneo a la capa gratuita de AWS.

Comience a crear con el etiquetado de datos de Amazon SageMaker en la consola de administración de AWS.