Amazon SageMaker Ground Truth Plus
Forza lavoro esperta
Con Amazon SageMaker Ground Truth Plus, l'etichettatura viene eseguita da una forza lavoro esperta addestrata sulle attività di machine learning (ML) che possono contribuire a soddisfare i tuoi requisiti di sicurezza, privacy e conformità dei dati. Ad esempio, se hai bisogno di persone esperte nell'etichettare i file audio, puoi specificare questo requisito nelle linee guida fornite a SageMaker Ground Truth Plus, e il servizio selezionerà automaticamente gli etichettatori con quelle competenze.
Gestione dell'etichettatura dei dati end-to-end
Con Amazon SageMaker Ground Truth Plus, puoi creare facilmente set di dati di formazione di alta qualità senza creare applicazioni di etichettatura o gestire le forze lavoro per l'etichettatura personalmente. Puoi caricare i dati insieme ai requisiti di etichettatura in Amazon S3. Una volta caricati i dati, SageMaker Ground Truth Plus imposta i flussi di lavoro di etichettatura dei dati e li gestisce al tuo posto.
Tecniche di etichettatura di ML
Amazon SageMaker Ground Truth Plus utilizza tecniche di ML, inclusi apprendimento attivo, pre-etichettatura e convalida automatica, che migliorano la qualità del set di dati di output e riducono i costi di etichettatura dei dati. Un flusso di lavoro di etichettatura multi-fase include modelli di ML per l'apprendimento attivo che permette a Ground Truth Plus di ridurre i costi selezionando gli oggetti (che possono essere un'immagine, una registrazione audio, una sezione di testo, ecc.) che devono essere etichettati e modelli di ML per pre-etichettare i dati selezionati che riducono lo sforzo umano. Ground Truth Plus utilizza la convalida automatica per identificare i potenziali errori che vengono poi inviati per un ulteriore passaggio di revisione umana. Questo migliora significativamente la qualità delle etichette rilevando gli errori umani. Inoltre, Ground Truth utilizza anche caratteristiche di etichettatura assistive come "snapping di un cuboide 3D automatico" e "predixt-next nell'etichettatura video" attraverso un'interfaccia utente intuitiva, al fine di ridurre il tempo necessario per le attività di etichettatura dei dati e migliorando al contempo la qualità.
Pannelli di controllo interattivi
SageMaker Ground Truth Plus fornisce pannelli di controllo e interfacce utente interattive, in modo da poter monitorare l'andamento dei set di dati di formazione in più progetti, tenere traccia delle metriche dei progetti, ad esempio la velocità effettiva giornaliera, analizzare la qualità delle etichette e fornire un feedback sui dati etichettati.
Amazon SageMaker Ground Truth
Nuvole di punti 3D | Video | Immagini | Testo | Flussi di lavoro personalizzati | Forze lavoro | Generazione di dati sintetici
Nuvole di punti 3D
I 3D Point Cloud vengono acquisiti più comunemente utilizzando i dispositivi Light Detection and Ranging (LIDAR) per generare una comprensione 3D di uno spazio fisico in un determinato momento. SageMaker Ground Truth supporta i flussi di lavoro di etichettatura integrati per i tuoi dati 3D Point Cloud tra cui il rilevamento di oggetti, il rilevamento delle obiezioni e la segmentazione semantica.
Rilevamento di oggetti
Con il flusso di lavoro di rilevamento degli oggetti, è possibile identificare ed etichettare gli oggetti di interesse all'interno di un 3D Point Cloud. Ad esempio, in un caso d'uso di un veicolo con pilota automatico, è possibile etichettare veicoli, corsie e pedoni in modo accurato.

Monitoraggio di oggetti
Con il flusso di lavoro di monitoraggio degli oggetti, è possibile tenere traccia della traiettoria degli oggetti di interesse. Ad esempio, un veicolo autonomo deve tracciare il movimento di altri veicoli, corsie e pedoni. Ground Truth permette di tracciare la traiettoria di questi oggetti attraverso una sequenza di dati 3D Point Cloud.

Segmentazione semantica
Con il flusso di lavoro di segmentazione semantica, è possibile segmentare i punti di un dato 3D Point Cloud in categorie predefinite. Ad esempio per i veicoli autonomi, Ground Truth potrebbe classificare la presenza di strade, fogliame e strutture.

Video
SageMaker Ground Truth supporta casi d’uso comuni di etichettatura video con flussi di lavoro integrati, tra cui il rilevamento e il monitoraggio di oggetti video e la classificazione di clip video.
Rilevamento di oggetti video
Con il flusso di lavoro di rilevamento degli oggetti video, è possibile identificare ed etichettare gli oggetti di interesse all'interno di una sequenza di fotogrammi video. Ad esempio, nel costruire un sistema di percezione per un veicolo autonomo, puoi rilevare la presenza di altri veicoli nelle vicinanze.

Monitoraggio di oggetti video
Con il flusso di lavoro di monitoraggio degli oggetti video, è possibile monitorare gli oggetti di interesse attraverso una sequenza di fotogrammi video. Ad esempio, nel caso d’uso di un gioco sportivo, puoi etichettare accuratamente i giocatori durante la durata della partita.

Classificazione delle clip video
Con il flusso di lavoro di classificazione delle clip video puoi classificare un file video all’interno di una categoria predefinita. Ad esempio puoi selezionare le categorie predefinite che meglio descrivono il video come una partita sportiva o un ingorgo stradale in un incrocio trafficato.

Immagini
SageMaker Ground Truth offre flussi di lavoro di etichettatura integrati per i dati delle immagini, tra cui classificazione delle immagini, rilevamento degli oggetti e segmentazione semantica.
Classificazione di immagini
La classificazione delle immagini è il processo di identificazione di un'immagine in base alla sua rappresentazione nel mondo reale. Questo processo comporta la categorizzazione di immagini rispetto a un gruppo di etichette predefinito. La classificazione di immagini è utile per modelli di rilevamento di scene che devono prendere in considerazione il contesto completo dell'immagine. Ad esempio, è possibile costruire un modello di classificazione delle immagini per veicoli con pilota automatico per rilevare vari oggetti del mondo reale come altri veicoli, pedoni, semafori e segnaletica.

Rilevamento di oggetti
È possibile utilizzare il flusso di lavoro di rilevamento degli oggetti per identificare ed etichettare oggetti di interesse (ad esempio veicoli, pedoni, cani, gatti) contenuti nelle immagini. L'attività di etichettatura prevede il disegno di un riquadro di delimitazione, un riquadro bidimensionale (2D), attorno agli oggetti di interesse all'interno di un'immagine. I modelli di visione computerizzata addestrati da immagini con cornici etichettate imparano che i pixel all'interno delle cornici corrispondono all'oggetto specificato.

Segmentazione semantica
È possibile utilizzare la segmentazione semantica per etichettare le parti esatte di un’immagine che corrispondono alle etichette che il modello deve acquisire. Offre dati di formazione ad alta precisione poiché i singoli pixel sono etichettati. Ad esempio, la forma irregolare di un'auto in un'immagine potrebbe essere catturata con la segmentazione semantica in modo preciso.

Testo
SageMaker Ground Truth fornisce flussi di lavoro di etichettatura integrati per i dati di testo, tra cui la classificazione dei testi e il riconoscimento delle entità nominali.
Classificazione di testi
La classificazione di testi comporta la categorizzazione di stringhe di testo rispetto a un gruppo di etichette predefinito. La categorizzazione di testi in diverse etichette è spesso utilizzata per modelli di elaborazione del linguaggio naturale (NLP) che identificano elementi quali argomenti (ad esempio descrizione di prodotti, recensioni di film) o sentimenti.

Riconoscimento delle entità nominali
Il riconoscimento delle entità nominali (Named Entity Recognition/NER) implica la vagliatura dei dati di testo per individuare frasi chiamate entità nominali e classificarle ognuna con un'etichetta, ad esmpio "persona", "organizzazione" o "marchio". Quindi, nella dichiarazione "Mi sono abbonato di recente ad Amazon Prime", "Amazon Prime" sarebbe l'entità nominale classificabile come "marchio".

Flussi di lavoro personalizzati
Ground Truth permette di creare flussi di lavoro di etichettatura. Un flusso di lavoro personalizzato è costituito da tre componenti: (1) un modello di interfaccia utente che fornisce agli etichettatori umani tutte le istruzioni e gli strumenti necessari per completare l'attività di etichettatura, (2) qualsiasi logica di pre-elaborazione incapsulata in una funzione AWS Lambda e (3) qualsiasi logica di post-elaborazione incapsulata in una funzione AWS Lambda. È disponibile un'ampia selezione di modelli di interfaccia utente oppure puoi caricare il tuo modello Javascript/HTML. La funzione Lambda di pre-elaborazione può distribuire i dati da etichettare e aggiungere qualsiasi contesto aggiuntivo per l'etichettatore e la funzione Lambda di post-elaborazione può essere utilizzata per inserire un algoritmo di miglioramento della precisione. L'algoritmo può valutare la qualità delle annotazioni fatte dagli umani o può trovare consenso su ciò che è "giusto" quando gli stessi dati vengono forniti a più etichettatori umani. È possibile caricare tutti e tre i componenti utilizzando la console SageMaker Ground Truth.

Forza lavoro
Per etichettare i dati, SageMaker Ground Truth supporta diverse scelte per una forza lavoro umana: (1) i dipendenti aziendali, (2) i fornitori di servizi di etichettatura dei dati di terze parti disponibili in AWS Marketplace e (3) la forza lavoro crowd-sourced attraverso Amazon Mechanical Turk.



Generazione di dati sintetici


Inizia con l'etichettatura dei dati di Amazon SageMaker senza impegni anticipati o contratti a lungo termine.

Ottieni l'accesso immediato al piano gratuito di AWS.

Inizia subito con l'etichettatura dei dati di Amazon SageMaker nella Console di gestione AWS.