Amazon SageMaker Ground Truth Plus

Forza lavoro esperta

Con Amazon SageMaker Ground Truth Plus, l'etichettatura viene eseguita da una forza lavoro esperta addestrata sulle attività di machine learning (ML) che possono contribuire a soddisfare i tuoi requisiti di sicurezza, privacy e conformità dei dati. Ad esempio, se hai bisogno di persone esperte nell'etichettare i file audio, puoi specificare questo requisito nelle linee guida fornite a SageMaker Ground Truth Plus, e il servizio selezionerà automaticamente gli etichettatori con quelle competenze.

Gestione dell'etichettatura dei dati end-to-end

Con Amazon SageMaker Ground Truth Plus, puoi creare facilmente set di dati di formazione di alta qualità senza creare applicazioni di etichettatura o gestire le forze lavoro per l'etichettatura personalmente. Puoi caricare i dati insieme ai requisiti di etichettatura in Amazon S3. Una volta caricati i dati, SageMaker Ground Truth Plus imposta i flussi di lavoro di etichettatura dei dati e li gestisce al tuo posto.

Tecniche di etichettatura di ML

Amazon SageMaker Ground Truth Plus utilizza tecniche di ML, inclusi apprendimento attivo, pre-etichettatura e convalida automatica, che migliorano la qualità del set di dati di output e riducono i costi di etichettatura dei dati. Un flusso di lavoro di etichettatura multi-fase include modelli di ML per l'apprendimento attivo che permette a Ground Truth Plus di ridurre i costi selezionando gli oggetti (che possono essere un'immagine, una registrazione audio, una sezione di testo, ecc.) che devono essere etichettati e modelli di ML per pre-etichettare i dati selezionati che riducono lo sforzo umano. Ground Truth Plus utilizza la convalida automatica per identificare i potenziali errori che vengono poi inviati per un ulteriore passaggio di revisione umana. Questo migliora significativamente la qualità delle etichette rilevando gli errori umani. Inoltre, Ground Truth utilizza anche caratteristiche di etichettatura assistive come "snapping di un cuboide 3D automatico" e "predixt-next nell'etichettatura video" attraverso un'interfaccia utente intuitiva, al fine di ridurre il tempo necessario per le attività di etichettatura dei dati e migliorando al contempo la qualità.

Pannelli di controllo interattivi

SageMaker Ground Truth Plus fornisce pannelli di controllo e interfacce utente interattive, in modo da poter monitorare l'andamento dei set di dati di formazione in più progetti, tenere traccia delle metriche dei progetti, ad esempio la velocità effettiva giornaliera, analizzare la qualità delle etichette e fornire un feedback sui dati etichettati.

Amazon SageMaker Ground Truth

Nuvole di punti 3D

I 3D Point Cloud vengono acquisiti più comunemente utilizzando i dispositivi Light Detection and Ranging (LIDAR) per generare una comprensione 3D di uno spazio fisico in un determinato momento. SageMaker Ground Truth supporta i flussi di lavoro di etichettatura integrati per i tuoi dati 3D Point Cloud tra cui il rilevamento di oggetti, il rilevamento delle obiezioni e la segmentazione semantica.

Rilevamento di oggetti

Con il flusso di lavoro di rilevamento degli oggetti, è possibile identificare ed etichettare gli oggetti di interesse all'interno di un 3D Point Cloud. Ad esempio, in un caso d'uso di un veicolo con pilota automatico, è possibile etichettare veicoli, corsie e pedoni in modo accurato.

Rilevamento di oggetti di Amazon SageMaker Ground Truth

Monitoraggio di oggetti

Con il flusso di lavoro di monitoraggio degli oggetti, è possibile tenere traccia della traiettoria degli oggetti di interesse. Ad esempio, un veicolo autonomo deve tracciare il movimento di altri veicoli, corsie e pedoni. Ground Truth permette di tracciare la traiettoria di questi oggetti attraverso una sequenza di dati 3D Point Cloud.

Monitoraggio di oggetti di Amazon SageMaker Ground Truth

Segmentazione semantica

Con il flusso di lavoro di segmentazione semantica, è possibile segmentare i punti di un dato 3D Point Cloud in categorie predefinite. Ad esempio per i veicoli autonomi, Ground Truth potrebbe classificare la presenza di strade, fogliame e strutture.

Segmentazione semantica di Amazon SageMaker Ground Truth

Video

SageMaker Ground Truth supporta casi d’uso comuni di etichettatura video con flussi di lavoro integrati, tra cui il rilevamento e il monitoraggio di oggetti video e la classificazione di clip video.

Rilevamento di oggetti video

Con il flusso di lavoro di rilevamento degli oggetti video, è possibile identificare ed etichettare gli oggetti di interesse all'interno di una sequenza di fotogrammi video. Ad esempio, nel costruire un sistema di percezione per un veicolo autonomo, puoi rilevare la presenza di altri veicoli nelle vicinanze.

Rilevamento di oggetti video di Amazon SageMaker Ground Truth

Monitoraggio di oggetti video

Con il flusso di lavoro di monitoraggio degli oggetti video, è possibile monitorare gli oggetti di interesse attraverso una sequenza di fotogrammi video. Ad esempio, nel caso d’uso di un gioco sportivo, puoi etichettare accuratamente i giocatori durante la durata della partita.

Monitoraggio di oggetti video di Amazon SageMaker Ground Truth

Classificazione delle clip video

Con il flusso di lavoro di classificazione delle clip video puoi classificare un file video all’interno di una categoria predefinita. Ad esempio puoi selezionare le categorie predefinite che meglio descrivono il video come una partita sportiva o un ingorgo stradale in un incrocio trafficato.

Classificazione di clip video di Amazon SageMaker Ground Truth

Immagini

SageMaker Ground Truth offre flussi di lavoro di etichettatura integrati per i dati delle immagini, tra cui classificazione delle immagini, rilevamento degli oggetti e segmentazione semantica.

Classificazione di immagini

La classificazione delle immagini è il processo di identificazione di un'immagine in base alla sua rappresentazione nel mondo reale. Questo processo comporta la categorizzazione di immagini rispetto a un gruppo di etichette predefinito. La classificazione di immagini è utile per modelli di rilevamento di scene che devono prendere in considerazione il contesto completo dell'immagine. Ad esempio, è possibile costruire un modello di classificazione delle immagini per veicoli con pilota automatico per rilevare vari oggetti del mondo reale come altri veicoli, pedoni, semafori e segnaletica.

Classificazione di immagini di Amazon SageMaker Ground Truth

Rilevamento di oggetti

È possibile utilizzare il flusso di lavoro di rilevamento degli oggetti per identificare ed etichettare oggetti di interesse (ad esempio veicoli, pedoni, cani, gatti) contenuti nelle immagini. L'attività di etichettatura prevede il disegno di un riquadro di delimitazione, un riquadro bidimensionale (2D), attorno agli oggetti di interesse all'interno di un'immagine. I modelli di visione computerizzata addestrati da immagini con cornici etichettate imparano che i pixel all'interno delle cornici corrispondono all'oggetto specificato.

Rilevamento di oggetti di Amazon SageMaker Ground Truth

Segmentazione semantica

È possibile utilizzare la segmentazione semantica per etichettare le parti esatte di un’immagine che corrispondono alle etichette che il modello deve acquisire. Offre dati di formazione ad alta precisione poiché i singoli pixel sono etichettati. Ad esempio, la forma irregolare di un'auto in un'immagine potrebbe essere catturata con la segmentazione semantica in modo preciso.

Segmentazione semantica di Amazon SageMaker Ground Truth

Testo

SageMaker Ground Truth fornisce flussi di lavoro di etichettatura integrati per i dati di testo, tra cui la classificazione dei testi e il riconoscimento delle entità nominali.

Classificazione di testi

La classificazione di testi comporta la categorizzazione di stringhe di testo rispetto a un gruppo di etichette predefinito. La categorizzazione di testi in diverse etichette è spesso utilizzata per modelli di elaborazione del linguaggio naturale (NLP) che identificano elementi quali argomenti (ad esempio descrizione di prodotti, recensioni di film) o sentimenti.

Classificazione di testi di Amazon SageMaker Ground Truth

Riconoscimento delle entità nominali

Il riconoscimento delle entità nominali (Named Entity Recognition/NER) implica la vagliatura dei dati di testo per individuare frasi chiamate entità nominali e classificarle ognuna con un'etichetta, ad esmpio "persona", "organizzazione" o "marchio". Quindi, nella dichiarazione "Mi sono abbonato di recente ad Amazon Prime", "Amazon Prime" sarebbe l'entità nominale classificabile come "marchio".

Riconoscimento delle entità nominali di Amazon SageMaker Ground Truth

Flussi di lavoro personalizzati

Ground Truth permette di creare flussi di lavoro di etichettatura. Un flusso di lavoro personalizzato è costituito da tre componenti: (1) un modello di interfaccia utente che fornisce agli etichettatori umani tutte le istruzioni e gli strumenti necessari per completare l'attività di etichettatura, (2) qualsiasi logica di pre-elaborazione incapsulata in una funzione AWS Lambda e (3) qualsiasi logica di post-elaborazione incapsulata in una funzione AWS Lambda. È disponibile un'ampia selezione di modelli di interfaccia utente oppure puoi caricare il tuo modello Javascript/HTML. La funzione Lambda di pre-elaborazione può distribuire i dati da etichettare e aggiungere qualsiasi contesto aggiuntivo per l'etichettatore e la funzione Lambda di post-elaborazione può essere utilizzata per inserire un algoritmo di miglioramento della precisione. L'algoritmo può valutare la qualità delle annotazioni fatte dagli umani o può trovare consenso su ciò che è "giusto" quando gli stessi dati vengono forniti a più etichettatori umani. È possibile caricare tutti e tre i componenti utilizzando la console SageMaker Ground Truth.

Crea il tuo flusso di lavoro personalizzato in Ground Truth

Forza lavoro

Per etichettare i dati, SageMaker Ground Truth supporta diverse scelte per una forza lavoro umana: (1) i dipendenti aziendali, (2) i fornitori di servizi di etichettatura dei dati di terze parti disponibili in AWS Marketplace e (3) la forza lavoro crowd-sourced attraverso Amazon Mechanical Turk.

Mechanical Turk
Mechanical Turk
Privato
Privato
Fornitori
Fornitori

Generazione di dati sintetici

Amazon SageMaker Ground Truth supporta la generazione di dati sintetici. SageMaker Ground Truth può generare centinaia di migliaia di immagini sintetiche etichettate, migliorando così l'accuratezza di etichettatura ed eliminando il bisogno di etichettare manualmente dati. In primo luogo, devi specificare i requisiti dell'immagine o fornire asset 3D e immagini di base, come immagini di progettazione assistita dall'elaboratore (CAD). Quindi gli artisti digitali di AWS creano immagini che imitano pose e posizionamenti di oggetti e includono variazioni di oggetto o scena. Inoltre, gli artisti digitali di AWS possono anche aggiungere servizi specifici per creare immagini che non sono incluse spesso nei set di dati di formazione.
Immagine di generazione dei dati sintetici
Prezzi di Amazon SageMaker Ground Truth
Ulteriori informazioni sui prezzi di etichettatura dei dati di Amazon SageMaker

Inizia con l'etichettatura dei dati di Amazon SageMaker senza impegni anticipati o contratti a lungo termine.

Ulteriori informazioni 
Registrati per creare un account AWS
Registrati per creare un account gratuito

Ottieni l'accesso immediato al piano gratuito di AWS. 

Registrati 
Inizia a lavorare nella console
Inizia a lavorare nella console

Inizia subito con l'etichettatura dei dati di Amazon SageMaker nella Console di gestione AWS.

Accedi