Etichettatura di dati automatizzata

Amazon SageMaker Ground Truth fornisce l’etichettatura di dati automatizzata tramite l’apprendimento automatico. SageMaker Ground Truth seleziona dapprima un esempio casuale di dati che viene etichettato da persone. I risultati vengono utilizzati per formare un modello di etichettatura che tenta di etichettare automaticamente un nuovo esempio di dati grezzi. Le etichette vengono inoltrate quando il modello è in grado di etichettare i dati con un punteggio di affidabilità uguale o superiore alla soglia definita. Quando il punteggio di affidabilità è inferiore alla soglia definita, i dati vengono inviati a etichettatori umani. Alcuni dei dati etichettati da persone vengono utilizzati per generare un nuovo gruppo di dati per formare un modello di etichettatura e il modello viene formato nuovamente in modo automatico per migliorarne l’accuratezza. Questo procedimento viene ripetuto per ciascun esempio di dati grezzi da etichettare. A ciascuna iterazione, il modello di etichettatura migliora la sua capacità di etichettare automaticamente dati grezzi e vengono inviati meno dati a persone. 

Flessibilità nel modo di lavorare con professionisti dell’etichettatura

Amazon SageMaker Ground Truth supporta più modi di etichettatura umana direttamente nella Console SageMaker Ground Truth. Puoi usare il tuo team privato di etichettatori per attività di etichettatura interna, in particolare per gestire dati che devono restare all’interno dell’organizzazione.

Se vuoi aumentare il numero degli etichettatori e i tuoi dati non contengono informazioni riservate o non consentono l'identificazione personale, hai accesso on demand 24x7 a oltre 500.000 collaboratori indipendenti in tutto il mondo, basati sulla tecnologia di Amazon Mechanical Turk. Mechanical Turk è un marketplace di segnalazioni pubbliche che collega le tue attività di etichettatura a una forza lavoro distribuita che può eseguire queste attività in modo virtuale.

Oppure, puoi utilizzare un fornitore di terze parti specializzato in etichettatura di dati. Questi fornitori sono stati selezionati da Amazon per fornire etichette di qualità elevata e conformarsi ai processi di sicurezza. I servizi di etichettatura di questi fornitori sono forniti tramite AWS Marketplace. Vengono forniti tutti i dettagli rilevanti, fra cui i prezzi e le recensioni dei clienti, per aiutarti a selezionare il fornitore più adatto alle tue esigenze.

Istruzioni facili per l’etichettatura umana

Con Amazon SageMaker Ground Truth, puoi fornire linee guida agli etichettatori umani per garantire la coerenza. Gli etichettatori hanno accesso a queste istruzioni dettagliate nella loro interfaccia di etichettatura. Le istruzioni includono esempi visivi di buone e cattive etichette per aiutare gli etichettatori a produrre etichette accurate e di buona qualità. Queste istruzioni possono essere aggiornate in qualsiasi momento, rendendo più semplice l’aggiunta di dettagli alle attività quando vedi che alcuni etichettatori commettono errori o adeguando le istruzioni in base alle necessità in evoluzione. Di seguito puoi vedere un esempio di istruzioni. 

SamurAI Instructions for Bounding Box

Utilizza i flussi di lavoro per semplificare le attività di etichettatura

Amazon SageMaker Ground Truth fornisce flussi di lavoro di etichettatura integrati che guidano gli etichettatori umani passo per passo nelle attività e forniscono loro strumenti per aiutarli a produrre buoni risultati. I flussi di lavoro integrati sono attualmente disponibili per attività di etichettatura di rilevamento di oggetti, classificazione di immagini, classificazione di testi e segmentazione semantica. 

Oltre ai flussi di lavoro integrati, SageMaker Ground Truth ti offre la possibilità di caricare flussi di lavoro personalizzati. Un flusso di lavoro personalizzato consiste in un’interfaccia HTML e un algoritmo di miglioramento dell’accuratezza, entrambi forniti dal cliente. L’interfaccia HTML fornisce agli etichettatori umani tutte le istruzioni e gli strumenti che occorrono per effettuare l’attività di etichettatura. L’algoritmo di miglioramento dell’accuratezza è una funzione scritta dal cliente per addestrare SageMaker Ground Truth a valutare la qualità delle etichette fornite dalle persone. L’algoritmo è usato per trovare consenso su cosa è “giusto” quando gli stessi dati sono forniti a più etichettatori umani, oltre a identificare ed escludere gli etichettatori che tendono a fornire dati di scarsa qualità. Puoi caricare l’interfaccia HTML e l’algoritmo di miglioramento dell’accuratezza usando la console SageMaker Ground Truth. 

Rilevamento di oggetti

Puoi usare il flusso di lavoro di cornice per identificare ed etichettare oggetti in immagini. Una cornice è una finestra bidimensionale tracciata intorno a uno o più elementi di un’immagine. I modelli di visione computerizzata addestrati da immagini con cornici etichettate imparano che i pixel all’interno delle cornici corrispondono all’etichetta specificata. È un modo rapido e poco costoso per etichettare immagini. Tuttavia, poiché le cornici spesso contengono pixel non correlati al soggetto dell’etichetta, possono essere necessarie maggiori quantità di dati di training prima che un modello raggiunga un livello di accuratezza elevata.

L’immagine di seguito mostra l’interfaccia della cornice con un esempio di attività per identificare tutti i cani in una data immagine. L’interfaccia consente di specificare esempi chiari di cornici buone e cattive per mantenere un livello elevato di accuratezza. Inoltre fornisce un collegamento all’insieme delle istruzioni di etichettatura e una UI chiara e semplice per creare cornici. 

Bounding box

Classificazione di immagini

La classificazione di immagini comporta la categorizzazione di immagini rispetto a un gruppo di etichette predefinito. L’attività è diversa dal rilevamento di oggetti perché viene etichettata l’intera immagine invece di elementi individuali nell’immagine. La classificazione di immagini è utile per modelli di rilevamento di scene che devono prendere in considerazione il contesto completo dell’immagine. Ad esempio, nell’immagine di seguito, viene richiesto agli etichettatori di identificare quale sport è praticato in una data immagine. 

Image classification

Classificazione di testi

La classificazione di testi comporta la categorizzazione di stringhe di testo rispetto a un gruppo di etichette predefinito. La categorizzazione di testi in diverse etichette è spesso utilizzata per modelli di elaborazione del linguaggio naturale (NLP) che identificano elementi quali argomenti (per es. descrizione di prodotti, recensioni di film), entità (per es. nomi, luoghi, date) e sentimenti. 

Text classification

Segmentazione semantica

Per l’etichettatura avanzata di immagini, si può utilizzare la segmentazione semantica per etichettare le parti esatte di un’immagine che corrispondono a ciò che deve imparare il modello. La segmentazione semantica richiede più tempo e competenze rispetto alle cornici. Tuttavia fornisce dati di training molto ordinati grazie all’etichettatura unicamente dei pixel associati al soggetto. Ad esempio, la forma irregolare di un’automobile può essere catturata in modo esatto con la segmentazione semantica, mentre una cornice includerebbe inevitabilmente elementi dello sfondo non correlati all’automobile perché la cornice può avere solo quattro lati diritti.

Semantic Segmentation

Integrazione ottimale con Amazon SageMaker

I gruppi di dati di training creati con SageMaker Ground Truth possono essere importati facilmente in Amazon SageMaker per essere utilizzati per lo sviluppo e l’apprendimento di modelli. 

Amazon SageMaker semplifica la creazione di modelli di apprendimento automatico e la relativa preparazione all'addestramento fornendo tutto il necessario per etichettare rapidamente i dati di training e selezionare e ottimizzare l'algoritmo e il framework migliori per ogni applicazione. Amazon SageMaker include notebook Jupyter in hosting, che facilitano esplorazione e visualizzazione dei dati di addestramento memorizzati in Amazon S3. Sarà possibile connettersi direttamente ai dati in S3 o utilizzare AWS Glue per trasferire i dati da Amazon RDS, Amazon DynamoDB e Amazon Redshift in S3 per l'analisi in un notebook.

Per semplificare la scelta dell'algoritmo, Amazon SageMaker include gli algoritmi di apprendimento automatico più diffusi, preinstallati e ottimizzati per offrire prestazioni fino a 10 volte migliori rispetto a quelle che è possibile ottenere eseguendoli in altri ambienti. Amazon SageMaker è inoltre preconfigurato per eseguire TensorFlow, Apache MXNet, PyTorch e Chainer in contenitori Docker. Puoi inoltre scaricare questi contenitori open source nell'ambiente locale e utilizzare l’SDK Amazon SageMaker Python per testare gli script in modalità locale prima di utilizzare Amazon SageMaker per l'addestramento o l'hosting del modello in produzione. Avrai infine l'opzione di utilizzare il tuo framework.

Potrai iniziare a formare il tuo modello con un solo clic nella console Amazon SageMaker. Amazon SageMaker gestisce tutta l'infrastruttura sottostante al tuo posto e può essere utilizzato senza difficoltà per formare modelli nell'ordine dei petabyte. Per rendere il processo di formazione ancora più rapido e semplice, Amazon SageMaker è in grado di mettere a punto automaticamente il tuo modello per raggiungere il massimo livello possibile di precisione.

Dopo che il modello è stato addestrato e messo a punto, Amazon SageMaker ne semplifica la distribuzione in produzione, permettendo di iniziare a generare previsioni (un processo chiamato inferenza) su dati in tempo reale o in batch. Amazon SageMaker distribuisce il modello su un cluster di istanze Amazon SageMaker ML distribuite in più zone di disponibilità per ottenere prestazioni e disponibilità elevate. Amazon SageMaker inoltre include funzionalità di test A/B integrate per permetterti di testare il tuo modello e di provarne diverse versioni per ottenere i risultati migliori.

Amazon SageMaker elimina l'impegnativa attività di apprendimento automatico e ti permette di creare, formare e distribuire rapidamente e facilmente i modelli di machine learning.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Ulteriori informazioni sui prezzi di Amazon SageMaker Ground Truth

Inizia a usare Amazon SageMaker Ground Truth senza impegni anticipati o contratti a lungo termine. Per ulteriori dettagli, consulta la pagina dei prezzi di Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrati per creare un account gratuito

Ottieni accesso istantaneo al piano gratuito di AWS. 

Registrati 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Inizia subito nella console

Inizia a utilizzare Amazon SageMaker Ground Truth nella Console di gestione AWS.

Accedi