Domande generali

D: Cos'è Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth ti consente di etichettare in modo efficiente e accurato i set di dati richiesti per la formazione dei sistemi di apprendimento automatico. SageMaker Ground Truth può etichettare automaticamente una parte del set di dati in base alle etichette fatte manualmente dagli etichettatori. Puoi scegliere di utilizzare una forza lavoro di Amazon Mechanical Turk in crowdsourcing composta da oltre 500.000 etichettatori, i tuoi dipendenti o uno dei fornitori di servizi di terze parti per l’etichettatura dati elencato in AWS Marketplace, precedentemente selezionato da Amazon. SageMaker Ground Truth utilizza algoritmi innovativi e tecniche di esperienza utente (UX) per migliorare la precisione dell'etichettatura umana. Nel tempo, il modello migliora progressivamente imparando continuamente dalle etichette create dagli esseri umani, per aumentare l'etichettatura automatica.

D: Che cos'è l'etichettatura automatica dei dati?

A: l'etichettatura automatica dei dati è l'etichettatura dei dati mediante l'apprendimento automatico. Amazon SageMaker Ground Truth selezionerà prima un campione casuale di dati e lo invierà agli umani per essere etichettato. I risultati vengono quindi utilizzati per addestrare un modello di etichettatura che tenta di etichettare automaticamente un nuovo campione di dati grezzi. Le etichette vengono confermate quando il modello può etichettare i dati con un punteggio di confidenza che soddisfa o supera una soglia elevata. Laddove il punteggio di confidenza scende al di sotto di questa soglia, i dati vengono inviati agli etichettatori. Alcuni dati etichettati da persone vengono utilizzati per generare un nuovo gruppo di dati per formare un modello di etichettatura e il modello viene riformato nuovamente in modo automatico per migliorarne l’accuratezza. Questo processo si ripete con ogni campione di dati grezzi da etichettare. Con ogni iterazione, il modello di etichettatura diventa più capace di etichettare automaticamente i dati grezzi e meno dati vengono instradati agli esseri umani.

Uso di Amazon SageMaker Ground Truth

D: Perché dovrei usare Amazon SageMaker Ground Truth?

A: Prima di costruire, addestrare e distribuire modelli di apprendimento automatico, hai bisogno di dati. I modelli di successo si basano su dati di addestramento di alta qualità e la raccolta e l'etichettatura dei set di dati di addestramento richiede molto tempo e impegno. Per costruire i set di dati in cui essere formati, gli etichettatori devono valutare un gran numero di immagini o altri tipi di dati, quindi identificare ed etichettare determinati oggetti in ogni tipo di dati. Queste attività di etichettatura sono distribuite tra molti etichettatori, aggiungendo spese generali e costi significativi. Se ci sono etichette errate, il sistema apprende dalle informazioni errate e fa previsioni imprecise.

Amazon SageMaker Ground Truth risolve questo problema semplificando l'esecuzione efficiente dell'etichettatura dei dati utilizzando i dati archiviati in Amazon S3, utilizzando una combinazione di etichettatura automatica dei dati e etichettatura eseguita dall'uomo.

D: Come inizio con Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth offre un'esperienza gestita in cui è possibile impostare un intero lavoro di etichettatura dei dati con pochi passaggi. Per iniziare con Amazon SageMaker Ground Truth, accedi alla console di gestione AWS e vai alla console SageMaker. Quindi seleziona Lavori di etichettatura in Ground Truth. Qui puoi creare un lavoro di etichettatura. Per prima cosa, come parte del flusso di creazione del lavoro di etichettatura, fornisci un puntatore al bucket S3 che contiene il set di dati da etichettare. Ground Truth offre modelli per attività di etichettatura comuni in cui è sufficiente fare clic su alcune scelte e fornire istruzioni minime su come ottenere l’etichettatura dei propri dati. In alternativa, puoi creare il tuo modello personalizzato. Come ultima fase della creazione di un lavoro di etichettatura, seleziona una delle tre opzioni umane di forza lavoro: (1) una forza lavoro pubblica crowdsourcing, (2) un insieme selezionato di fornitori di servizi di terze parti per l’etichettatura dati, oppure (3) usa lavoratori di tua scelta. Hai inoltre la possibilità di abilitare l'etichettatura automatica dei dati.

D: In che modo i miei set di dati di addestramento sono gestiti utilizzando Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth gestisce i metadati, le etichette associate e una tassonomia delle etichette e dei set di dati. È possibile utilizzare facilmente AWS SDK tramite un notebook SageMaker, o la console di Ground Truth all'interno della console SageMaker, per richiedere e gestire i set di dati e le etichette. Visita la documentazione di Amazon SageMaker Ground Truth per maggiori informazioni.

D: In che modo Amazon SageMaker Ground Truth aiuta ad aumentare la precisione dei miei set di dati di addestramento?

R: Amazon SageMaker Ground Truth offre le seguenti funzionalità per aiutarti ad aumentare la precisione dell'etichettatura dei dati eseguita dagli esseri umani:

(a) Consolidamento delle annotazioni: contrasta l'errore/bias dei singoli lavoratori inviando ciascun oggetto dati a più lavoratori e quindi consolida le loro risposte (dette "annotazioni") in un'unica etichetta. Quindi prende le loro annotazioni e le confronta usando un algoritmo di consolidamento delle annotazioni. Questo algoritmo prima rileva le annotazioni anomale che vengono ignorate. Esegue quindi un consolidamento ponderato delle annotazioni, assegnando pesi più elevati a annotazioni più affidabili. L'output è una singola etichetta per ogni oggetto.

(b) Best practice dell'interfaccia di annotazione: queste sono le caratteristiche delle interfacce di annotazione che consentono ai lavoratori di svolgere le loro attività in modo più accurato. I lavoratori umani sono inclini a errori e pregiudizi e interfacce ben progettate migliorano la precisione del lavoratore. Una buona pratica è quella di visualizzare brevi istruzioni associate ad esempi di etichette buone e cattive in un pannello laterale fisso. Un'altra best practice è di scurire l'area al di fuori del confine del riquadro quando i lavoratori stanno disegnando il riquadro di delimitazione su un'immagine.

D: In che modo Amazon SageMaker Ground Truth garantisce che i miei dati sono protetti e sicuri?

R: Per impostazione predefinita, Amazon SageMaker Ground Truth crittografa i dati a riposo e in transito. L'accesso ai dati può anche essere controllato tramite AWS Identity e Access Management (IAM). Ground Truth non memorizza o crea copie dei tuoi dati al di fuori del tuo ambiente AWS e i tuoi dati rimangono sotto il tuo controllo. Inoltre, Ground Truth supporta standard di conformità come il GDPR (General Data Protection Regulation) e offre funzionalità complete di registrazione e auditing utilizzando Amazon CloudWatch e Amazon CloudTrail. Visita la documentazione di Amazon SageMaker Ground Truth per maggiori informazioni.

D: Come posso accedere a una forza lavoro umana utilizzando Amazon SageMaker Ground Truth?

R: Da SageMaker Ground Truth, puoi scegliere una delle tre opzioni della forza lavoro, ovvero (1) la forza lavoro pubblica crowdsourcing attraverso Amazon Mechanical Turk, (2) fornitori di servizi terzi per l’etichettatura dati disponibili attraverso AWS Marketplace e (3) i tuoi dipendenti. Visita la documentazione di Amazon SageMaker Ground Truth per maggiori informazioni.  

D: Il fornitore di servizi di etichettatura dei dati di Amazon SageMaker Ground Truth può processare dati riservati?

R: Sì, il fornitore di servizi di etichettatura dei dati di Amazon SageMaker Ground Truth può processare dati riservati. Il contratto sul servizio standard tra i clienti AWS e i fornitori terzi di servizi di etichettatura dei dati contiene alcune protezioni di base per le tue informazioni riservate. Verifica tali termini prima di condividere qualsiasi informazione riservata con il fornitore di servizi. I termini sono disponibili nella pagina contenente gli elenchi dei fornitori di servizi su AWS Marketplace.

D: Quali sono i requisiti a cui i fornitori di servizi di etichettatura dei dati di Amazon SageMaker Ground Truth devono rispondere?

R: Un fornitore di servizi di etichettatura dei dati deve possedere conformità e certificazione SOC 2 su base annuale. Il report SOC 2 contiene una descrizione dell'ambiente di controllo del fornitore di servizi basata sull'American Institute of Certified Public Accountants (AICPA) Trust Services Criteria - sicurezza, disponibilità, processo, integrità, confidenzialità e riservatezza.

Oltre al SOC 2, ai fornitori di servizi viene richiesto di mantenere questi ulteriori controlli di sicurezza, per conservare al sicuro i dati dei clienti.

Controlli tecnologici:
I fornitori di servizi devono utilizzare software appropriati per bloccare ogni tentativo di scaricare o copiare i file/dati dai propri sistemi e prevenire l'accesso non autorizzato a questi ultimi. I fornitori di servizi devono inoltre vietare ai loro dipendenti di archiviare o copiare i dati relativi alle attività dei clienti.

Controlli di sicurezza di rete:
Chiediamo che la rete dei nostri fornitori di servizi sia progettata in modo da prevenire l'accesso da remoto ai dati relativi alle tue attività. Inoltre, il software per la condivisione di file peer-to-peer è bloccato nella rete del fornitore e il firewall deve poter consentire un'elevata disponibilità.

Controllo dei dipendenti:
I fornitori di servizi devono garantire di avere accordi di non divulgazione con i propri dipendenti. I fornitori di servizi devono adottare politiche rigide per prevenire qualsiasi divulgazione delle informazioni ed evitare la trasmissione delle informazioni da parte dei dipendenti attraverso qualsiasi mezzo: cartaceo, USB, telefono cellulare o altri media.

Controlli sugli accessi fisici:
I fornitori di servizi devono mantenere misure di controllo sugli accessi fisici per prevenire accessi non autorizzati ai loro siti di produzione. Ciò può includere tornelli con autenticazione biometrica, identificazione del dipendente attraverso un badge, ecc.

D: In che modo AWS garantisce che i fornitori di servizi si attengano a questi standard di sicurezza?

R: AWS chiede ai fornitori di servizi di fornire i report di certificazione SOC 2 prima di essere inseriti negli elenchi di marketplace e ne conferma:

L'autenticità (se il fornitore di servizi è certificato presso l'AICPA);

Il periodo del report (data di validità della certificazione SOC 2); e

Il sito di produzione (il sito fisico dove la forza lavoro del fornitore di servizi lavora sulle attività di etichettatura di Amazon SageMaker Ground Truth).

D: Qual è la frequenza di verifica degli standard di sicurezza del fornitore di servizi?

R:  Gli standard di sicurezza di ogni fornitore di servizi vengono verificati annualmente per assicurare il rispetto dei requisiti obbligatori.

D: Esistono eccezioni alla verifica di AWS?

R: No. Se un fornitore di servizi non risponde agli standard di sicurezza, il loro elenco viene rimosso da AWS Marketplace. La rimozione dall'elenco viene completata entro 24 ore e tutti i clienti attivi ricevono una notifica via e-mail.

D: Qualora un fornitore di servizi offra servizi di etichettatura dei dati in diversi siti di produzione, questi ultimi devono tutti essere sottoposti al processo di verifica?

R: Sì. Tutti i siti devono rispettare gli standard di sicurezza richiesti.

D: Cosa accade in caso di violazione dei dati sul sito di produzione del fornitore di servizi?

R: Il fornitore di servizi dovrà informare AWS e i clienti interessati entro 24 ore dal rilevamento di qualsiasi accesso, raccolta, acquisizione, utilizzo, trasmissione, divulgazione, corruzione o perdita non autorizzata, reale o sospettata, delle informazioni dei clienti. Il fornitore di servizi rimedierà nell'immediato ad ogni incidente di sicurezza e fornirà per iscritto, ad AWS e ai clienti interessati, dettagli sulle investigazioni interne.

Utilizzo di fornitori di servizi di terze parti per l’etichettatura dati

D: Il fornitore di servizi di etichettatura dei dati di Amazon SageMaker Ground Truth può processare dati riservati?

R: Sì, il fornitore di servizi di etichettatura dei dati di Amazon SageMaker Ground Truth può processare dati riservati. Il contratto sul servizio standard tra i clienti AWS e i fornitori terzi di servizi di etichettatura dei dati contiene alcune protezioni di base per le tue informazioni riservate. Verifica tali termini prima di condividere qualsiasi informazione riservata con il fornitore di servizi. I termini sono disponibili nella pagina contenente gli elenchi dei fornitori di servizi su AWS Marketplace.

D: Quali sono i requisiti a cui i fornitori di servizi di etichettatura dei dati di Amazon SageMaker Ground Truth devono rispondere?

R: Un fornitore di servizi di etichettatura dei dati deve possedere conformità e certificazione SOC 2 su base annuale. Il report SOC 2 contiene una descrizione dell'ambiente di controllo del fornitore di servizi basata sull'American Institute of Certified Public Accountants (AICPA) Trust Services Criteria - sicurezza, disponibilità, processo, integrità, confidenzialità e riservatezza.

Oltre al SOC 2, ai fornitori di servizi viene richiesto di mantenere questi ulteriori controlli di sicurezza, per conservare al sicuro i dati dei clienti.

Controlli tecnologici:
I fornitori di servizi devono utilizzare software appropriati per bloccare ogni tentativo di scaricare o copiare i file/dati dai propri sistemi e prevenire l'accesso non autorizzato a questi ultimi. I fornitori di servizi devono inoltre vietare ai loro dipendenti di archiviare o copiare i dati relativi alle attività dei clienti.

Controlli di sicurezza di rete:
Chiediamo che la rete dei nostri fornitori di servizi sia progettata in modo da prevenire l'accesso da remoto ai dati relativi alle attività del cliente. Inoltre, la condivisione di file peer-to-peer è bloccata nella rete del fornitore e il firewall dovrebbe poter consentire un'elevata disponibilità.

Controllo dei dipendenti:
I fornitori di servizi devono garantire di avere accordi di non divulgazione con i propri dipendenti. I fornitori di servizi devono adottare politiche rigide per prevenire qualsiasi divulgazione delle informazioni ed evitare la trasmissione delle informazioni da parte dei dipendenti attraverso qualsiasi mezzo: cartaceo, USB, telefono cellulare o altri media.

Controlli sugli accessi fisici:
I fornitori di servizi devono mantenere misure di controllo sugli accessi fisici per prevenire accessi non autorizzati ai loro siti di produzione. Ciò può includere tornelli con autenticazione biometrica, identificazione del dipendente attraverso un badge, ecc.

D: In che modo AWS garantisce che i fornitori di servizi si attengano a questi standard di sicurezza?

R: AWS chiede ai fornitori di servizi di fornire i report di certificazione SOC 2 prima di essere inseriti negli elenchi di marketplace e ne conferma:

L'autenticità (se il fornitore di servizi è certificato presso l'AICPA);

Il periodo del report (data di validità della certificazione SOC 2); e

Il sito di produzione (il sito fisico dove la forza lavoro del fornitore di servizi lavora sulle attività di etichettatura di Amazon SageMaker Ground Truth).

D: Qual è la frequenza di verifica degli standard di sicurezza del fornitore di servizi?

R: I fornitori di servizi sono soggetti a verifiche annuali, che ne determinano la possibilità di continuare a rispettare gli standard di sicurezza.

D: Esistono eccezioni alla verifica di AWS?

R: No. Se un fornitore di servizi non risponde agli standard di sicurezza, il loro elenco viene rimosso da AWS Marketplace. La rimozione dall'elenco viene completata entro 24 ore e tutti i clienti attivi ricevono una notifica via e-mail.

D: Qualora un fornitore di servizi offra servizi di etichettatura dei dati in diversi siti di produzione, questi ultimi devono tutti essere sottoposti al processo di verifica?

R: Sì. Tutti i siti devono rispettare gli standard di sicurezza richiesti.

D: Cosa accade in caso di violazione dei dati sul sito di produzione del fornitore di servizi?

R: Il fornitore di servizi informa AWS e i clienti interessati entro 24 ore dal rilevamento di qualsiasi accesso, raccolta, acquisizione, utilizzo, trasmissione, divulgazione, corruzione o perdita non autorizzata(o), reale o sospettata(o), delle informazioni dei clienti. Il fornitore di servizi rimedierà nell'immediato ad ogni incidente di sicurezza e fornirà per iscritto, ad AWS e ai clienti interessati, dettagli sulle investigazioni interne.

Prezzi e disponibilità

D: Quanto costa Amazon SageMaker Ground Truth?

R: Si prega di consultare la pagina dei prezzi di SageMaker Ground Truth per le informazioni sui prezzi correnti.

D: In quali regioni AWS è disponibile Amazon SageMaker Ground Truth?

R: Amazon SageMaker Ground Truth è disponibile nelle regioni AWS del Nord Virginia, Ohio, Oregon, Irlanda, Tokyo e Sydney.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Ulteriori informazioni sui prezzi Amazon SageMaker Ground Truth

Inizia con Amazon SageMaker Ground Truth senza impegni anticipati o contratti a lungo termine. Per maggiori dettagli, consulta la pagina dei prezzi pagina dei prezzidi Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrati per creare un account gratuito

Ottieni accesso istantaneo al piano gratuito di AWS. 

Registrati 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Inizia subito nella console

Inizia subito con Amazon SageMaker Ground Truth in AWS Management Console.

Accedi