Inserito il: Feb 17, 2020

Amazon Rekognition è un servizio di analisi di immagini e video basato sul deep learning che permette di identificare oggetti, persone, testo, scene nonché supportare la moderazione di contenuti tramite il riconoscimento di contenuti non sicuri. A partire da oggi è possibile rilevare il testo nei video e ottenere l'affidabilità del rilevamento, il riquadro di delimitazione della posizione e il timestamp per ogni rilevazione di testo. Inoltre, il rilevamento del testo in immagini e video ora offre opzioni convenienti per filtrare le parole per regione di interesse (ROI), dimensione del riquadro di delimitazione e punteggio di affidabilità delle parole.  

Il rilevamento del testo nei video può servire a molti casi d'uso, in particolare per le applicazioni multimediali e di intrattenimento. Primo, è possibile cercare video o timestamp di video che contengono parole chiave specifiche, come per esempio "Ultime notizie". Secondo, per l'internazionalizzazione dei contenuti, è possibile trovare velocemente tutte le istanze di testo nella cronologia video di un programma per sostituirle con il testo in un'altra lingua. Terzo, per casi d'uso relativi a conformità e moderazione, è possibile rilevare testi accidentali come errori nei sottotitoli o testo non conforme perché volgare o contenente frasi d'odio mediante un confronto con un vocabolario di parole ed espressioni inserite in una lista nera. Infine, è possibile utilizzare la posizione del riquadro di delimitazione per analizzare l'impatto di dimensione e posizione del testo sulle prestazioni di una campagna di marketing o per posizionare correttamente altri elementi grafici. 

La possibilità di filtrare per regione del testo, dimensione e punteggio di affidabilità offre la flessibilità necessaria a controllare l'output del rilevamento di testo. Grazie alle ROI è possibile limitare facilmente il rilevamento del testo alle regioni desiderate, per esempio, il terzo inferiore per le grafiche su schermo o l'angolo in alto a sinistra per leggere i tabelloni dei punteggi in una partita di calcio. Il filtro relativo alla dimensione del riquadro di delimitazione del testo può essere utilizzato per evitare testo troppo piccolo sullo sfondo che può risultare un disturbo o irrilevante. Infine, il filtro di affidabilità delle parole ti permette di rimuovere i risultati inaffidabili perché sfocati o sbavati. 

Il rilevamento del testo per il filtraggio di testo e video ora è disponibile in tutte le regioni AWS supportate da Amazon Rekognition. Per iniziare puoi scaricare l'AWS SDK più recente e fare riferimento alla nostra documentazione per ulteriori dettagli.