Tape Ark e AWS inventano una soluzione di archiviazione pronta all'uso
2021
La missione di Tape Ark è aiutare le organizzazioni a gestire i dati di backup e i documenti aziendali obsoleti sfruttando l'analisi dei dati, l'intelligenza artificiale (AI) e il machine learning (ML). In qualità di specialista leader mondiale nella migrazione da nastro a cloud, dopo aver elaborato oltre cinque milioni di nastri di dati fino ad oggi, Tape Ark aiuta ora i clienti a controllare i propri dati su documenti cartacei.
Per molti settori, l'archiviazione dei documenti è un requisito legale dell’attività di impresa, ed il settore della gestione dei documenti, che vale 529 milioni di dollari solo in Australia, secondo IBIS World, è pronto per essere rivoluzionato.
«Il più delle volte, le aziende tendono a perdere traccia di ciò che è contenuto in ogni archivio fisico. Ciò rende difficile prendere decisioni riguardanti lo smaltimento del cartaceo o la scansione dei documenti. Il tempo passa, le dimensioni degli archivi aumentano e il problema diventa sempre più ingombrante», afferma Guy Holmes, Presidente e Amministratore delegato di Tape Ark.
Uno dei clienti di Tape Ark, ad esempio, ha più di un milione di scatole contenenti raccolte di faldoni e fascicoli in magazzino e la sua collezione risale agli anni '30.
«Ci siamo resi conto che l'archiviazione di documenti cartacei in scatole d'archivio è un punto dolente per molte aziende. Per decidere quali documenti conservare, digitalizzare o distruggere, tradizionalmente cercano di scansionare tutti i documenti o di riportare le scatole dell'archivio in ufficio, affinché un esperto in materia esamini manualmente ogni scatola. L'opzione predefinita è non fare nulla, ma ciò significa affrontare onerose spese di magazzino mensili per il prossimo futuro. Stavamo già utilizzando l'intelligenza artificiale e il machine learning in altre aree della nostra attività quando abbiamo pensato di adoperare questi strumenti per inventare una soluzione più intelligente, in grado di far apprendere il contenuto di ogni raccolta di documenti a una frazione del costo», afferma Guy.
Il team di ProServe ci ha presentato un nuovo modo di ragionare, una suite di prodotti AWS emergenti, ed è stato estremamente collaborativo... Non pensiamo che esista una soluzione come Rapid Box Indexer in nessuna parte del mondo.
Guy Holmes
President and Chief Executive Officer, Tape Ark
I passaggi chiave del percorso verso il machine learning di Tape Ark: scoperta, consegna, dimensionamento
Il percorso di adozione del machine learning di Tape Ark è iniziato con un workshop di scoperta a luglio 2020, guidato dal team di AWS Professional Services (ProServe). Un team dedicato di data scientist, ingegneri ed esperti aziendali si è riunito per sviluppare uno «schema di ML», delineando i passaggi e le iterazioni chiave. A dicembre, Tape Ark era pronto a implementare un proof of concept chiamato Rapid Box Indexer.
Rapid Box Indexer consente alle organizzazioni di visualizzare il contenuto delle raccolte di faldoni e fascicoli archiviati da remoto, tramite il portale clienti di Tape Ark. È il primo servizio nel suo genere, secondo Guy.
«Fino ad ora, tutte le aziende dovevano recuperare fisicamente le scatole di faldoni dai magazzini esterni per controllarne il contenuto. Normalmente, ogni scatola viene aperta da un membro dello staff, che esamina, documenta o scansiona manualmente i documenti, prima di aggiungerli a un foglio di calcolo o database. Una singola scatola, a seconda del contenuto, può richiedere più di un'ora per essere indicizzata e documentata manualmente. Moltiplicate questo valore per decine di migliaia, se non centinaia di migliaia di scatole di faldoni e fascicoli, numeri ordinari nelle grandi organizzazioni, e otterrete infinite ore di lavoro», afferma Guy.
Per automatizzare questo processo, Rapid Box Indexer utilizza il machine learning per indicizzare e registrare il contenuto delle scatole. I software di analisi intelligente di immagini e video vengono utilizzati anche per classificare le informazioni e aggiungere metadati, fornendo informazioni molto più approfondite rispetto ai metodi di indicizzazione tradizionali.
La scoperta della suite di innovazioni di intelligenza artificiale e ML di AWS di Tape Ark
«Il team di ProServe è stato fantastico», afferma Guy. «Ci hanno fatto conoscere un nuovo modo di ragionare, una suite di prodotti AWS emergenti e sono stati estremamente collaborativi. È entusiasmante lavorare con un team che condivide le tue idee, le tue ambizioni e riesce a proporre soluzioni efficaci».
Insieme, Tape Ark e ProServe hanno creato Rapid Box Indexer utilizzando Amazon Textract, che utilizza il machine learning per estrarre testo digitato, testo scritto manualmente e altri dati, quasi da qualsiasi documento, proprio come farebbe una persona. Amazon Rekognition viene utilizzato per automatizzare l'analisi di immagini e video utilizzando software di machine learning e riconoscimento vocale, mentre Amazon Comprehend consente il rilevamento delle entità e l'analisi del sentiment. Amazon S3 viene utilizzato per archiviare e proteggere i dati, mentre Amazon Lambda consente un'elaborazione delle informazioni molto rapida.
Gli utenti possono ora «vedere» all'interno di ogni raccolta di documenti, utilizzando tre livelli di dati (video, immagini e testo) tramite il portale Tape Ark, insieme ai tag ricercabili. Grazie a queste informazioni, è molto più facile decidere quali documenti conservare, digitalizzare o distruggere. Possono, inoltre, controllare le raccolte archiviate anche molto tempo dopo l'acquisizione di video, immagini e testo, senza richiamare la singola raccolta.
«A nostro avviso, è come avere sempre a disposizione “in sede” tutti i faldoni fisicamente archiviati in raccolte “fuori sede”, in modo da poterne sfogliare il contenuto secondo necessità. Ciò consente ai nostri clienti di concentrarsi su ciò che sperano di trovare», afferma Guy.
Scalabilità: diffusione del Rapid Box Indexer di Tape Ark in tutto il mondo
Dopo aver sviluppato un proof of concept in Australia, Tape Ark sta ora testando Rapid Box Indexer presso le proprie strutture di Houston negli Stati Uniti.
«Attualmente stiamo utilizzando Rapid Box Indexer per elaborare 7.500 scatole di faldoni, fascicoli e documenti vari, una misura ragionevole per il nostro primo progetto pilota. Il feedback dei clienti ci aiuterà a perfezionare Indexer e a renderlo ancora più unico. Nel 2021, inizieremo a distribuirlo in massa», afferma Guy.
«Il nostro obiettivo è espandere ulteriormente le funzioni e diffondere Indexer per soddisfare le esigenze di qualsiasi settore e rispondere ad alcune delle domande più difficili sulla gestione dei documenti, come: Possiamo stabilire ordini di priorità riguardo ai documenti da digitalizzare? Ciò contribuirà a ridurre le dimensioni degli archivi fisici? In che modo questo ridurrà i costi mensili di magazzino?»
Secondo i confronti effettuati da AWS, Rapid Box Indexer può essere fino a 20 volte più economico dei sistemi di archiviazione tradizionali. Questa stima si basa sui costi di stoccaggio delle scatole di faldoni, fascicoli e documenti vari nei magazzini, che sono «significativamente superiori ai costi di digitalizzazione e archiviazione dei dati nel cloud», spiega Guy.
Informazioni su Tape Ark
Tape Ark sta portando nel XXI secolo la gestione dei dati di archiviazione su nastro fuori sede, migrando in modo sicuro i dati aziendali obsoleti dai supporti a nastro direttamente al cloud pubblico. Adottando tecnologie di archiviazione dei dati digitali e virtuali, Tape Ark sta reinventando il modo in cui i dati fisici vengono archiviati fuori sede, portando l'archiviazione fisica su nastro nel nuovo millennio.
Vantaggi
- Riduce i costi di magazzino fisico fino a 20 volte.
- Fornisce tre livelli di dati: testo, immagine e video: gli utenti possono vedere cosa c'è dentro ogni archivio, raccolta, faldone e fascicolo, testualmente e visivamente, da remoto.
- Semplifica e automatizza le attività di basso valore come l'immissione e l'indicizzazione dei dati per promuovere l'efficienza aziendale.
Servizi AWS utilizzati
Amazon Textract
Amazon Textract è un servizio di machine learning completamente gestito che estrae facilmente testo stampato, scritto a mano e dati praticamente da qualsiasi documento.
Amazon Rekognition
Amazon Rekognition facilita l'inserimento dell'analisi di immagini e video nelle applicazioni attraverso una tecnologia di deep learning collaudata e altamente scalabile il cui uso non richiede competenze di machine learning.
Amazon Comprehend
Amazon Comprehend è un servizio di elaborazione del linguaggio naturale (Natural-Language Processing o NLP) che utilizza il machine learning per identificare informazioni e relazioni in un testo.
Amazon S3
Amazon S3 è un servizio di archiviazione oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.
Inizia
Le aziende di tutte le taglie e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e inizia subito il tuo viaggio in AWS Cloud.