Tape Ark

Tape Ark et AWS inventent une solution d'archivage prête à l'emploi

2021

Tape Ark s'est fixé pour mission d'aider les organisations à gérer leurs données de sauvegarde et leurs documents d'entreprise vieillissants en s'appuyant sur l'analytique des données, l'intelligence artificielle (IA) et le machine learning (ML). En tant que premier spécialiste mondial de la migration de bandes vers le cloud, ayant traité plus de cinq millions de bandes de données à ce jour, Tape Ark aide désormais ses clients à prendre le contrôle de leurs données papier.

Pour de nombreux secteurs, le stockage des documents est une obligation légale. Pourtant, le secteur de la gestion des documents, qui représente, selon IBIS World, 529 millions USD rien qu'en Australie, est prêt à être bouleversé.

« Le plus souvent, les entreprises ont tendance à perdre de vue le contenu de chaque boîte. Il est donc difficile de prendre des décisions concernant la mise au rebut des boîtes ou la numérisation des documents. À mesure que le temps passe et que leur collection de boîtes d'archives augmente, le problème devient encore plus complexe », déclare Guy Holmes, président-directeur général de Tape Ark.

À titre d'exemple, l'un des clients de Tape Ark possède un stock de plus d'un million de boîtes et sa collection remonte aux années 1930.

« Nous avons réalisé que le stockage de documents papier dans des boîtes d'archives constituait un problème pour de nombreuses entreprises. Afin de décider quels documents conserver, numériser ou détruire, elles cherchent généralement à numériser tous les documents ou à rapporter les boîtes d'archives à leur bureau pour qu'un expert les examine manuellement. L'option par défaut est de ne rien faire, mais cela implique de débourser des frais d'entreposage mensuels dans un avenir prévisible. Nous utilisions déjà l'IA et le ML dans d'autres domaines de notre activité lorsque nous avons eu l'idée de recourir à ces outils pour inventer une solution plus intelligente qui leur permet de découvrir le contenu de chaque boîte pour une fraction du coût », explique Guy.

Hardware electronic circuit board. technology style concept semiconductor motherboard computer server cpu
kr_quotemark

L'équipe ProServe nous a fait découvrir une nouvelle façon de penser, une suite de produits AWS émergents, et a été très coopérative… Nous ne pensons pas qu'il existe des solutions comparables à Rapid Box Indexer dans le monde.

Guy Holmes
Président-directeur général, Tape Ark

Les principales étapes du parcours de machine learning de Tape Ark : découverte, livraison, mise à l'échelle

Le parcours de machine learning de Tape Ark a débuté par un atelier de découverte organisé en juillet 2020 par l'équipe AWS Professional Services (ProServe). Une équipe dédiée de scientifiques des données, d'ingénieurs et d'experts commerciaux s'est réunie pour développer un « plan de machine learning », décrivant les étapes et les itérations clés. En décembre, Tape Ark était en mesure de déployer une preuve de concept appelée Rapid Box Indexer.

La solution Rapid Box Indexer permet aux entreprises de visualiser à distance le contenu des boîtes archivées via le portail client de Tape Ark. Il s'agit du premier service du genre, selon Guy.

« Jusqu'à présent, les entreprises devaient récupérer physiquement les boîtes dans des entrepôts hors site afin d'en vérifier le contenu. Chaque boîte est ouverte par un membre du personnel, qui examine, documente ou numérise manuellement les éléments avant de les ajouter à une feuille de calcul ou à une base de données. En fonction de son contenu, une seule boîte peut prendre plus d'une heure pour être indexée et documentée manuellement. Multipliez ce chiffre par des dizaines de milliers, voire des centaines de milliers de boîtes, ce qui est courant pour de grandes entreprises, et vous aurez des heures de travail interminables », explique Guy.

Pour automatiser ce processus, la solution Rapid Box Indexer utilise le machine learning pour indexer et enregistrer le contenu des boîtes. Les logiciels d'analyse intelligente d'images et de vidéos sont également utilisés pour classer les informations et ajouter des métadonnées, en fournissant ainsi des informations bien plus détaillées que les méthodes d'indexation traditionnelles.

Présentation de la suite d'innovations AWS de Tape Ark en matière d'IA et de machine learning

« L'équipe ProServe a été incroyable », déclare Guy. « Elle nous a fait découvrir une nouvelle façon de penser, une suite de produits AWS émergents, et elle s'est montrée extrêmement coopérative. C'est formidable de travailler avec une équipe partageant les mêmes idées, qui voit les choses en grand et qui souhaite réellement résoudre le problème du client. »

Ensemble, Tape Ark et ProServe ont créé la solution Rapid Box Indexer à l'aide d'Amazon Textract, qui utilise le machine learning pour extraire du texte imprimé ou manuscrit et des données de pratiquement n'importe quel document, comme le ferait une véritable personne. Amazon Rekognition sert à automatiser l'analyse d'images et de vidéos à l'aide de logiciels de machine learning et de reconnaissance vocale, tandis qu'Amazon Comprehend permet la détection d'entités et l'analyse des sentiments. Amazon S3 sert à stocker et à protéger les données, tandis qu'Amazon Lambda permet un traitement très rapide des informations.

Les utilisateurs peuvent désormais « voir » l'intérieur de chaque boîte à l'aide de trois couches de données (vidéos, images et texte) via le portail Tape Ark, ainsi que par des balises consultables. Grâce à ces informations, il est beaucoup plus facile de décider quels documents conserver, numériser ou détruire. Ils peuvent également vérifier les boîtes longtemps après la capture de la vidéo, des images et du texte, sans devoir se rappeler la moindre boîte.

« Selon nous, c'est comme si vous aviez toutes vos boîtes hors site avec vous sur site afin de pouvoir en feuilleter le contenu au besoin. Cela permet à nos clients de se concentrer sur ce qu'ils espèrent trouver », explique Guy.

Passer à l’échelle mondiale : faire connaître la solution Rapid Box Indexer de Tape Ark

Après avoir développé une preuve de concept en Australie, Tape Ark pilote actuellement la solution Rapid Box Indexer depuis ses installations de Houston aux États-Unis.

« Nous utilisons actuellement la solution Rapid Box Indexer pour traiter 7 500 boîtes, ce qui est une échelle raisonnable pour notre premier projet pilote. Les commentaires des clients nous aideront à affiner l'Indexer et à le rendre encore plus utile. En 2021, nous commencerons à le déployer en masse », explique Guy.

« Notre objectif est d'étendre l'Indexer afin de répondre aux besoins de tous les secteurs d'activité et de répondre à certaines des questions les plus difficiles en matière de gestion documentaire. Pouvons-nous donner la priorité aux documents à numériser ? Cela contribuera-t-il à réduire la taille des boîtes d'archives physiques ? Comment cela réduira-t-il les coûts d'entreposage mensuels ? »

Selon les comparaisons établies par AWS, la solution Rapid Box Indexer peut être jusqu'à 20 fois moins onéreuse que les systèmes d'archivage traditionnels. Cette estimation est basée sur les coûts de stockage des boîtes dans des entrepôts, qui sont « nettement supérieurs aux coûts de numérisation et de stockage des données dans le cloud », explique Guy.


À propos de Tape Ark

Tape Ark fait entrer la gestion des données sur bande d'archives hors site dans le 21e siècle en faisant migrer en toute sécurité les données d'entreprise vieillissantes des supports sur bande directement vers le cloud public. En adoptant les technologies de stockage de données numériques et virtuelles, Tape Ark réinvente la façon dont les données physiques sont stockées hors site, faisant entrer le stockage physique sur bande dans le nouveau millénaire.

Avantages

  • Réduction des coûts d'entreposage physique jusqu'à 20 fois.
  • Fourniture de trois couches de données (texte, image et vidéo). Les utilisateurs peuvent voir de loin le contenu de chaque boîte, tant textuellement que visuellement.
  • Simplification et automatisation des tâches à faible valeur ajoutée telles que la saisie et l'indexation des données pour améliorer l'efficacité de l'entreprise.

Services AWS utilisés

Amazon Textract

Amazon Textract est un service de machine learning entièrement géré qui permet d'extraire facilement du texte imprimé ou manuscrit et des données à partir de pratiquement n'importe quel document.

En savoir plus »

Amazon Rekognition

Amazon Rekognition facilite l'ajout d'analyses d'images et de vidéos aux applications à l'aide d'une technologie de deep learning éprouvée, hautement évolutive et qui ne nécessite aucune expertise en machine learning.

En savoir plus »

Amazon Comprehend

Amazon Comprehend est un service de traitement du langage naturel (NLP) qui exploite le machine learning pour identifier des informations et des relations dans un texte.

En savoir plus »

Amazon S3

Amazon S3 est un service de stockage d'objets qui offre une capacité de mise à l'échelle, une disponibilité des données, une sécurité et des performances de pointe.

En savoir plus »


Démarrer

Les entreprises de toute taille et de tous les secteurs d'activités transforment chaque jour leurs activités à l'aide d'AWS. Contactez nos spécialistes et commencez dès aujourd'hui votre transition vers le Cloud AWS.