Tape Ark

Tape Ark und AWS erfinden eine sofort einsatzbereite Archivierungslösung

2021

Tape Ark hat es sich zur Aufgabe gemacht, Unternehmen bei der Verwaltung ihrer Backup-Daten und veralteten Unternehmensdokumente zu unterstützen, indem das Unternehmen Data Analytics, künstliche Intelligenz (KI) und Machine Learning (ML) einsetzt. Als weltweit führender Spezialist für die Migration von Band zur Cloud, der bisher über fünf Millionen Datenbänder verarbeitet hat, hilft Tape Ark seinen Kunden nun, die Kontrolle über ihre papierbasierten Daten zu übernehmen.

In vielen Branchen ist die Aufbewahrung von Dokumenten gesetzlich vorgeschrieben, doch der Dokumentenverwaltungssektor, der laut IBIS World allein in Australien einen Wert von 529 Millionen US-Dollar hat, ist reif für tiefgreifende Veränderungen.

„In den meisten Fällen verlieren Unternehmen den Überblick darüber, was sich in jeder Box befindet. Dies macht es schwierig, Entscheidungen über die Entsorgung von Boxen oder das Scannen von Dokumenten zu treffen. Je mehr Zeit vergeht und je größer ihre Sammlung an Archivboxen wird, desto unübersichtlicher wird das Problem“, sagt Guy Holmes, President und Chief Executive Officer bei Tape Ark.

Einer der Kunden von Tape Ark hat beispielsweise mehr als eine Million Boxen im Lager, und die Sammlung enthält Aufzeichnungen bis in die 1930er Jahren.

„Wir haben erkannt, dass die Aufbewahrung von Papierdokumenten in Archivboxen für viele Unternehmen ein Problem darstellt. Um zu entscheiden, welche Dokumente aufbewahrt, digitalisiert oder vernichtet werden sollen, scannen sie gewöhnlich alle Dokumente oder bringen die Archivboxen zurück in ihr Büro, damit ein Fachexperte jede Box manuell überprüft. Die Standardoption ist, nichts zu tun, aber das bedeutet, auch in Zukunft unnötige monatliche Lagergebühren zu zahlen. Wir haben KI und ML bereits in anderen Bereichen unseres Unternehmens eingesetzt und kamen auf die Idee, mit diesen Tools eine intelligentere Lösung zu entwickeln, bei der die Kunden überprüfen können, was sich in jeder Box befindet – und das für einen Bruchteil der Kosten“, sagt Guy.

Hardware electronic circuit board. technology style concept semiconductor motherboard computer server cpu
kr_quotemark

Das ProServe-Team präsentierte uns eine neue Denkweise, eine Reihe neuer AWS-Produkte und war äußerst kooperativ ... Wir glauben nicht, dass es irgendwo auf der Welt eine Lösung wie den Rapid Box Indexer gibt.

Guy Holmes
President und Chief Executive Officer, Tape Ark

Die wichtigsten Schritte auf dem Weg des Machine Learnings von Tape Ark: Erkennung, Bereitstellung, Skalierung

Der Weg von Tape Ark zum Machine Learning begann mit einem Entdeckungsworkshop im Juli 2020, der vom Team von AWS Professional Services (ProServe) geleitet wurde. Ein engagiertes Team von Datenwissenschaftlern, Ingenieuren und Geschäftsexperten kam zusammen, um eine „ML-Vorlage“ zu entwickeln, der die wichtigsten Schritte und Iterationen skizziert. Im Dezember war Tape Ark bereit, einen Machbarkeitsnachweis für ein Konzept namens Rapid Box Indexer bereitzustellen.

Der Rapid Box Indexer ermöglicht es Unternehmen, den Inhalt archivierter Boxen über das Kundenportal von Tape Ark aus der Ferne einzusehen. Laut Guy ist es der erste Service dieser Art.

„Bisher mussten Unternehmen Boxen physisch aus externen Lagerhäusern abholen, um deren Inhalt zu überprüfen. Jede Box wird von einem Mitarbeiter geöffnet, der Artikel manuell untersucht, dokumentiert oder scannt, bevor er sie in eine Tabelle oder Datenbank einfügt. Das manuelle Indexieren und Dokumentieren einer einzelnen Box kann je nach Inhalt mehr als eine Stunde dauern. Multiplizieren Sie das mit Zehntausenden – wenn nicht Hunderttausenden – von Boxen, was für große Unternehmen typisch ist, und Sie haben endlose Arbeitsstunden vor sich“, sagt Guy.

Um diesen Prozess zu automatisieren, verwendet der Rapid Box Indexer Machine Learning, um Boxinhalte zu indizieren und aufzuzeichnen. Intelligente Bild- und Videoanalysesoftware wird auch verwendet, um Informationen zu kategorisieren und Metadaten hinzuzufügen. Sie bietet viel detailliertere Erkenntnisse als herkömmliche Indizierungsmethoden.

Nutzbringendes Verwenden der AWS-KI- und -ML-Innovationen von Tape Ark

„Das ProServe-Team war fantastisch“, sagt Guy. „Die Mitglieder des Teams haben uns eine neue Denkweise und eine Reihe neuer AWS-Produkte präsentiert und waren äußerst kooperativ. Es ist großartig, mit einem gleichgesinnten Team zusammenzuarbeiten, das in großen Maßstäben denkt und das Problem des Kunden wirklich angehen möchte.“

Gemeinsam entwickelten Tape Ark und ProServe den Rapid Box Indexer mithilfe von Amazon Textract, der Machine Learning nutzt, um Text, Handschrift und Daten aus praktisch jedem Dokument zu extrahieren, genau wie es ein Mensch tun würde. Amazon Rekognition wird zur Automatisierung der Bild- und Videoanalyse mithilfe von Software für Machine Learning und Spracherkennung verwendet, während Amazon Comprehend die Erkennung von Entitäten und die Stimmungsanalyse ermöglicht. Amazon S3 wird zum Speichern und Schützen von Daten verwendet, während Amazon Lambda eine sehr schnelle Informationsverarbeitung ermöglicht.

Benutzer können nun mithilfe von drei Datenebenen – Videos, Bilder und Text – über das Tape-Ark-Portal zusammen mit durchsuchbaren Tags in jede Box „blicken“. Mit diesen Informationen ist es viel einfacher zu entscheiden, welche Dokumente aufbewahrt, digitalisiert oder vernichtet werden sollen. Sie können Boxen auch lange nach der Aufnahme von Video, Bildern und Text überprüfen – ohne eine einzige Box abholen zu müssen.

„Unserer Ansicht nach ist es, als ob Sie all Ihre externen Boxen vor Ort bei sich haben, sodass Sie deren Inhalt bei Bedarf durchblättern können. So können unsere Kunden genau das finden, was sie zu finden hoffen“, sagt Guy.

Skalierung: Den Rapid Box Indexer von Tape Ark auf der ganzen Welt verfügbar machen

Nach der Entwicklung eines Machbarkeitsnachweises in Australien testet Tape Ark nun den Rapid Box Indexer von seinen Einrichtungen in Houston in den Vereinigten Staaten aus.

„Wir verwenden derzeit den Rapid Box Indexer, um 7 500 Boxen zu verarbeiten, was für unser erstes Pilotprojekt ein vernünftiger Umfang ist. Das Kundenfeedback wird uns helfen, den Indexer zu verfeinern und ihn noch wertvoller zu machen. 2021 werden wir damit beginnen, ihn im großen Stil einzuführen“, sagt Guy.

„Unser Ziel ist es, den Indexer so zu erweitern, dass er den Anforderungen jeder Branche gerecht wird und einige der schwierigsten Fragen im Dokumentenmanagement beantwortet: Können wir Dokumente für die Digitalisierung priorisieren? Wird dies dazu beitragen, die Größe der Speicherung physischer Box-Archive zu reduzieren? Wie werden dadurch die monatlichen Lagerkosten gesenkt?“

AWS-Vergleichen zufolge kann der Rapid Box Indexer bis zu 20-mal günstiger sein als herkömmliche Archivierungssysteme. Diese Schätzung basiert auf den Kosten für die Lagerung von Boxen in Lagerhäusern, die „deutlich höher sind als die Kosten für die Digitalisierung und Speicherung von Daten in der Cloud“, erklärt Guy.


Über Tape Ark

Tape Ark bringt die Verwaltung von externen, archivierten Banddaten ins 21. Jahrhundert, indem veraltete Unternehmensdaten sicher von Bandmedien direkt zur öffentlichen Cloud migriert werden. Durch den Einsatz digitaler und virtueller Datenspeichertechnologien erfindet Tape Ark die Art und Weise, wie physische Daten extern gespeichert werden, neu und bringt physische Bandspeicher ins neue Jahrtausend.

Vorteile

  • Reduziert die physischen Lagerkosten auf bis zu ein Zwanzigstel.
  • Bietet drei Datenebenen: Text, Bild und Video. Benutzer können aus der Ferne sehen, was sich in jeder Box befindet, textuell und visuell.
  • Vereinfacht und automatisiert Aufgaben mit geringem Wert wie Dateneingabe und Indizierung, um die Geschäftseffizienz zu steigern.

Genutzte AWS-Services

Amazon Textract

Amazon Textract ist ein vollständig verwalteter Service für Machine Learning, der es einfach macht, gedruckten Text, Handschriften und Daten aus praktisch jedem Dokument auf einfache Weise zu extrahieren.

Weitere Informationen »

Amazon Rekognition

Amazon Rekognition erleichtert das Hinzufügen von Bild- und Videoanalysen zu Anwendungen mithilfe bewährter, hochgradig skalierbarer Deep-Learning-Technologie, die keine Machine-Learning-Kenntnisse erfordert.

Weitere Informationen »

Amazon Comprehend

Amazon Comprehend ist ein NLP-Service (Natural Language Processing), der Machine Learning nutzt, um Erkenntnisse und Zusammenhänge im Text zu finden.

Weitere Informationen »

Amazon S3

Amazon S3 ist ein Objektspeicherdienst, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.

Weitere Informationen »


Erste Schritte

Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute Ihren Weg in die AWS Cloud.