Tape Ark y AWS inventan una solución de archivado inmediata
2021
Tape Ark se ha propuesto ayudar a las organizaciones a administrar sus datos de copia de seguridad y documentos corporativos antiguos mediante el análisis de datos, la inteligencia artificial (IA) y el machine learning (ML). Como especialista líder mundial en migración de cintas a la nube, tras haber procesado más de cinco millones de cintas de datos hasta la fecha, Tape Ark ayuda ahora a sus clientes a tomar el control de sus datos en papel.
Para muchos sectores, almacenar documentos es un requisito legal de su actividad empresarial. Sin embargo, el sector de la gestión de documentos, cuyo valor asciende a 529 millones de USD solo en Australia, según IBIS World, está listo para la disrupción.
«En la mayoría de los casos, las empresas tienden a perder la noción de lo que hay dentro de cada caja. Esto dificulta la toma de decisiones sobre la eliminación de cajas o el escaneado de documentos. A medida que pasa el tiempo y crece su colección de cajas de archivo, el problema se hace aún más difícil de manejar», afirma Guy Holmes, President y Chief Executive Officer en Tape Ark.
Uno de los clientes de Tape Ark, por ejemplo, tiene más de un millón de cajas almacenadas y su colección se remonta a los años treinta.
«Nos dimos cuenta de que el almacenamiento de documentos de papel en cajas de archivo es un problema para muchas empresas. Para decidir qué documentos conservar, digitalizar o destruir, tradicionalmente las empresas intentan escanear todos los documentos o llevar las cajas de archivo a su oficina para que un experto en la materia revise manualmente cada caja. La alternativa más habitual es no hacer nada, pero eso implica tener que pagar una cuota mensual de almacenamiento en un futuro cercano. Ya estábamos utilizando IA y ML en otras áreas de nuestra empresa cuando se nos ocurrió la idea de utilizar estas herramientas para inventar una solución más inteligente en la que pudieran saber lo que hay dentro de cada caja por una fracción del coste», afirma Guy.
El equipo de ProServe nos presentó una nueva forma de pensar, un conjunto de productos novedosos de AWS y se mostró extremadamente colaborador… No creemos que exista una solución como Rapid Box Indexer en ningún lugar del mundo.
Guy Holmes
President y Chief Executive Officer de Tape Ark
Pasos clave en el viaje hacia el machine learning de Tape Ark: descubrimiento, entrega, escalabilidad
El viaje hacia el machine learning de Tape Ark comenzó con un taller de descubrimiento en julio de 2020 dirigido por el equipo de AWS Professional Services (ProServe). Un equipo especializado de científicos de datos, ingenieros y expertos empresariales se reunió para desarrollar un «Plan de ML», en el que se esbozaban los pasos e iteraciones clave. En diciembre, Tape Ark estaba lista para desplegar una prueba de concepto llamada Rapid Box Indexer.
Rapid Box Indexer permite a las organizaciones ver el contenido de las cajas archivadas en remoto a través del portal de clientes de Tape Ark. Se trata del primer servicio de este tipo, asegura Guy.
«Hasta ahora, las empresas tenían que recuperar físicamente las cajas de los almacenes externos para auditar su contenido. Un miembro del personal abre cada caja, examina manualmente, documenta o escanea los artículos antes de añadirlos a una hoja de cálculo o base de datos. Una sola caja, dependiendo de su contenido, puede tardar más de una hora en indexarse y documentarse manualmente. Multiplíquelo por decenas de miles —si no cientos de miles— de cajas, que es lo habitual en las grandes organizaciones, y tendrá por delante interminables horas de trabajo», afirma Guy.
Para automatizar este proceso, Rapid Box Indexer utiliza el machine learning para indexar y registrar el contenido de las cajas. También se utilizan programas de análisis inteligente de imágenes y vídeos para categorizar la información y añadir metadatos, lo que proporciona una visión mucho más variada que los métodos de indexación tradicionales.
Descubra el conjunto de innovaciones de IA y ML de AWS para Tape Ark
«El equipo de ProServe fue increíble», afirma Guy. «Nos presentaron una nueva forma de pensar, un conjunto de productos novedosos de AWS y se mostraron extremadamente colaboradores. Es estupendo trabajar con un equipo con ideas afines que piensa a lo grande y realmente quiere resolver el problema del cliente».
Juntos, Tape Ark y ProServe crearon Rapid Box Indexer con Amazon Textract, que utiliza el machine learning para extraer texto, texto manuscrito y datos de prácticamente cualquier documento como lo haría una persona. Amazon Rekognition se utiliza para automatizar el análisis de imágenes y vídeos mediante machine learning y software de reconocimiento de voz, mientras que Amazon Comprehend permite la detección de entidades y el análisis de opiniones. Amazon S3 se utiliza para almacenar y proteger datos, mientras que Amazon Lambda permite un procesamiento muy rápido de la información.
Ahora los usuarios pueden «ver» el interior de cada caja utilizando tres capas de datos: vídeos, imágenes y texto a través del portal Tape Ark, junto con etiquetas de búsqueda. Con esta información, es mucho más fácil decidir qué documentos conservar, digitalizar o destruir. También pueden auditar las cajas mucho después de capturar el vídeo, las imágenes y el texto, sin necesidad de recuperar ni una sola caja.
«Desde nuestro punto de vista, es como tener todas las cajas que se almacenan fuera de las instalaciones a mano para poder hojear su contenido cuando sea necesario. Esto permite a nuestros clientes centrarse en lo que están buscando», afirma Guy.
Escalabilidad: Rapid Box Indexer de Tape Ark llega a todo el mundo
Tras desarrollar una prueba de concepto en Australia, Tape Ark está probando ahora Rapid Box Indexer desde sus instalaciones de Houston (Estados Unidos).
«Actualmente estamos utilizando Rapid Box Indexer para procesar 7500 cajas, que es un escalado razonable para nuestro primer proyecto piloto. Los comentarios de los clientes nos ayudarán a perfeccionar Indexer y hacerlo aún más valioso. En 2021 empezaremos a desplegarlo de forma masiva», afirma Guy.
«Nuestro objetivo es ampliar Indexer para satisfacer las necesidades de cualquier sector y responder a algunas de las preguntas más difíciles de la gestión de documentos: ¿Se puede dar prioridad a la digitalización de documentos? ¿Ayudará esto a reducir el tamaño de los archivos de cajas físicas? ¿Cómo reducirá esto los costes mensuales de almacenamiento?»
Las comparaciones de AWS muestran que Rapid Box Indexer puede ser hasta 20 veces más barato que los sistemas de archivo tradicionales. Esta estimación se basa en los costes de almacenar cajas en almacenes, que son «significativamente más altos que los costes de digitalizar y almacenar datos en la nube», explica Guy.
Acerca de Tape Ark
Tape Ark lleva al siglo XXI la gestión de datos de archivo en cinta fuera de las instalaciones, al migrar de forma segura los datos corporativos antiguos de los soportes de cinta directamente a la nube pública. Al adoptar tecnologías de almacenamiento de datos digitales y virtuales, Tape Ark está reinventando la forma en que los datos físicos se almacenan fuera de las instalaciones, llevando el almacenamiento físico en cinta al nuevo milenio.
Beneficios
- Reduce hasta 20 veces los costes de almacenamiento físico.
- Proporciona tres capas de datos: texto, imagen y vídeo. Los usuarios pueden ver lo que hay dentro de cada caja, textual y visualmente, en remoto.
- Simplifica y automatiza las tareas de poco valor, como la introducción de datos y la indexación, para impulsar la eficacia empresarial.
Servicios de AWS utilizados
Amazon Textract
Amazon Textract es un servicio de machine learning totalmente administrado que facilita la extracción de texto impreso, texto manuscrito y datos de prácticamente cualquier documento.
Amazon Rekognition
Amazon Rekognition facilita que se pueda añadir el análisis de imágenes y vídeos a las aplicaciones con tecnología probada, altamente escalable y de aprendizaje profundo que no requiere experiencia en machine learning para su uso.
Amazon Comprehend
Amazon Comprehend es un servicio de procesamiento de lenguaje natural (NLP) que utiliza machine learning para encontrar información y relaciones en textos.
Amazon S3
Amazon S3 es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.
Introducción
Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contacte con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.