Tape Ark

Tape Ark e AWS inventam uma solução de arquivamento pronta para uso

2021

A Tape Ark tem a missão de ajudar as organizações a gerenciar seus dados de backup e documentos corporativos antigos, aproveitando a análise de dados, a inteligência artificial (IA) e o machine learning (ML). Como especialista líder mundial em migração de fita para nuvem, tendo processado mais de cinco milhões de fitas de dados até o momento, a Tape Ark agora está ajudando os clientes a assumir o controle dos dados em papel.

Para muitos setores, armazenar documentos é uma exigência legal da atividade comercial, mas o setor de gerenciamento de documentos (no valor de USD 529 milhões somente na Austrália, de acordo com o IBIS World) está pronto para mudanças.

“Na maioria das vezes, as empresas tendem a perder a noção do que está dentro de cada caixa. Isso dificulta a tomada de decisões sobre o descarte de caixas ou a digitalização de documentos. À medida que o tempo passa e a coleção de caixas de arquivo cresce, o problema se torna ainda mais complicado”, diz Guy Holmes, presidente e CEO da Tape Ark.

Um dos clientes da Tape Ark, por exemplo, tem mais de um milhão de caixas armazenadas, e sua coleção remonta à década de 1930.

“Percebemos que armazenar documentos em papel em caixas de arquivo é um problema para muitas empresas. Para decidir quais documentos manter, digitalizar ou destruir, normalmente elas procuram digitalizar todos os documentos ou levar as caixas de arquivo de volta ao escritório para que um especialista no assunto revise manualmente cada caixa. A opção padrão é não fazer nada, mas isso significa pagar taxas mensais de armazenamento em um futuro próximo. Já estávamos usando IA e ML em outras áreas do nosso negócio quando tivemos a ideia de usar essas ferramentas para inventar uma ‘solução mais inteligente’, com a qual eles pudessem saber o que está dentro de cada caixa por uma fração do custo”, diz Guy.

Hardware electronic circuit board. technology style concept semiconductor motherboard computer server cpu
kr_quotemark

A equipe da ProServe nos apresentou uma nova forma de pensar, um conjunto de produtos emergentes da AWS, e foi extremamente colaborativa. Não acreditamos que exista uma solução como o Rapid Box Indexer em nenhum lugar do mundo.

Guy Holmes
Presidente e diretor executivo, Tape Ark

As principais etapas da jornada de machine learning da Tape Ark: Descoberta, Entrega, Escala

A jornada de machine learning da Tape Ark começou com um workshop de descoberta em julho de 2020 liderado pela equipe de AWS Professional Services (ProServe). Uma equipe dedicada de cientistas de dados, engenheiros e especialistas em negócios se reuniu para desenvolver um “esquema de ML”, descrevendo as principais etapas e iterações. Em dezembro, a Tape Ark estava pronta para implantar uma prova de conceito chamada Rapid Box Indexer.

O Rapid Box Indexer permite que as organizações visualizem o conteúdo das caixas arquivadas de longe por meio do portal do cliente da Tape Ark. É o primeiro serviço desse tipo, de acordo com Guy.

“Até agora, as empresas precisavam recuperar fisicamente as caixas de depósitos externos para auditar seu conteúdo. Cada caixa era aberta por um membro da equipe, que examinava, documentava ou digitalizava itens manualmente antes de adicioná-los a uma planilha ou banco de dados. Uma única caixa, dependendo do conteúdo, podia levar mais de uma hora para ser indexada e documentada manualmente. Multiplique isso por dezenas ou centenas de milhares de caixas, o que é típico de grandes organizações, e você terá infinitas horas de trabalho”, diz Guy.

Para automatizar esse processo, o Rapid Box Indexer usa machine learning para indexar e registrar o conteúdo da caixa. O software de análise inteligente de imagem e vídeo também é usado para categorizar informações e adicionar metadados, fornecendo insights muito mais profundos do que os métodos tradicionais de indexação.

Explicação sobre o conjunto de inovações de IA e ML da AWS da Tape Ark

“A equipe da ProServe foi incrível”, diz Guy. “Ela nos apresentou uma nova forma de pensar, um conjunto de produtos emergentes da AWS, e foi extremamente colaborativa. É ótimo trabalhar com uma equipe que pensa da mesma forma, que pensa grande e que realmente quer resolver o problema do cliente”.

Juntos, a Tape Ark e o ProServe criaram o Rapid Box Indexer usando o Amazon Textract, que usa machine learning para extrair texto, manuscritos e dados de praticamente qualquer documento, da mesma forma que uma pessoa faria. O Amazon Rekognition é usado para automatizar a análise de imagens e vídeos usando software de machine learning e reconhecimento de fala, enquanto o Amazon Comprehend permite a detecção de entidades e a análise de sentimentos. O Amazon S3 é usado para armazenar e proteger dados, enquanto o Amazon Lambda permite um processamento de informações muito rápido.

Agora, os usuários podem “ver” dentro de cada caixa usando três camadas de dados (vídeos, imagens e texto) por meio do portal Tape Ark, junto com tags pesquisáveis. Com essas informações, é muito mais fácil decidir quais documentos manter, digitalizar ou destruir. Os usuários também podem auditar caixas muito depois de o vídeo, as imagens e o texto serem capturados, sem lembrar de uma única caixa.

“Em nossa opinião, é como ter todas as suas caixas externas com você no local para folhear o conteúdo conforme necessário. Isso permite que nossos clientes aproveitem tudo o que desejam encontrar”, diz Guy.

Aumento de escala: levando o Rapid Box Indexer da Tape Ark para o mundo

Depois de desenvolver uma prova de conceito na Austrália, a Tape Ark agora está testando o Rapid Box Indexer em suas instalações em Houston, nos Estados Unidos.

“Atualmente, estamos usando o Rapid Box Indexer para processar 7.500 caixas, o que é uma escala razoável para nosso primeiro piloto. O feedback do cliente nos ajudará a refinar o indexador e torná-lo ainda mais valioso. Em 2021, começaremos a lançá-lo em massa”, diz Guy.

“Nosso objetivo é expandir o Indexer para atender às necessidades de qualquer setor e responder a algumas das perguntas mais difíceis sobre gerenciamento de documentos. Podemos priorizar documentos para digitalização? Isso ajudará a reduzir o tamanho do armazenamento de arquivos de caixas físicas? Como isso reduzirá os custos mensais de armazenamento?”

De acordo com as comparações da AWS, o Rapid Box Indexer pode ser até 20 vezes mais barato do que os sistemas de arquivamento tradicionais. Essa estimativa é baseada nos custos de armazenamento de caixas em armazéns, que são “significativamente maiores do que os custos de digitalização e armazenamento de dados na nuvem”, explica Guy.


Sobre a Tape Ark

A Tape Ark está trazendo o gerenciamento de dados de fitas de arquivo externas para o século 21, migrando com segurança dados corporativos antigos da mídia de fita diretamente para a nuvem pública. Ao adotar tecnologias de armazenamento de dados digitais e virtuais, a Tape Ark está reimaginando a forma como os dados físicos são armazenados externamente, trazendo o armazenamento físico em fita para o novo milênio.

Benefícios

  • Reduz os custos de armazenamento físico em até 20 vezes.
  • Fornece três camadas de dados: texto, imagem e vídeo. Os usuários podem ver de longe o que está dentro de cada caixa, textual e visualmente.
  • Simplifica e automatiza tarefas de baixo valor, como entrada e indexação de dados, para impulsionar a eficiência dos negócios.

Serviços da AWS usados

Amazon Textract

O Amazon Textract é um serviço de machine learning totalmente gerenciado que facilita a extração de texto impresso, manuscritos e dados de praticamente qualquer documento.

Saiba mais »

Amazon Rekognition

O Amazon Rekognition facilita a adição de análises de imagem e vídeo às aplicações usando a tecnologia comprovada e altamente escalável de aprendizado profundo que não exige conhecimentos de machine learning para ser usada.

Saiba mais »

Amazon Comprehend

O Amazon Comprehend é um serviço de processamento de linguagem natural (PLN) que usa machine learning para encontrar insights e relações em textos.

Saiba mais »

Amazon S3

O Amazon S3 é um serviço de armazenamento de objetos que oferece escalabilidade, disponibilidade de dados, segurança e performance líderes do setor.

Saiba mais »


Comece a usar

Empresas de todos os portes em todos os setores estão transformando seus negócios diariamente usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a Nuvem AWS hoje mesmo.