Tape Ark

Tape Ark と AWS がすぐに利用できるアーカイブソリューションを考案

2021 年

Tape Ark は、データ分析、人工知能 (AI)、機械学習 (ML) を活用して、組織がバックアップデータや古くなった企業ドキュメントを管理できるようにサポートすることを使命としています。Tape Ark は、テープからクラウドへの移行をサポートできる世界有数のエキスパートとして、これまでに 500 万を超えるデータテープを処理してきました。現在は、顧客が紙ベースのデータを管理できるようサポートしています。

多くの業界にとって、文書の保管は事業活動を行う上での法的要件となっていますが、文書管理のセクター (IBIS World によると、オーストラリアだけで 5 億 2,900 万 USD の価値があるとされている) ではディスラプションの機が熟しています。

「しばしば、企業は各ボックスの中に何が入っているのかがわからなくなってしまいます。このため、ボックスの処分や文書のスキャンに関する決定を下すことが困難になります。時間が経ち、アーカイブボックスの量が増えるにつれて、問題はさらに手に負えなくなっていきます」と Tape Ark の President and Chief Executive Officer である Guy Holmes 氏は述べています。

例えば、Tape Ark のある顧客は、100 万個を超えるボックスを保管しており、最も古いものは 1930 年代から保管しています。

「紙の文書をアーカイブボックスに保管することは、多くの企業にとって課題となっていることに気付きました。どの文書を保存するか、デジタル化するか、破棄するかを決定するために、企業がこれまで検討の選択肢としていたのは、すべての文書をスキャンするか、またはアーカイブボックスをオフィスに持ち帰り、対象分野のエキスパートに手動ですべてのボックスを確認してもらうことでした。デフォルトのオプションは何もしないことですが、これは予見可能な将来にわたって毎月の倉庫保管料を負担することを意味します。当社は、ビジネスの他の分野で既に AI と ML を使用している中で、これらのツールを使用して、よりスマートなソリューションを発明し、各ボックスの中に何が入っているかをわずかなコストで知ることができるようにするというアイデアを思いつきました」と Holmes 氏は述べています。

Hardware electronic circuit board. technology style concept semiconductor motherboard computer server cpu
kr_quotemark

ProServe チームは、非常に協力的で、新しい考え方や一連の新しい AWS 製品を当社に紹介してくれました。Rapid Box Indexer のようなソリューションは世界中のどこにもないと思います。

Guy Holmes 氏
Tape Ark、President and Chief Executive Officer

Tape Ark の機械学習ジャーニーにおける主要なステップ: 現状把握、実現、スケール

Tape Ark の機械学習ジャーニーは、AWS プロフェッショナルサービス (ProServe) チームが主導する 2020 年 7 月の現状把握ワークショップから始まりました。データサイエンティスト、エンジニア、ビジネスエキスパートで構成される専任チームは、主要なステップとイテレーションの概要を示す「ML ブループリント」を策定しました。12 月までに、Tape Ark では Rapid Box Indexer と呼ばれる概念実証をデプロイする準備が整いました。

Rapid Box Indexer を使用すると、組織は、Tape Ark の顧客ポータルを介して、離れた場所からでも、アーカイブされたボックスの中身を表示できます。Holmes 氏によると、Rapid Box Indexer は、この種のサービスの先駆けとなりました。

「これまで、企業はボックスの中身を監査するために、倉庫からそのボックスを物理的に取り出す必要がありました。スタッフが各ボックスを開けて、スプレッドシートやデータベースに追加する前に、それらの内容を手動で検査、文書化、またはスキャンします。1 つのボックスにおいて、その中身によっては、手動でインデックスを付けて文書化するのに 1 時間以上かかる場合があります。数十万とは言わずとも、大規模な組織では一般的な数である数万のボックスがあるので、作業時間はいくらあっても足りません」と Holmes 氏は述べています。

このプロセスを自動化するために、Rapid Box Indexer は機械学習を使用して、ボックスの中身にインデックスを付け、記録します。また、インテリジェントな画像および動画分析ソフトウェアは、情報を分類したり、メタデータを追加したりするためにも使用され、従来のインデックス作成方法と比較してはるかに深いインサイトを提供します。

Tape Ark の AWS AI および ML イノベーションのスイートを実現する

「ProServe チームはすばらしい仕事をしてくれました」と Holmes 氏は述べています。「チームは非常に協力的であり、新しい考え方や一連の新しい AWS 製品を当社に紹介してくれました。広い視野で考え、顧客の問題に真剣に対処したいと考えている、志を同じくするチームと仕事ができるのはすばらしいことです」。

Tape Ark と ProServe は協力して、Amazon Textract を利用して Rapid Box Indexer を構築しました。Rapid Box Indexer は機械学習を使用して、人間と同じように、事実上あらゆる文書からテキスト、手書き文字、データを抽出します。Amazon Rekognition は機械学習と音声認識ソフトウェアを使用して画像と動画の分析を自動化するために利用され、Amazon Comprehend はエンティティの検出と感情分析を可能にします。Amazon S3 はデータの保存と保護に使用され、Amazon Lambda は非常に高速な情報処理を可能にします。

ユーザーは、Tape Ark ポータル経由で動画、画像、テキストの 3 つのデータレイヤーと検索可能なタグを使用して、各ボックスの内部を「見る」ことができるようになりました。この情報があれば、どの文書を保管するか、デジタル化するか、破棄するかを決定するのがはるかに簡単になります。また、動画、画像、テキストがキャプチャされてから長期間が経過した後でも、ボックスを 1 つも取り出すことなく監査することもできます。

「当社の考えでは、これはオフサイトのボックスをすべてオンサイトに保持し、必要に応じて中身を調べることが可能になるようなものです。これにより、お客様は探しているものに集中できます」と Holmes 氏は述べています。

スケールアップ: Tape Ark の Rapid Box Indexer を世界へ

Tape Ark はオーストラリアで概念実証を開発した後、現在米国のヒューストンの施設で Rapid Box Indexer を試験運用しています。

「当社は現在、Rapid Box Indexer を利用して 7,500 個のボックスを処理しています。これは、最初のパイロットとしては妥当な規模です。お客様からいただくフィードバックを参考に、Indexer を改良して、さらに価値を高めていきます。2021 年には、大規模なロールアウトを開始する予定です」と Holmes 氏は述べています。

「当社は、あらゆる業界のニーズを満たすように Indexer を拡張し、文書管理に関する極めて難しい質問のいくつか、すなわち、デジタル化を実現するために、文書に優先順位を付けることはできるか、 物理的なボックスのアーカイブの保管規模の削減に役立つのか、 月々の倉庫保管コストがどのように削減されるのか、というような質問に答えることを目標としています」

AWS の比較によると、Rapid Box Indexer を使用することで、従来のアーカイブシステムと比較して、コストを最大 20 分の 1 に抑えることができる可能性があります。この推定は、倉庫にボックスを保管するコストに基づいています。このようなコストは、「データをデジタル化してクラウドに保管するコストよりも大幅に高い」と Holmes 氏は説明します。


Tape Ark について

Tape Ark は、古くから存在する企業データをテープ媒体からパブリッククラウドに直接安全に移行することで、オフサイトのアーカイブテープデータの管理を現代に合わせて変革します。デジタルおよび仮想データストレージテクノロジーを採用することで、物理データをオフサイトに保管する方法を革新し、物理テープストレージを新世紀で活用できるようにします。

メリット

  • 物理的な倉庫保管コストを最大 20 分の 1 に削減します。
  • テキスト、画像、動画の 3 つのデータレイヤーが提供され、ユーザーは離れた場所からでも、各ボックスの内容をテキストで、および視覚的に確認できます。
  • データ入力やインデックス作成など、付加価値の少ないタスクを簡素化および自動化し、ビジネスの効率を高めます。

利用している AWS のサービス

Amazon Textract

Amazon Textract は、事実上あらゆる文書から印刷されたテキスト、手書きの文書、およびデータを簡単に抽出するフルマネージド機械学習サービスです。

詳細 »

Amazon Rekognition

Amazon Rekognition では、機械学習の専門知識を必要とせずに、実績のある高度にスケーラブルな深層学習テクノロジーを利用して、アプリケーションに画像および動画分析を簡単に追加できます。

詳細 »

Amazon Comprehend

Amazon Comprehend は、機械学習を使用してテキスト内でインサイトや関係性を検出する自然言語処理 (NLP) サービスです。

詳細 »

Amazon S3

Amazon S3 は、業界最高水準のスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。

詳細 »


使用を開始する

あらゆる業界のさまざまな規模のお客様が、AWS を活用してビジネスを日々変革しています。当社のエキスパートにお問い合わせの上、今すぐ AWS クラウドジャーニーを開始しましょう。