Tape Ark

Tape Ark 和 AWS 合作開發即時可用的存檔解決方案

2021 年

Tape Ark 的使命是利用資料分析、人工智慧 (AI) 和機器學習 (ML),幫助組織管理其備份資料和持續老化的企業文件。作為全球領先的磁帶到雲端遷移專家,Tape Ark 迄今已處理超過 500 萬個資料磁帶,並且如今正在協助客戶控制其紙質資料。

對於許多產業來說,儲存文件是經營業務的法律要求,而根據 IBIS World 的資料,僅在澳洲,文件管理產業的規模就高達 5.29 億美元 — 引發業界劇變的時機已然成熟。

「多數情況下,公司往往忘了每個存檔箱裡有什麼內容。這就很難針對存檔箱的處置或文件掃描做出決定。隨著時間的流逝,他們的存檔箱收集量持續增加,問題也變得更加棘手,」Tape Ark 總裁兼執行長 Guy Holmes 表示。

例如,Tape Ark 的一位客戶儲存了超過一百萬個存檔箱,收集日期甚至可以追溯到上世紀 30 年代。

「我們意識到,將紙質文件儲存在存檔箱裡是很多公司面臨的一個痛點。為了決定保存、數位化或銷毀哪些文件,他們過去往往選擇掃描所有文件,或將存檔箱帶回辦公室,讓領域專家手動檢查每個箱子。他們通常會選擇不採取任何行動,但這意味著在可預見的將來需要支付每月倉儲費用。當我們打算使用 AI 和 ML 開發一種更智慧的解決方案,藉由它們了解每個箱子裡面的內容並降低存檔成本時,我們已經在其他業務領域採用了 AI 和 ML。」Guy 表示。

Hardware electronic circuit board. technology style concept semiconductor motherboard computer server cpu
kr_quotemark

ProServe 團隊為我們介紹了一種新的思維方式、一套新推出的 AWS 產品,並且與我們密切合作... 我們認為,世界上沒有一種解決方案可以與 Rapid Box Indexer 相媲美。

Guy Holmes
Tape Ark 總裁兼執行長 Scott Collison

Tape Ark 機器學習之旅中的關鍵步驟:探索、交付、擴展

Tape Ark 的機器學習之旅始於 2020 年 7 月,由 AWS Professional Services (ProServe) 團隊主持的一次探索研討會。由資料科學家、工程師和業務專家組成的專業團隊,一起擬訂了一幅概述關鍵步驟和反覆運作的「ML 藍圖」。到了 12 月,Tape Ark 已準備好部署名為 Rapid Box Indexer 的概念驗證。

組織可憑藉 Rapid Box Indexer,透過 Tape Ark 的客戶入口網站從遠端檢視存檔箱的內容。在 Guy 看來,這項服務開創了歷史先河。

「到目前為止,各公司必須親自從異地倉儲取回存檔箱,以便審核它們的內容。每個箱子都由工作人員打開,他們需要手動檢查、記錄或掃描其中的物項,然後將其新增至試算表或資料庫中。一個箱子視其內容而定,可能需要超過一個小時的時間才能完成手動編列索引和記錄的工作。如果考慮成千上萬乃至數十萬個箱子 (這在大型組織中司空見慣),就需要花費數不勝數的工作時間,」Guy 說道。

為了自動化此程序,Rapid Box Indexer 使用機器學習來為箱子內容編列索引和做記錄。智慧影像和影片分析軟體也用於分類資訊和新增中繼資料,提供比傳統的編列索引方法更深入的洞察。

釋放 Tape Ark 的 AWS AI 和 ML 創新套件的巨大潛力

「ProServe 團隊非常出色,」Guy 說道,「他們向我們介紹了一種新的思維方式、一套新推出的 AWS 產品,並且與我們密切合作。與一個志同道合,思維開闊並且真正願意為客戶排疑解難的團隊合作,感覺太棒了。」

Tape Ark 和 ProServe 一道使用 Amazon Textract 建置了 Rapid Box Indexer,該產品可以運用機器學習,像人類般從幾乎任何文件中擷取文字、手寫內容和資料。Amazon Rekognition 利用機器學習和語音識別軟體自動化影像和影片分析,透過 Amazon Comprehend 則可以實現實體偵測和情緒分析。Amazon S3 用於儲存和保護資料,Amazon Lambda 則可支援非常快速的資訊處理。

使用者現在可以透過 Tape Ark 入口網站以及可搜尋的標籤,使用三個資料層,即影片、影像和文字,來「查看」每個箱子裡的內容。有了這些資訊,要做出保存、數位化或銷毀文件的決定就變得容易多了。他們還可以在擷取影片、影像和文字很久之後,無需召回任何一個箱子即可對其進行稽核。

「在我們看來,這就像是將所有放置在別處的箱子全部搬到現場,讓您可以根據需要瀏覽它們的內容。這樣,我們的客戶就能專注於他們想要查找的任何內容,」Guy 說道。

擴大規模:將 Tape Ark 的 Rapid Box Indexer 推向全世界

在澳洲開發概念驗證後,Tape Ark 如今正在位於美國休斯頓的設施進行 Rapid Box Indexer 試點。

「我們目前正在使用 Rapid Box Indexer 處理 7,500 個箱子,這對我們的首次試點來說是個合理的規模。客戶的意見回饋將幫助我們精細化該索引器並進一步提升它的價值。2021 年,我們開始大面積推廣這款工具,」Guy 說道,

「我們的目標是擴展這款索引器,以滿足任何產業的需求,並回答一些最難回答的文件管理問題,例如:我們是否可以設定文件的數位化優先順序? 這是否有助於減小儲存實體箱存檔的規模? 這將如何降低每月倉儲成本?」

根據 AWS 的比較結果,Rapid Box Indexer 可以將成本降至傳統存檔系統的 20 分之一。這項估計是以在倉儲中儲存箱子的成本為基礎,而這些成本「遠高於數位化和在雲端儲存資料的成本,」Guy 解釋道。


關於 Tape Ark

Tape Ark 將持續老化的企業資料安全地從磁帶媒體直接遷移到公有雲端,將異地存檔磁帶資料的管理提升到了 21 世紀的水準。透過採用數位和虛擬資料儲存技術,Tape Ark 正在重塑在異地儲存實體資料的方式,將實體磁帶的儲存提升到新千年的水準。

優勢

  • 實體倉儲成本最多降至 20 分之一。
  • 提供三層資料 — 文字、影像和影片,使用者可以採用文字和視覺方式,從遠端查看每個箱子裡的內容。
  • 簡化並自動化資料錄入和編列索引等低價值的工作,以提高業務效率。

使用的 AWS 服務

Amazon Textract

Amazon Textract 是一種全受管的機器學習服務,可從幾乎任何文件中輕鬆擷取列印的文字、手寫內容和資料。

進一步了解 »

Amazon Rekognition

Amazon Rekognition 採用經過驗證、高度可擴展的深度學習技術,讓您無需使用任何機器學習專業知識,即可輕鬆地在應用程式中加入影像和影片分析。

進一步了解 »

Amazon Comprehend

Amazon Comprehend 是一項自然語言處理 (NLP) 服務,使用機器學習來尋找文字中的洞見與關係。

進一步了解 »

Amazon S3

Amazon S3 是一種物件儲存服務,提供領先業界的可擴展性、資料可用性、安全性及效能。

進一步了解 »


開始使用

各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始 AWS 雲端之旅。