Amazon.com は、世界最大のオンライン小売店です。2011 年に、Amazon.com は同社の Oracle データベースのバックアップに関して、それまでのテープバックアップから Amazon Simple Storage Service(Amazon S3)を使う方式に切り替えました。その結果、複雑さが軽減されて資本的支出が削減され、バックアップと復元が高速になり、バックアップ/アーカイブ用テープのキャパシティプランニングが不要になりました。さらに、管理スタッフが解放されて、より高価値の業務に専念できるようになりました。それまでのバックアップテープインフラストラクチャをクラウドベースの Amazon S3 ストレージに置き換えることによって、バックアップソフトウェアが不要になり、パフォーマンスは 12 倍に向上し、復元に要する時間は、条件によっては約 15 時間から 2.5 時間にまで短縮されました。

Amazon.com が成長するにつれてその Oracle データベースも成長を続けており、維持しているデータベースの数も膨大なものとなっています。それにより、従来の Oracle データベースからテープへのバックアップに関係する負荷が大きくなり、Amazon.com の関連会社であるアマゾン ウェブ サービス(AWS)のクラウドサービスを使用することを含めた代替方針を検討することになりました。Amazon.com が直面していたビジネス上の課題は次のようなものです。

  • 利用率および容量の計画は複雑であり、時間と資本支出予算は貴重です。過去何年にもわたり、テープ用ハードウェア、そのハードウェアを収めるデータセンターの空間、テープソフトウェアのエンタープライズライセンス料金に大きな資本支出が必要でした。その間、テープインフラストラクチャを管理するために、高度なスキルを持つスタッフが、より高い価値を持つプロジェクトを犠牲にして設定、認証、アーカイブ計画の作成に時間を割く必要がありました。また、会計年度末ごとに、今後必要になる容量を予測するために、時間のかかる監査、予測、予算作成が必要でした。
  • そして、忘れがちですが、複数のテープデバイスに対応したバックアップソフトウェアの費用もかかるのです。テープロボットは基本的な読み取り/書き込み機能を備えていますが、それを完全に活かすには、独自のテープバックアップソフトウェアに投資しなければなりません。Amazon.com において、ソフトウェアの費用はそれまでも大きく、全体のバックアップ費用を大きく押し上げていました。このソフトウェアの費用は継続的に予算上の重荷となっていましたが、バックアップをテープデバイスに書き込む必要がある限り、対処の難しい問題でした。
  • 信頼のあるバックアップを維持し、データを取得する際にはスピードと効率が確保できるようにするには、テープでは多くの時間と労力が必要だったのです。データをテープで確実に保存するためには、複数のコピーが必要です。すべてが正しく機能し、テープリソースの競合が最小限で済めば、テープロボットとバックアップソフトウェアは必要なデータを簡単に見つけ出すことができます。しかし、ハードウェア障害が発生すると、テープから復元するために人間が介入することが要求されます。複数のユーザーのテープリクエストによってテープドライブの競合が発生すると、復元プロセスはさらに時間がかかります。これによって目標復旧時間(RTO)が増大し、それを達成することはクラウドストレージへの場合に比べて難しくなります。

Amazon.com は、データバックアップに関する経済面およびパフォーマンス面の向上に向けて Amazon S3 の評価を開始しました。この評価の一部として、Amazon S3 バックアップのセキュリティ、可用性、およびパフォーマンスの各面が考慮されました。また、Amazon S3 への移行が財務的に価値を持つことを確認するために、費用便益分析も行いました。この費用便益分析には、以下の要素が含まれていました。

  • パフォーマンス上の優位性と費用の競争力。バックアップの総合的な費用が増えなかったという点は重要です。同時に、Amazon.com は今までよりもバックアップとリカバリの速度が向上することを求めました。バックアップとリカバリの操作に必要な時間と労力はテープに比べて大幅に改善し、Amazon S3 からの復元はテープから行う同様の復元の 2 倍から 12 倍高速であることがわかりました。Amazon.com は新しいバックアップメディアについて、総費用を維持または削減したままパフォーマンスを向上させるように求めました。オンプレミスのディスクベースストレージにバックアップすればパフォーマンスは向上していたと考えられますが、費用競争力を失います。Amazon S3 のクラウドベースストレージは、両方の基準を満たしました。
  • 高い堅牢性と可用性。Amazon S3 は、任意の 1 年間について 99.999999999% のオブジェクト堅牢性を提供するよう設計されています。Amazon.com は、そうした数値をテープインフラストラクチャの場合と比較し、Amazon S3 が大きな改善をもたらすと判断しました。
  • 操作負荷の低減。Amazon.com の DBA は、Amazon S3 バックアップは自分たちのデータベースバックアップに適しているかどうか評価を迫られました。彼らは、Amazon S3 が Oracle RMAN とシームレスに機能するため、これをバックアップに使用することは実装が容易であると判断しました。
  • 強固なデータセキュリティ。Amazon.com は、AWS が物理的なセキュリティ、セキュリティ認定、セキュリティプロセス、使用中および不使用時のデータの保護、適切な暗号化標準について、自分たちの要件をすべて満たしていることを確認しました。

Amazon S3 への移行がまだ完了する前の段階で、Amazon.com は次のような利点に気付きました。

  • 複雑で時間のかかるテープ容量計画の廃止。Amazon.com はそれ自体の成長と買収の両面から毎年成長し、動きが大きくなっています。AWS によって Amazon.com はこの急拡大に対応でき、しかもシームレスな対応が可能になりました。過去を振り返ると、Amazon.com のビジネスグループは毎年、その年に使用する予定のテープストレージの量とテープリソースを使用する頻度を数値化して、バックアップ計画を作成しなければなりませんでした。その計画を使用することによって各組織はテープの利用に対して課金され、費用が多数のチームに配分されました。Amazon S3 では、チームは単に自分たちが利用する分を支払うだけで、使用量に基づいて請求されます。Amazon S3 に格納できるデータの量は実質的に上限がなく、そのためリソースを使い切ることを心配しなくて済みます。Amazon S3 バックアップを採用しているチームでは、正式な計画作成はほぼ不要になりました。
  • 資本支出の削減。テープロボット、テープドライブ、テープの在庫、データセンターのスペース、ネットワーキング機器、エンタープライズバックアップソフトウェアを購入することも、テープの消費を予測することも不要になりました。これにより、資本的設備のためにあらかじめ予算を組む重荷がなくなり、資本支出も解消します。
  • 復元するデータがすぐに入手可能 – 物理的なテープを探して取得することは不要。DBA がテープからデータを復元する場合には、遅れが生じます。テープバックアップソフトウェアは、テープカタログを読み込み、復元する正しいファイルを見つけ、正しいテープの場所を特定し、テープをマウントし、そこからデータを読み取る必要があります。ほとんどすべての場合、データは複数のテープに分散しており、これがさらに遅れの原因になります。複数のユーザーのテープリクエストによって発生したテープドライブの競合がこれに組み合わされると、プロセスはさらに時間がかかります。このことは、データセンターが停止して多数のデータベースを同時に、しかもできるだけ早く復元しなければならないときなど、差し迫った事態の際には特に厳しくなります。このような問題は、Amazon S3 ではどれも起こりません。データの復元は待ち時間やテープのキューイングなしでただちに開始されるため、データベースの復旧は大幅に早く行われます。
  • Amazon S3 への出てのバックアップは、テープドライブの 2 倍から 12 倍の速さです。一例として、ある DBA が行ったベンチマークテストでは、3.8 TB をギガビットイーサネットを経由して 2.5 時間で復元できました。これは 25 GB/分、422 MB/秒に相当します。さらに Amazon.com は RMAN データ圧縮を使用しているため、実質的な復元レートは 3.37 GB/秒でした。この 2.5 時間という数字は、控えめに見積もってもテープからの復元では 10~15 時間に相当します。
  • Oracle RMAN から Amazon S3 へのバックアップの容易な実装。DBA によると、データベースから Amazon S3 へのバックアップは簡単に開始できます。Oracle RMAN から Amazon S3 にバックアップするように指示するために必要なのは、Oracle Secure Backup Cloud(SBC)モジュールだけです。Oracle SBC モジュールを構成するために必要な手間は、1 つのデータベースにつき 1 時間以内でした。1 回だけのこの設定の後では、データベースのバックアップは透過的に Amazon S3 に対して行われました。
  • Amazon S3 によって提供される堅牢なデータストレージはイレブン 9 の堅牢性による設計。Amazon.com では、テープインフラストラクチャに障害が発生することがありました。テープの破損、テープドライブの故障、ロボット部品の故障などです。これは DBA がデータベースを復元しようとしているときに発生することもあり、その場合、平均復旧時間(MTTR)を大きく増大させてしまいます。Amazon S3 ではその堅牢性と可用性から、こうした問題を考慮する必要がなくなります。
  • 貴重なヒューマンリソースの解放。テープインフラストラクチャの場合、Amazon.com は大規模なテープバックアップ実装の経験があるエンジニアを探さなければなりませんでした。専門性があってベンダー固有のスキルセットを備えている人材であり、見つけるのは困難です。また、データセンターの技術者を雇い、ハードウェアに関する問題解決とトラブルシューティングを任せる必要がありました。ドライブの交換、テープの入れ替え、テープの配送と追跡などです。Amazon S3 ではそうした専門家を日々の運用から解放できるので、彼らはより価値の高い、ビジネスに欠かせないエンジニアリングタスクに従事できます。
  • オフサイトへの物理的なテープ搬送の廃止。Oracle のバックアップデータをオフサイトに保管してきた企業は、テープをオフサイトに搬送し、セキュリティを確保して保管するための費用を厳しく見つめる必要があります。これらの費用は、Amazon S3 にデータを保管することで削減でき、ゼロにできる可能性もあります。

世界最大のオンライン小売業者である Amazon.com は、カスタマーエクスペリエンスを向上し、できるだけ低価格で商品を提供するために、革新を続けています。そのような革新の 1 つが、データベースバックアップをテープから Amazon S3 ストレージに置き換えることでした。このイノベーションは、Oracle データベースをテープにバックアップしている他の組織でも簡単に再現することができます。

AWS でのバックアップとストレージの詳細については、http://aws.amazon.com/backup-storage/ をご覧ください。