AWS DataSync により、大量のオンラインデータを、オンプレミスストレージと Amazon S3 または Amazon Elastic File System (Amazon EFS)、Amazon FSx for Windows File Server との間で、簡単かつ迅速に移動できます。データ転送に関連する手動作業により、移行に時間がかかり、IT 運用に負担がかかる場合があります。DataSync は、スクリプトコピージョブ、転送のスケジュールの作成とモニター、データ認証、ネットワーク利用の最適化などを含むこれらの作業の多くを、省略あるいは自動で処理します。DataSync ソフトウェアエージェントは Network File System (NFS) と Server Message Block (SMB) ストレージに接続しますので、お客様がアプリケーションを修正する必要はありません。DataSync は容量百テラバイト単位、ファイル数百万個単位のデータを、インターネットまたは AWS Direct Connect リンクを通して、オープンソースツールの 10 倍の速さで転送できます。DataSync によって、AWS にアクティブなデータセットやアーカイブを移行し、タイムリーな分析や処理のためクラウドにデータを転送したり、ビジネス継続性のために AWS にデータを複製することができます。DataSync を始めるのは簡単です。DataSync のエージェントをデプロイし、ファイルシステムに接続し、AWS ストレージリソースを選択して、データ転送を開始します。転送したデータに対してのみ料金が発生します。
利点
転送の簡素化と自動化
AWS DataSync を使用すると、オンプレミスストレージと AWS 間のネットワークでのデータ転送が簡単になります。DataSync は、データ転送プロセスと、高性能で安全なデータ転送に必要なインフラストラクチャの両方の管理を自動化します。また、このサービスには自動暗号化とデータも含まれています。これらすべてにより、高速で信頼性が高く安全な転送に必要な社内の開発と管理が最小限に抑えられます。
データを 10 倍速く移動
ネットワーク経由で AWS へ素早くデータを転送し、オープンソースのツールの場合と比べて最大 10 倍の速さでデータを転送します。DataSync は、専用のネットワークプロトコルとパラレル、マルチスレッドアーキテクチャを使用して、転送を高速化します。これにより移行、分析や機械学習のためのデータ処理ワークフローの繰り返し、データ保護プロセスがスピードアップされます。
運用コストの削減
DataSync の一定で、ギガバイト単位の価格設定を活用すると、データを費用効果の高い方法で移行することができます。また、スクリプトの開発と管理のコストを節約でき、費用がかかる商用の転送ツールが不要になります。
仕組み
ユースケース
データ移行
データセンターの閉鎖や、ストレージアレイの廃止を行う場合、DataSync を使用すれば、アクティブなデータセットやアーカイブを、ネットワーク経由で Amazon S3、Amazon EFS または Amazon FSx for Windows File Server に速やかに移行することができます。DataSync は、完全な初期コピーと、変化するデータの増分転送の両方を行います。また、暗号化と整合性のチェックが含まれているため、データは安全、無傷で、すぐに使用できる状態で転送されます。DataSync を使用して、AWS Snowball Edge と並行してアクティブで変化するデータをコピーし、静的データを Amazon S3 に移行することができます。
ハイブリッドワークロードのためのデータ処理
処理のために AWS の内外に移動する必要があるデータをオンプレミスシステムで生成または使用している場合、DataSync を使用して転送を高速化およびスケジュールすることができます。メディアやエンターテイメントのビデオ制作、石油およびガスの地震探査、ライフサイエンスの機械学習、金融のビッグデータ分析など、アクティブなファイルを AWS に迅速に移行する必要がある業界で、重要なハイブリッドクラウドワークフローのスピードアップに役立ちます。
コールドデータのアーカイブ化
高価なオンプレミスストレージシステムに大量のコールドデータが保存されている場合、このデータを Amazon S3 Glacier または Amazon S3 Glacier Deep Archive などの耐久性のある安全な長期ストレージに直接移動できます。これにより、オンプレミスのストレージ容量を解放し、レガシーストレージシステムをシャットダウンできます。
データ保護
大規模なネットワークアタッチトストレージ (NAS) システムを使用している場合は、レプリケーションまたはセカンドハードウェアスタックへのバックアップのいずれかによって保護するファイルがたくさんある可能性があります。DataSync を使用すると、すべての Amazon S3 ストレージクラスにファイルをレプリケートし、ニーズに合わせて最も費用対効果の高いストレージクラスを選択することができます。または、スタンバイファイルシステム用に Amazon EFS または Amazon FSx for Windows File Server にデータを送信できます。
「Celgene では、研究チームが癌やその他の重篤な状態に対する治療の発見と開発に熱心に取り組んでいます。AWSは、イノベーションプロセスの不可欠な部分であり、当社の IT チームにとって、可能な限り多くの AWS のサービスを使用することは、新薬発見の支援の妨げとなるインフラストラクチャやツールの運用およびコストという負担を排除してくれることを意味します。当社のラボでは、ペタバイト単位のデータ (置き換え不可能な知的財産) が生成され、AWS DataSync を使用してAmazon S3 や Amazon EFS にデータを簡単、迅速、コスト効率よく転送しています。AWS にデータがなければ、速やかな革新を実現する方法はありません。AWS DataSync は既存のストレージシステムと連携し、可能な限り多くの帯域幅を効率的に使用して、データを安全に AWS に取り込みます。」
Lance Smith 氏、研究コンピューティング担当ディレクター - Celgene
ニュース
- 日付