全般

Q: AWS DataSync とは何ですか?

A: AWS DataSync は、インターネットや AWS Direct Connect を介して、ストレージシステムと Amazon S3 や Amazon EFS などの AWS ストレージサービスとの間での大量のデータのコピーを簡素化、自動化、高速化するオンラインデータ転送サービスです。

Q: AWS DataSync を使用するメリットは何ですか?

A: AWS DataSync を使用すると、オープンソースツールを使用してカスタムソリューションを構築したり、高価な商用ネットワークアクセラレーションソフトウェアのライセンスを取得して管理したりすることなく、数百万のファイルで大規模なデータセットを移動、コピー、同期することができます。DataSync は、アクティブなデータの 1 回限りの移行、データ処理ワークフローの定期的な配布、またはビジネス継続性のための継続的なレプリケーションに使用できます。

Q: DataSync はどのような問題を解決しますか?

A: DataSync は、オンラインデータ転送の複雑さとコストを低減し、オンプレミスストレージシステムと Amazon S3 または Amazon Elastic File System (EFS) との間でのデータセットの転送を簡単にします。DataSync は、標準ストレージプロトコル (NFS) を使用して既存のストレージシステムやデータソースに接続し、専用ネットワークプロトコルとスケールアウトアーキテクチャを使用して AWS との間の転送を高速化します。DataSync は、データの移動、転送の進捗状況のモニタリング、データ転送の暗号化と検証、および障害の顧客への通知などのすべてのタスクを自動的にスケールし、処理します。DataSync では、コピーしたデータの量に対してだけ支払うことになり、最低料金や前払いの義務はありません。

Q: データは、どことの間で転送できますか?

A: DataSync は、NFS サーバー、Amazon S3 バケット、およびAmazon EFS ファイルシステム間でデータをコピーできます。

設定

Q: DataSync の使用を開始するにはどうすればよいですか?

A: AWS マネジメントコンソールで数回のクリックをするか、AWS コマンドラインインターフェイス (CLI) を使用することで、DataSync を使用してデータを転送することができます。使い始めるには、DataSync のエージェントをデプロイし、転送元と転送先のストレージロケーションを設定し、コピーを開始します。

Q: DataSync のエージェントをデプロイするにはどうすればよいですか?

A: DataSync のエージェントを VMware ESXi ハイパーバイザーまたは Amazon EC2 にデプロイします。オンプレミス NFS サーバーとの間でデータをコピーするには、AWS コンソールから OVA をダウンロードし、オンプレミスの VMware ESXi ハイパーバイザーにデプロイします。クラウド内 NFS サーバーとの間でデータをコピーするには、提供されている AMI から Amazon EC2 インスタンスを作成できます。どちらの場合も、エージェントは NFS サーバーにアクセスできるようにデプロイする必要があります。

Q: DataSync のエージェントのリソース要件はどのようなものですか?

A: エージェントを実行するために最低限必要なリソースは、こちらで見つけることができます。

使用

Q: DataSync の使用方法について教えてください。

A: DataSync を使用するには、以下の 3 つのステップに従ってください。

1.エージェントのデプロイ - DataSync のエージェントをデプロイし、マネジメントコンソールまたは API を使用して、AWS アカウントに関連付けます。エージェントは、NFS サーバーにアクセスして、データを読み込んだり、書き込んだりするために使用されます。

2.データ転送タスクの作成 - データソースと転送先の場所、およびファイルメタデータのコピーなど転送を設定するために使用するオプションを指定して、タスクを作成します。

3.転送の開始 - タスクを開始し、コンソールまたは Amazon CloudWatch でデータの移動を監視します。

Q: DataSync タスクを開始するにはどうすればよいですか?

A: DataSync は、AWS マネジメントコンソールまたは AWS コマンドラインインターフェイス (CLI) を使用してタスクを開始すると、データをコピーします。タスクが実行されるたびに、転送元で変更がスキャンされ、転送元と転送先での相違のコピーが実行されます。変更された内容を判別するために使用する転送元の特性を設定し、特定のファイルやフォルダを含めたり除外したりするためのフィルターを定義し、転送元にファイルやオブジェクトがない場合に転送先で削除する必要があるかどうかを制御することができます。

Q: DataSync は、どのようにしてデータの整合性の検証を実行しますか?

A: DataSync は、転送中および転送終了時の両方でデータの整合性の検証を実行します (転送元ファイルと転送先ファイルのチェックサムの比較、ファイルメタデータの比較)。

Q: DataSync によって転送されているデータの状態は、どのようにすればモニタリングできますか?

A: AWS マネジメントコンソールまたは CLI を使用して、転送されているデータのステータスをモニタリングできます。Amazon CloudWatch メトリクスを使用すると、コピーされたファイルの数およびデータの量を確認できます。詳細なエラー情報については、Amazon CloudWatch Logs を利用できます。さらに、タスクの状態の遷移に応じて CloudWatch Events がトリガーされ、従属しているワークフローを自動化できます。AWS マネジメントコンソールまたは CLI で、転送の進行状況などの追加情報を確認できます。

Q: Amazon S3 との間でファイルを転送する場合、DataSync はファイルとオブジェクトをどのようにマッピングしますか?

A: ファイルをオブジェクトにコピーする場合、ファイルとオブジェクトの間には 1 対 1 の関係があります。ファイルシステムメタデータは、S3 のユーザーメタデータに保存されます。ファイルシステムメタデータを含むオブジェクトがファイルにコピーして戻されると、メタデータが復元されます。

Q: データの転送時に、DataSync はどのメタデータを保持しますか?

A: DataSync は、ユーザ ID、グループ ID、アクセス許可などの POSIX メタデータを保存し、このメタデータを失うことなく元の場所にファイルを復元できるようにします。さらに、S3 のオブジェクトのファイルから POSIX メタデータを保存する場合、メタデータはファイルゲートウェイと相互運用可能です。

Q: DataSync では、バージョニング、ライフサイクル、クロスリージョンレプリケーション、S3 イベント通知を使用できますか?

A: はい。バージョニング、ライフサイクル管理、クロスリージョンレプリケーション、S3 イベント通知に関するバケットポリシーは、DataSync を通して、バケットに転送されたオブジェクトに直接適用されます。

バージョニングを使用する場合、オブジェクトメタデータへの変更によってオブジェクトの新しいバージョンが作成されることに注意してください。

S3 ライフサイクルポリシーを使用して、オブジェクトのストレージ階層の変更や、古いオブジェクトまたはオブジェクトバージョンの削除を行うことができます。

Q: DataSync のタスクが中断されると、どうなりますか?

A: タスクが中断された場合 (ネットワーク接続が切断された、DataSync のエージェントが再起動された場合など)、タスクの次の実行で不足しているファイルが転送され、この実行が終わるとデータは完全かつ一貫性のあるものになります。タスクが開始されるたびに、増分コピーが実行され、変更部分だけが転送元から転送先に転送されます。

Q: AWS Direct Connect で DataSync を使用できますか?

A: はい。Direct Connect リンクで DataSync を使用すると、特別な設定をせずにパブリックインターネットのエンドポイントにアクセスできます。

Q: ファイル転送時に DataSync はソースディレクトリ構造を保持しますか?

A: はい。ファイルを転送するとき、DataSync は転送元に、転送元のロケーションの構造に似たディレクトリ構造を作成します。

パフォーマンス

Q:  DataSync がファイルシステムを AWS にコピーする速度はどれくらいですか?

A: DataSync が特定のデータセットをコピーできる速度は、データの量、転送元と転送先のストレージから得られる I/O 帯域幅、使用可能なネットワーク帯域幅、およびネットワーク条件によって異なります。単一の DataSync のエージェントで、10 Gbps のネットワークリンクが飽和します。

Q:  DataSync のタスクが使用するネットワーク帯域幅の量をコントロールできますか?

A: はい。組み込みの帯域幅スロットルを設定することで、DataSync が使用するネットワーク帯域幅の量をコントロールできます。これにより、同じネットワーク接続に依存している他のユーザーやアプリケーションへの影響を最小限に抑えることができます。

Q:  DataSync は、転送元ファイルシステムのパフォーマンスに影響しますか?

A: オンプレミスのファイルストアの容量と転送されるファイルの数とサイズによっては、エージェントがそのストレージからデータを読み書きするため、同じソースデータストアにアクセスするときに DataSync が他のクライアントの応答時間に影響することがあります。タスクの帯域幅制限を設定すると、ストレージシステムに対する I/O を制限することで、この影響を軽減できます。

セキュリティとコンプライアンス

Q: データは、転送中および保存中に暗号化されていますか?

A: はい。転送元と転送先の間で転送されるすべてのデータは、Transport Layer Security (TLS、Secure Sockets Layer (SSL) の代替) を使用して暗号化されます。データは、DataSync 自体に保持されることはありません。このサービスは、S3 バケットのためのデフォルトの暗号化の使用と保存中のデータの Amazon EFS ファイルシステムの暗号化の使用をサポートしています。

Q: DataSync は、NFS ファイルシステムにどのようにアクセスしますか?

A: DataSync は、IT 環境あるいは Amazon EC2 にデプロイするエージェントを使用して、NFS プロトコルを通じてファイルシステムにアクセスします。これらのエージェントは AWS 内の DataSync サービスエンドポイントに接続し、アクティブ化されると AWS マネジメントコンソールまたは CLI から安全に管理されます。設備との間でデータをコピーする場合、VPN/トンネルを設定したりインバウンド接続を許可したりする必要はなく、標準のネットワークポートを使用してファイアウォールを通過しルーティングされるようにエージェントを設定することができます。

Q: DataSync は、Amazon S3 バケットにどのようにアクセスしますか?

A: DataSync は、設定した IAM ロールを使用して Amazon S3 バケットにアクセスします。

Q: DataSync は、Amazon EFS ファイルシステムにどのようにアクセスしますか?

A: DataSync は、NFS プロトコルを使用して Amazon EFS ファイルシステムにアクセスします。これは、DataSync サービスによって管理される Elastic Network Interfaces (ENI) の VPC 内からファイルシステムをマウントすることで行われます。DataSync は、ユーザーの代わりにこうした ENI の作成、使用、削除を完全に管理します。

Q:  DataSync は、どのコンプライアンスプログラムをサポートしていますか?

A: AWS には、クラウドで最も長く実行されているコンプライアンスプログラムがあり、顧客が要件をナビゲートできるよう支援することをコミットしています。DataSync は、世界および業界のセキュリティ基準に適合していると評価されています。PCI DSS、ISO 9001270012701727018SOC 1、2、および 3 に適合しており、さらに HIPAA 対応です。これにより、お客様が AWS のセキュリティを確認し、ご自身の義務を果たすことが容易になります。詳細情報およびリソースについては、コンプライアンスのページを参照してください。また、コンプライアンスプログラムによる対象範囲内のサービスのページにアクセスして、サービスおよび認定の一覧を参照することも可能です。

Q:  DataSync は PCI に準拠していますか?

A: はい。DataSync は PCI-DSS に準拠しており、支払い情報の転送に使用できます。AWS Artifact で PCI コンプライアンスパッケージをダウンロードして、AWS で PCI 準拠を実現する方法の詳細をご覧いただけます。

Q:  DataSync は、HIPAA 対応ですか?

A: はい。DataSync は HIPAA 対応です。つまり、AWS で HIPAA BAA を使用している場合、DataSync を使用して保護されるべき医療情報 (PHI) を転送できます。

AWS DataSync をいつ選択するか

Q:  DataSync は、rsync や S3 sync などのコマンドラインツールを使用するのとどう違うのですか?

A: コマンドラインツールを中心に構築された DIY ソリューションと比較すると、DataSync は完全マネージド型の自動化されたデータ転送を提供します。専用のネットワークプロトコルとスケールアウトアーキテクチャを使用して、最大 10 倍の速度でデータを転送します。

具体的には、DataSync はデータ転送を完全に自動化します。 再試行とネットワーク耐障害性メカニズム、DataSync API とコンソールによるモニタリング、CloudWatch メトリクスが組み込まれており、イベントおよびログを使って転送プロセスを詳細に確認できます。DataSync は、転送中と転送終了時の両方でデータの整合性検証を実行します。このサービスは、帯域幅のスロットリング、ソースのアクセス許可やメタデータのコピーなど、特定のニーズに合わせた柔軟な構成もサポートしています。

DataSync はエンドツーエンドのセキュリティを提供します: 転送元と転送先の間で転送されるすべてのデータは TLS を介して暗号化され、AWS ストレージへのアクセスは IAM ロールなどの組み込みの AWS セキュリティメカニズムを介して有効になります。

Q: AWS DataSync と AWS Snowball Edge のどちらを選択したらよいですか?

A: AWS Snowball Edge は、すぐに AWS でデータを必要としないか、帯域幅が制限されているか、リモート、切断された、または厳しい環境からデータを転送するお客様に適しています。DataSync は、アクティブなデータセットのオンライン移行、継続的に生成されるデータのタイムリーな転送、またはビジネス継続性のためのレプリケーションが必要なお客様に最適です。

Q:  AWS DataSync と AWS Storage Gateway のどちらを選択したらよいですか?

A: S3 や EFS などのオンプレミスおよび AWS ストレージ間でデータを転送する場合は、DataSync が適しています。DataSync は一般的に、AWS で処理するためのカメラや機器など、オンプレミスデバイスからのデータの定期的でタイムリーな転送、あるいはストレージの移行に使用されます。オンプレミスから AWS 内のデータへの低レイテンシーアクセスを探している場合は、AWS Storage Gateway が適しています。Storage Gateway は一般的に、バックアップ、ハイブリッドワークロード、レイテンシーの影響を受けやすいオンプレミスアプリケーション、オフィス間でのコンテンツ配信、および S3 内のオブジェクトへのファイルベースのアクセスに使用されています。

Storage Gateway のファイルゲートウェイ構成と DataSync を組み合わせることで、レイテンシーの影響を受けやすいアプリケーションのオンプレミスアクセスを維持しながら、オンプレミスストレージをすばやく AWS に移動できます。

Q: AWS DataSync と Amazon S3 Transfer Acceleration のどちらを選択したらよいですか?

A: アプリケーションが既に Amazon S3 API に統合されていて、大きなファイルを S3 に転送するために高いスループットが必要な場合は、S3 Transfer Acceleration が適しています。既存のストレージシステム (ネットワーク接続ストレージなど) や変更できない機器 (DNA シーケンサー、ビデオカメラなど) からデータを転送する場合や、複数の転送先が必要な場合は、DataSync を使用します。DataSync はまた、内臓の再試行とネットワーク耐障害性メカニズム、データの整合性検証、および帯域幅のスロットリング、ソースのアクセス許可やメタデータのコピーなどのニーズに合わせた柔軟な設定といった追加機能を提供することで、データ転送を自動化および簡素化します。

Q: AWS DataSync と AWS Transfer for SFTP のどちらを選択したらよいですか?

A: 現在 SFTP を使用して第三者とデータを交換している場合、Transfer for SFTP は、運用上の負担を軽減しながら、Amazon S3 との間で直接管理される完全マネージド型の SFTP 転送を提供します。

NFS、Amazon S3、および Amazon EFS 間の高速で自動化されたデータ転送が必要な場合は、DataSync が適しています。DataSync は、アクティブなデータセットのオンライン移行、継続的に生成されるデータのタイムリーな転送、またはビジネス継続性のためのレプリケーションが必要なお客様に最適です。 

移行に DataSync を使用する

Q: DataSync を使用して移行する方法について教えてください。

A: DataSync を使用して、オンプレミスストレージから Amazon S3、Amazon EFS、WorkDocs に移行できます。推奨される移行フローについての詳細は、こちらをご覧ください。

Q:  DataSync を使用して WorkDocs に移行する方法を教えてください。

A: DataSync は WorkDocs Migration Service の一部です。DataSync を使用すると、ホームディレクターや部署の共有物を WorkDocs に簡単にすばやく移行できます。

DataSync の料金の詳細
料金の詳細を確認する

AWS DataSync の料金はシンプルで予測可能な使用ベースであり、コピーするデータ量に対してのみ料金が発生します。 

詳細 
AWS アカウントにサインアップする
無料のアカウントにサインアップする

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
コンソールで DataSync の使用を開始する
コンソールでデータの移動を開始する

AWS コンソールで AWS DataSync を使用して構築を開始します。

サインイン