全般

Q: AWS DataSync とは何ですか?

A: AWS DataSync は、オンプレミスストレージシステムと AWS ストレージサービス間で、および AWS ストレージサービス間での大規模なデータのコピーを簡素化、自動化、および高速化するオンラインデータ転送サービスです。DataSync は、Network File System (NFS)、Server Message Block (SMB) ファイルサーバー、セルフマネージドオブジェクトストレージ、AWS Snowcone、Amazon Simple Storage Service (Amazon S3) バケット、Amazon Elastic File System (Amazon EFS) ファイルシステム、そして Amazon FSx for Windows ファイルサーバーファイルシステムとの間でデータをコピーできます。

Q: AWS DataSync を使用するメリットは何ですか?

A: AWS DataSync を使用すると、オープンソースツールを使用してカスタムソリューションを構築したり、高価な商用ネットワークアクセラレーションソフトウェアのライセンスを取得して管理したりすることなく、数十億のファイルからなる大規模なデータセットをコピーすることができます。DataSync を使用して、AWS との間でアクティブなデータを移行したり、オンプレミスのストレージ容量を解放するためにデータをアーカイブしたり、ビジネス継続性を確保する目的で AWS にデータをレプリケートしたり、分析や処理を目的としてクラウドにデータを転送したりできます。

Q: AWS DataSync はどのような問題を解決しますか?

A: AWS DataSync は、オンラインデータ転送の複雑さとコストを低減し、オンプレミスストレージシステムと AWS ストレージサービスの間、および AWS ストレージサービス間でのデータセットの転送を簡単にします。DataSync は、標準のストレージプロトコル (NFS、SMB) を使用して、または Amazon S3 API を使用して、既存のストレージシステムおよびデータソースに接続します。専用のネットワークプロトコルとスケールアウトアーキテクチャを使用して、ストレージシステムと AWS のサービス間のデータ転送を高速化します。DataSync は、ファイルとオブジェクトの移動、データ転送のスケジューリング、転送の進行状況の監視、暗号化、データ転送の検証、顧客への問題の通知を自動的にスケーリングおよび処理します。DataSync では、コピーしたデータの量に対してだけ支払うことになり、最低料金や前払いの義務はありません。

Q: どこにデータを転送し、どこからデータの転送を受けることができますか?
A: AWS DataSync は、Network File System (NFS)、Server Message Block (SMB) ファイルサーバー、セルフマネージドオブジェクトストレージ、AWS Snowcone、Amazon Simple Storage Service (Amazon S3) バケット、Amazon Elastic File System (Amazon EFS) ファイルシステム、そして Amazon FSx for Windows ファイルサーバーファイルシステムとの間でデータを転送できます。

Q: AWS DataSync を使用してデータを AWS に移行するにはどうすればよいですか?

A: AWS DataSync を使用して、オンプレミスのデータを Amazon S3、Amazon EFS、および Amazon FSx for Windows ファイルサーバーに移行できます。DataSync を設定して、データセット全体の初期コピーを作成し、オンプレミスから AWS への最終的なカットオーバーまで、変更データの後続の増分転送をスケジュールします。また、DataSync には暗号化と整合性の検証が含まれているため、データは安全、無傷で、すぐに使用できる状態で転送されます。ネットワーク接続に依存するワークロードへの影響を最小限に抑えるために、移行を時間外に実行するようにスケジュールしたり、組み込みの帯域幅スロットルを構成して DataSync が使用するネットワーク帯域幅の量を制限したりできます。 DataSync は、類似したメタデータ構造を持つストレージシステム間でメタデータを保持し、エンドユーザーとアプリケーションをスムーズに移行して、ターゲットの AWS ストレージサービスを使用できるようにします。移行のベストプラクティスとヒントについては、ストレージのブログである AWS DataSync を使用したストレージの移行をお読みください。

Q: AWS DataSync を使用してコールドデータをアーカイブするにはどうすればよいですか?

A: AWS DataSync を使用して、コールドデータをオンプレミスストレージシステムから、Amazon S3 Glacier または Amazon S3 Glacier Deep Archive などの耐久性のある安全な長期ストレージに直接移動できます。DataSync のフィルタリング機能を使用して、一時ファイルや一時フォルダをコピーから除外したり、あるいは送信元からファイルのサブセットだけをコピーしたりできます。ニーズに合わせて最も費用対効果の高いストレージサービスを選択できます。任意の S3 ストレージクラスにデータを転送するか、Amazon EFS 低頻度アクセスストレージクラス (EFS IA) にデータを保存するために EFS Lifecycle Management で DataSync を使用します。組み込みのタスクスケジューリング機能を使用して、ログ、生映像、電子医療記録などのコンプライアンスまたは監査目的で保持する必要があるデータを定期的にアーカイブします。 

Q: AWS DataSync を使用して、ビジネスの継続性のためにデータを AWS にレプリケートするにはどうすればよいですか?

A: AWS DataSync を使用すると、あらゆる Amazon S3 ストレージクラスに定期的にファイルをレプリケートしたり、スタンバイファイルシステムのデータを Amazon EFS または Amazon FSx for Windows ファイルサーバーに送信したりできます。組み込みのタスクスケジューリング機能を使用して、データセットへの変更が送信先ストレージに定期的にコピーされるようにします。AWS DataSync を利用したデータ保護については、こちらの AWS ストレージブログをお読みください。

Q: 進行中のワークフローでオンプレミスと AWS 間の定期的な転送に AWS DataSync を使用するにはどうすればよいですか?

A: AWS DataSync を使用して、オンプレミスシステムと AWS の間で継続的に転送して処理できます。DataSync は、アクティブなファイルを AWS にすばやく移動させる必要がある業界で重要なハイブリッドクラウドストレージワークフローを高速化するのに役立ちます。これには、ライフサイエンス業界での機械学習、メディアとエンターテインメント業界での動画制作、金融サービス業界でのビッグデータ分析、石油とガス業界での地震研究などがあります。DataSync はタイムリーな配信を提供し、依存するプロセスが遅延しないようにします。タスク実行時に毎回転送されるファイル、フォルダ、オブジェクトを決定するため、除外フィルター、包含フィルター、またはその両方を指定できます。

Q: AWS DataSync を使用してデータレイクを構築できますか?

A: はい。AWS DataSync では、オンプレミスのデータセットを Amazon S3 に自動転送することで、簡単にデータレイクを構築することができます。DataSync では、標準的なストレージプロトコル (NFS、SMB)、または Amazon S3 API を使用して、データセット全体を簡単かつ迅速に転送することができます。最初にデータセットを転送した後、オンプレミスから AWS への新しいデータの転送をスケジュールすることができます。また、DataSync には暗号化と整合性の検証が含まれているため、データは安全、無傷で、すぐに使用できる状態で転送されます。ネットワーク接続に依存するワークロードへの影響を最小限に抑えるために、移行を業務時間外に実行するようにスケジュールしたり、組み込みの帯域幅スロットルを構成して DataSync が使用するネットワーク帯域幅の量を制限したりすることができます。Amazon S3 にデータが保存されると、ネイティブの AWS のサービスを利用して、ビッグデータ分析、人工知能 (AI)、機械学習 (ML)、ハイパフォーマンスコンピューティング (HPC)、ならびにメディアデータ処理を行うアプリケーションを実行し、非構造化データセットからインサイトを得ることができます。 データレイクの構築と活用の詳細については、AWS データレイクストレージのウェブページを参照してください。

Q: AWS DataSync を使用して AWS ストレージサービス間でデータを転送するにはどうすればよいですか?

A: DataSync を使用して、同じ AWS アカウント内の Amazon S3、Amazon EFS、または Amazon FSx for Windows ファイルサーバー間でファイルまたはオブジェクトを転送できます。同じ AWS リージョン内の AWS のサービス間、中国を除く異なる商用 AWS リージョン内のサービス間、または AWS GovCloud (米国東部と米国西部) リージョン間でデータを転送できます。これには DataSync エージェントをデプロイする必要はなく、AWS DataSync コンソール、AWS コマンドラインインターフェイス (CLI)、または AWS Software Development Kit (SDK) を使用してエンドツーエンドで設定できます。

Q: AWS DataSync を使用して Amazon WorkDocs に移行できますか?

A: はい。AWS DataSync は、移行に使用する Amazon S3 バケットへのファイルのアップロードを自動化することにより、Amazon WorkDocs Migration Service で必要なステップをすばやく実行できるようにします。DataSync を使用すると、ホームディレクトリや部署の共有物を WorkDocs に簡単にすばやく移行できます。 WorkDocs への移行に DataSync を使用する方法については、ブログ記事「AWS DataSync を使用した Amazon WorkDocs へのネットワークファイル共有の移行」を参照してください。

使用法

Q: AWS DataSync の使用はどのように開始できますか?

A: AWS マネジメントコンソールで数回クリックするか、AWS コマンドラインインターフェイス (CLI) を使用することで、AWS DataSync を使用してデータを転送することができます。開始するには、次の 3 つの手順を実行します。

1.オンプレミスストレージシステムと AWS ストレージサービス間でデータを転送するには、エージェントをデプロイします - DataSync エージェントをデプロイし、マネジメントコンソールまたは API を介して AWS アカウントに関連付けます。エージェントは、NFS サーバー、SMB ファイル共有、またはセルフマネージドオブジェクトストレージにアクセスして、データを読み込んだり、書き込んだりするために使用されます。 同じ AWS アカウント内の AWS ストレージサービス間でデータを転送するためにエージェントをデプロイする必要はありません。

2.データ転送タスクの作成 - データソースと転送先の場所、および目的のタスクスケジュールなど、転送を設定するために使用するオプションを指定して、タスクを作成します。

3.転送の開始 - タスクを開始し、コンソールまたは Amazon CloudWatch でデータの移動を監視します。

Q: AWS DataSync のエージェントをデプロイするにはどうすればよいですか?

A: AWS DataSync のエージェントを、使用しているオンプレミスハイパーバイザーまたは Amazon EC2 にデプロイします。オンプレミスサーバーとの間でデータをコピーするには、AWS コンソールからエージェント仮想マシンイメージをダウンロードし、オンプレミスの VMware ESXi、Linux カーネルベースの仮想マシン (KVM)、または Microsoft Hyper-V ハイパーバイザーにデプロイします。DataSync エージェントを使用する場合、エージェントは NFS、SMB プロトコル、または Amazon S3 API を使用してファイルサーバーにアクセスできるようにデプロイする必要があります。 AWS Outposts バケットの S3 と AWS リージョンの S3 バケット間の転送を設定するには、エージェントを Outpost にデプロイします。AWS Snowcone デバイスと AWS ストレージ間の転送を設定するには、デバイスにプリインストールされている DataSync エージェント AMI を使用します

同じ AWS アカウント内の AWS ストレージサービス間でデータを転送するためにエージェントをデプロイする必要はありません。クラウド内のセルフマネージドファイルサーバーとの間、または異なる AWS アカウントの AWS ストレージサービス間でデータをコピーするには、DataSync エージェント AMI を使用して Amazon EC2 インスタンスを起動します。

Q: AWS DataSync のエージェントのリソース要件はどのようなものですか?

A: エージェントを実行するために最低限必要なリソースは、こちらで見つけることができます。

Q: AWS DataSync データ転送タスクを開始するにはどうすればよいですか?

A: AWS DataSync は、AWS マネジメントコンソールまたは AWS コマンドラインインターフェイス (CLI) を使用してタスクを開始すると、データをコピーします。タスクが実行されるたびに、転送元と転送先で変更がスキャンされ、転送元と転送先でのデータとメタデータの相違のコピーが実行されます。変更された内容を判別するために使用する転送元の特性を設定し、特定のファイルやフォルダを含めたり除外したりするためのフィルターを定義し、転送先のファイルまたはオブジェクトを転送元で変更したときに上書きするか、転送元で見つからなかった場合に削除するかを制御します。

Q: AWS DataSync はコピーされたデータが正しいことをどのように保証しますか?

A: AWS DataSync はデータの転送と保存を行う際に、転送先に書き込まれたデータが転送元から読み出されたデータと一致するかどうかについて完全性チェックを実施します。さらに、オプションの検証チェックを実行して、転送の終了時に送信元と送信先を比較できます。 DataSync は、送信元と送信先に保存されているデータのフルファイルチェックサムを計算して比較します。データセット全体をチェックすることもできますし、DataSync が転送したファイルまたはオブジェクトだけをチェックすることもできます。

Q: AWS DataSync によって転送されているデータの状態は、どのようにすればモニタリングできますか?

A: AWS マネジメントコンソールまたは CLI を使用して、転送されているデータのステータスをモニタリングできます。Amazon CloudWatch メトリクスを使用すると、コピーされたファイルの数およびデータの量を確認できます。 また、個々のファイルの CloudWatch Logs へのロギングを有効にすることで、特定の時間に転送されたものや、DataSync によって実行されたコンテンツの整合性検証の結果を確認することができます。これにより、モニタリング、レポート、トラブルシューティングが簡略化され、関係者にタイムリーな更新を提供できます。AWS マネジメントコンソールまたは CLI で、転送の進行状況などの追加情報を確認できます。

Q: AWS DataSync が転送するファイルとフォルダをフィルタリングできますか?

A: はい。タスク実行時に毎回転送されるファイル、フォルダ、オブジェクトを制限するため、除外フィルター、包含フィルター、またはその両方を指定できます。包含フィルターは、タスクの実行時に含めるべきファイルパスやオブジェクトキーを指定し、転送元と転送先で DataSync がスキャンする範囲を制限します。除外フィルターは、コピーの対象から除外するファイルパスやオブジェクトキーを指定します。フィルターが設定されていない場合は、タスクを実行するたびに、送信元から送信先にすべての変更が転送されます。タスクの作成または更新時に、除外フィルターと包含フィルターの両方を設定できます。タスクの開始時には、タスクに設定されたフィルターを上書きすることができます。DataSync で一般的なフィルターを使用する方法の詳細については、この AWS ストレージのブログをお読みください。

Q: AWS DataSync をスケジュールに従って転送するように設定できますか?

A: はい。AWS DataSync コンソールまたは AWS コマンドラインインターフェイス (CLI) を使用して、繰り返し転送を管理するスクリプトを作成および実行する必要なく、タスクをスケジュールできます。タスクスケジューリングは、設定したスケジュールでタスクを自動的に実行します。コンソールには、毎時、毎日、または毎週のオプションが直接提供されます。これにより、データセットへの変更が自動的に検出され、送信先ストレージにコピーされることを保証できます。

Q: AWS DataSync はファイルをコピーするときにディレクトリ構造を保持しますか?

A: はい。ファイルを転送するとき、AWS DataSync は転送先に転送元ロケーションの構造にあるものと同じディレクトリ構造を作成します。

Q: AWS DataSync のタスクが中断されるとどうなりますか?

A: タスクが中断された場合 (ネットワーク接続が切断された、AWS DataSync のエージェントが再起動された場合など)、タスクの次の実行で不足しているファイルが転送され、この実行が終わるとデータは完全かつ一貫性のあるものになります。タスクが開始されるたびに、増分コピーが実行され、変更部分だけが転送元から転送先に転送されます。

Q: AWS Direct Connect で AWS DataSync を使用できますか?

A: はい。Direct Connect リンクを使う AWS DataSync により、ブリックサービスエンドポイント、またはプライベート VPC エンドポイントへアクセスすることができます。VPC エンドポイントを使用する場合、DataSync エージェントと AWS のサービス間で転送されるデータは、パブリックインターネットを通過せず、パブリック IP アドレスも必要ありません。これにより、ネットワーク経由でコピーするデータのセキュリティが向上します。

Q: AWS DataSync は VPC エンドポイントや AWS PrivateLink をサポートしますか?

A: はい。VPC エンドポイントは、オンプレミスにデプロイされた、またはインクラウドの AWS DataSync エージェントの間で転送されるデータが、パブリックのインターネットを通過しないこと、またはパブリックの IP アドレスを必要としないことを保証するために、使用することができます。VPC エンドポイントを使用すれば、ネットワークトラフィックをAmazon Virtual Private Cloud (Amazon VPC) 内に保つことにより、データのセキュリティを向上させることができます。 DataSync 向けの VPC エンドポイントでは、サポートされている AWS のサービスに VPC をプライベートに接続することを可能にする、可用性の高いスケーラブルな AWS PrivateLink が使用されています。

Q: AWS DataSync で VPC エンドポイント を使うよう設定するにはどうしたらよいですか?

AWS DataSync で VPC エンドポイントを使用するには、選択した VPC で DataSync サービスの AWS PrivateLink インターフェイス VPC エンドポイントを作成し、DataSync エージェントを作成する際、このエンドポイント Elastic Network Interface (ENI) を選択します。エージェントはこの ENI に接続して有効化され、その後、エージェントによって転送されたすべてのデータは設定された VPC 内に保持されます。VPC エンドポイントの設定は、AWS DataSync Console、AWS Command Line Interface (CLI)、もしくは AWS SDK のいずれかにより行えます。詳細については「Using AWS DataSync in a Virtual Private Cloud」をご参照ください。

Amazon S3 との間の転送

Q: Amazon S3 Glacier、Amazon S3 Glacier Deep Archive、またはその他の S3 ストレージクラスにデータをコピーできますか?

A: はい。AWS DataSync で使用する S3 バケットを設定する場合、DataSync がオブジェクトの保存に使用する S3 ストレージクラスを選択できます。DataSync は、S3 標準、S3 Intelligent-Tiering、S3 標準 – 低頻度アクセス (S3 標準 – IA)、S3 1 ゾーン – 低頻度アクセス (S3 1 ゾーン – IA)、Amazon S3 Glacier (S3 Glacier)、Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive) へのデータの直接保存をサポートしています。Amazon S3 ストレージクラスの詳細については、Amazon Simple Storage Service デベロッパーガイドをご覧ください。

オブジェクトごとの最小課金容量より小さいオブジェクトは、S3 標準に保存されます。たとえば、サイズが 0 バイトでメタデータだけを保持するフォルダオブジェクトは、S3 標準に保存されます。ドキュメントで Amazon S3 ストレージクラスを使用する際の検討事項についてお読みください。最小課金容量の詳細については、Amazon S3 料金をご覧ください。

Q: S3 標準 – IA および S3 1 ゾーン – IA ストレージクラスからデータをコピーできますか?

A: はい。AWS DataSync タスクのソースの場所として S3 を使用する場合、サービスは、コピー先にコピーする必要があるすべてのオブジェクトをバケットから取得します。S3 標準 – IA および S3 1 ゾーン – IA ストレージからオブジェクトを取得すると、オブジェクトのサイズに基づいて取得料金が発生します。ドキュメントで、Amazon S3 ストレージクラスを使用する際の検討事項についてお読みください。

Q: S3 Glacier および Amazon S3 Glacier Deep Archive からデータをコピーできますか?

A: AWS DataSync タスクのソースの場所として S3 を使用する場合、サービスは、コピー先にコピーする必要があるすべてのオブジェクトをバケットから取得しようとします。S3 Glacier または S3 Glacier Deep Archive ストレージクラスにアーカイブされたオブジェクトを取得すると、エラーが発生します。アーカイブされたオブジェクトの取得エラーは DataSync によってログに記録され、タスク完了ステータスは失敗になります。ドキュメントで、Amazon S3 ストレージクラスを使用する際の検討事項についてお読みください。

Q: AWS DataSync は、Amazon S3 バケットにどのようにアクセスしますか?

A: AWS DataSync は、お客様が提供する IAM ロールを想定しています。ロールにアタッチするポリシーによって、ロールが実行できるアクションが決まります。DataSync が、お客様に代わってこのロールを自動生成するか、ロールを手動で設定できます。

Q: AWS DataSync は、Amazon S3 のオブジェクトとの間で、どのようにファイルやフォルダの変換を行いますか?

A: ファイルまたはフォルダを Amazon S3 へコピーした場合、ファイルまたはフォルダとオブジェクトの間に、1 対 1 の関係が生じます。ファイルやフォルダのタイムスタンプ、およびユーザー ID、グループ ID、およびアクセス許可を含む POSIX のパーミッションは、S3 のユーザーメタデータに保存されます。NFS 共有では、S3 ユーザーメタデータに保存されているファイルメタデータはファイルゲートウェイと完全に相互利用が可能で、AWS DataSync によって Amazon S3 に保存されているデータへのオンプレミスでのファイルベースアクセスが行えます。

DataSync が、このユーザーメタデータを含むオブジェクトを NFS サーバーにコピーして戻す際には、ファイルのメタデータは復元されます。NFS から S3 にコピーバックするときに、シンボリックリンクとハードリンクも復元されます。

SMB ファイル共有からコピーする際には、デフォルトの POSIX パーミッションが S3 のユーザーメタデータに保存されます。SMB ファイル共有にコピーして戻す際には、DataSync でそのファイル共有にアクセスできるように設定されていたユーザーに基づいて所有権が設定され、デフォルトのパーミッションが割り当てられます。

詳細については、DataSync のファイルとメタデータの保存の方法について説明したドキュメントを参照してください。

Q: セルフマネージドオブジェクトストレージと Amazon S3 の間でオブジェクトを転送するときに保持されるオブジェクトメタデータは何ですか?

A: セルフマネージドオブジェクトストレージと Amazon S3 の間でオブジェクトを転送する場合、DataSync はオブジェクトをオブジェクトメタデータとタグとともにコピーします。

Q: Amazon S3 バケット間でオブジェクトを転送するときに保持されるオブジェクトメタデータは何ですか?

A: Amazon S3 バケット間でオブジェクトを転送する場合、DataSync はオブジェクトをオブジェクトメタデータとタグとともにコピーします。DataSync は、オブジェクト ACL や以前のオブジェクトバージョンなどの他のオブジェクト情報をコピーしません。

Q: AWS DataSync で Amazon S3 ストレージクラスを使用する場合、どの Amazon S3 リクエストおよびストレージコストが適用されますか?

A: 一部の S3 ストレージクラスには、データ取得、最小ストレージ容量、最小ストレージ期間など、コストに影響する可能性のある動作があります。DataSync は、これらの要因に対処するためにデータの管理を自動化し、データ取得を最小限に抑える設定を提供します。

オブジェクトごとの最小容量が請求されるのを回避するために、AWS DataSync は小さなオブジェクトを S3 標準に自動的に保存します。データ取得料金を最小限に抑えるために、特定のタスクによって転送されたファイルのみを検証するように DataSync を構成できます。最小保存期間に関する料金を回避するために、DataSync にはオブジェクトを上書きおよび削除するための制御機能があります。ドキュメントで、Amazon S3 ストレージクラスを使用する際の検討事項についてお読みください。

Q: オブジェクトを AWS Outposts の Amazon S3 バケットとの間でコピーすることはできますか?

A: はい。AWS Outposts の Amazon S3 と AWS リージョン内の Amazon S3 バケットとの間で、オブジェクトのコピーを実行できます。AWS DataSync では、オブジェクトとともにオブジェクトのメタデータとタグもコピーされます。DataSync を Outposts の Amazon S3 バケットにアクセスさせる場合、Outpost に DataSync EC2 をデプロイします

DataSync を Outposts の Amazon S3 に使用する場合、AWS リージョン内の Amazon S3 バケットとの間でのみデータを転送できます。DataSync タスクでサポートされている転送元と転送先の詳細については、ドキュメントを参照してください。

Amazon EFS との間の転送

Q: AWS DataSync は、Amazon EFS ファイルシステムにどのようにアクセスしますか?

A: AWS DataSync は、NFS プロトコルを使用して Amazon EFS ファイルシステムにアクセスします。DataSync サービスは、DataSync サービスによって管理される Elastic Network Interfaces (ENI) の VPC 内からファイルシステムをマウントすることで行われます。DataSync は、ユーザーの代わりにこうした ENI の作成、使用、削除を完全に管理します。

Q: AWS DataSync をすべての Amazon EFS ストレージクラスで使用できますか?

A: はい。AWS DataSync を使用してファイルを Amazon EFS にコピーし、EFS Lifecycle Management を設定して、一定期間アクセスされていないファイルを低頻度アクセス (IA) ストレージクラスに移行できます。

Q: AWS DataSync を使用して、Amazon EFS ファイルシステムを別の AWS リージョンにレプリケートできますか?

A: はい。AWS DataSync を使用して、同じ AWS アカウント内の 2 番目の Amazon EFS ファイルシステムへの Amazon EFS ファイルシステムの定期的なレプリケーションをスケジュールできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Q: NFS 共有と Amazon EFS 間、または 2 つの Amazon EFS ファイルシステム間でデータをコピーするときにどのようなメタデータが保持されますか?

A: AWS DataSync は、ファイルとフォルダのタイムスタンプ、およびユーザー ID、グループ ID、アクセス許可を含む POSIX のパーミッションをコピーします。詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Amazon FSx for Windows ファイルサーバーとの間での転送

Q: AWS DataSync は、Amazon FSx ファイルシステムにどのようにアクセスしますか?

A: AWS DataSync は、SMB プロトコルを使用して Amazon FSx ファイルシステムにアクセスし、AWS コンソールまたは CLI で設定したユーザー名とパスワードで認証を行います。DataSync サービスは、DataSync サービスによって管理される Elastic Network Interfaces (ENI) の VPC 内からファイルシステムをマウントすることで行われます。DataSync は、ユーザーの代わりにこうした ENI の作成、使用、削除を完全に管理します。

Q: SMB 共有と Amazon FSx for Windows ファイルサーバーファイルシステム間、または 2 つの Amazon FSx ファイルシステム間でコピーする際、どのような Windows メタデータが転送されますか?

A: AWS DataSync は、ファイルのタイムスタンプ、ファイル所有者、標準ファイル属性、NTFS 随意アクセスリスト (DACL)、NTFS システムアクセスコントロールリスト (SACL) などの Windows メタデータをコピーします。 詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Q: AWS DataSync を使用して、Amazon FSx for Windows ファイルサーバーファイルシステムを別の AWS リージョンにレプリケートできますか?

A: はい。AWS DataSync を使用して、同じ AWS アカウント内の 2 番目のファイルシステムへの Amazon FSx for Windows ファイルサーバーファイルシステムの定期的なレプリケーションをスケジュールできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

AWS Snowcone 間での転送

Q: AWS Snowcone と AWS ストレージサービス間でデータを転送する方法はどのようなものですか?

A: DataSync エージェントは Snowcone デバイスに AMI としてプリインストールされています。AWS にオンラインでデータを転送するには、AWS Snowcone デバイスを外部ネットワークに接続し AWS OpsHub または CLI を使用して DataSync エージェント AMI を起動します。AWS マネジメントコンソールまたは CLI を使用してエージェントを有効化し、AWS Snowcone の NFS ストアと Amazon S3、Amazon EFS、または Amazon FSx for Windows ファイルサーバーの間でオンラインデータ転送タスクを設定します。

パフォーマンス

Q:  AWS DataSync がファイルシステムを AWS にコピーする速度はどれくらいですか?

A: AWS DataSync が特定のデータセットをコピーできる速度は、データの量、転送元と転送先のストレージから得られる I/O 帯域幅、使用可能なネットワーク帯域幅、およびネットワーク条件によって異なります。オンプレミスと AWS ストレージサービス間のデータ転送では、単一の DataSync タスクで 10 Gbps ネットワークリンクを完全に利用できます。

Q:  AWS DataSync のタスクが使用するネットワーク帯域幅の量をコントロールできますか?

A: はい。組み込みの帯域幅スロットルを設定することで、AWS DataSync が使用するネットワーク帯域幅の量をコントロールできます。 データ転送タスクの実行中に、この制限を増減できます。これにより、同じネットワーク接続に依存している他のユーザーやアプリケーションへの影響を最小限に抑えることができます。

Q: AWS DataSync のパフォーマンスを監視するにはどうすればよいですか?

A: AWS DataSync は Amazon CloudWatch メトリックを生成して、転送プロセスの詳細な可視性を提供します。これらのメトリックを使用して、ファイルの数とコピーされたデータの量、およびファイルの検出と検証の進行状況を確認できます。DataSync コンソールで、これらのメトリックを使用して CloudWatch グラフを直接表示できます。

Q: AWS DataSync は、転送元ファイルシステムのパフォーマンスに影響しますか?

A: オンプレミスのファイルストアの容量と転送されるファイルの数とサイズによっては、エージェントがそのストレージからデータを読み書きするため、同じソースデータストアにアクセスするときに AWS DataSync が他のクライアントの応答時間に影響することがあります。タスクの帯域幅制限を設定すると、ストレージシステムに対する I/O を制限することで、この影響を軽減できます。

セキュリティとコンプライアンス

Q: データは、転送中および保存中に暗号化されていますか?

A: はい。転送元と転送先の間で転送されるすべてのデータは、Transport Layer Security (TLS、Secure Sockets Layer (SSL) の代替) を使用して暗号化されます。データは、AWS DataSync 自体に保持されることはありません。このサービスは、S3 バケットのデフォルトの暗号化保存中のデータの Amazon EFS ファイルシステム暗号化保存中および送信中の Amazon FSx For Windows File Server 暗号化の使用をサポートしています。

Q: AWS DataSync はどのようにして NFS サーバーまたは SMB ファイル共有にアクセスしますか?

A: AWS DataSync は、IT 環境あるいは Amazon EC2 にデプロイするエージェントを使用して、NFS または SMB プロトコルを通じてファイルにアクセスします。このエージェントは AWS 内の DataSync サービスエンドポイントに接続し、AWS マネジメントコンソールまたは CLI から安全に管理されます。

Q: AWS DataSync はどのようにしてセルフマネージドオブジェクトストレージにアクセスしますか?

A: AWS DataSync は、IT 環境あるいは Amazon EC2 にデプロイするエージェントを使用し、Amazon S3 API を使用してオブジェクトにアクセスします。このエージェントは AWS 内の DataSync サービスエンドポイントに接続し、AWS マネジメントコンソールまたは CLI から安全に管理されます。

Q:  AWS DataSync では、宛先ストレージに接続するために VPN を設定する必要がありますか?

A: いいえ。プレミスとの間でデータをコピーする場合、VPN/トンネルをセットアップしたり、インバウンド接続を許可したりする必要はありません。AWS DataSync エージェントは、標準のネットワークポートを使用してファイアウォールを経由するように設定できます。また、Amazon Virtual Private Cloud (Amazon VPC) 内に、VPC エンドポイントを使用して AWS DataSync をデプロイできるようになりました。VPC エンドポイントを使用する場合、DataSync エージェントと AWS のサービスの間で転送されるデータは、パブリックインターネットを通過したり、パブリック IP アドレスを必要としたりしません。

Q: AWS DataSync エージェントはどのように AWS に安全に接続しますか?

A: AWS DataSync エージェントは、選択した AWS リージョン内の DataSync サービスエンドポイントに接続します。公共インターネットのエンドポイント、Federal Information Processing Standards (FIPS) が承認したエンドポイント、もしくは自分の VPC にあるエンドポイントの内から、接続先を選択できます。エージェントをアクティブ化すると、エージェントが AWS アカウントに安全に関連付けられます。詳細については、サービスエンドポイントを選択およびエージェントのアクティブ化を参照してください。

Q:  AWS DataSync エージェントは、どのようにしてパッチ適用および更新されますか?

A: 基盤となるオペレーティングシステムと AWS DataSync ソフトウェアパッケージの両方を含むエージェント VM の更新は、エージェントがアクティブ化されると AWS が自動的に適用します。更新は、エージェントがアイドル状態で、データ転送タスクを実行していないときに無停止で適用されます。

Q: AWS DataSync は、どのコンプライアンスプログラムをサポートしていますか?

A: AWS には、クラウドで最長のコンプライアンスプログラムがあります。AWS は、お客様が要件をナビゲートできるように支援することを約束いたします。AWS DataSync は、世界および業界のセキュリティ基準に適合していると評価されています。DataSync は PCI DSS、ISO 9001270012701727018SOC 1、2、および 3 に適合しており、さらに HIPAA 対応を遵守しています。 DataSync は、FedRAMP Moderate の AWS 米国東部/西部リージョンおよび FedRamp High の AWS GovCloud (米国) リージョンでも承認されています。これにより、お客様が AWS のセキュリティを確認し、ご自身の義務を果たすことが容易になります。詳細情報およびリソースについては、コンプライアンスのページを参照してください。また、コンプライアンスプログラムによる対象範囲内のサービスのページにアクセスして、サービスおよび認定の詳細な一覧を参照することも可能です。

Q: AWS DataSync は PCI に準拠していますか?

A: はい。AWS DataSync は PCI-DSS に準拠しており、支払い情報の転送に使用できます。AWS アーティファクト で PCI コンプライアンスパッケージをダウンロードして、AWS で PCI 準拠を実現する方法の詳細をご覧いただけます。

Q: AWS DataSync は、HIPAA 対応ですか?

A: はい。AWS DataSync は HIPAA 対応です。つまり、AWS で HIPAA BAA を使用している場合、DataSync を使用して保護されるべき医療情報 (PHI) を転送できます。

Q: AWS DataSync は、AWS 米国東部/西部で FedRAMP JAB Moderate Provisional Authorization を使用していますか?

A: はい。AWS DataSync は、米国東部/西部リージョンの Federal Risk and Authorization Management Program (FedRAMP) Moderate ベースラインに基づき、Joint Authorization Board (JAB) から Provisional Authority to Operate (P-ATO) を受け取りました。連邦または法人のお客様は、AWS 東部/西部リージョンの認証境界で AWS DataSync を使用して、影響度が中レベルのデータを取得できます。

Q: AWS DataSync には、AWS GovCloud (米国) リージョンに FedRAMP JAB High Provisional Authorization をお持ちですか?

A: はい。AWS DataSync は、米国 GovCloud リージョンの Federal Risk and Authorization Management Program (FedRAMP) High ベースラインに基づき、Joint Authorization Board (JAB) から Provisional Authority to Operate (P-ATO) を受け取りました。連邦または法人のお客様は、AWS GovCloud (米国) リージョンの認証境界で AWS DataSync を使用して、影響度の高いデータを取得できます。

AWS DataSync をいつ選択するか

Q:  AWS DataSync は、rsync や Amazon S3 コマンドラインインターフェイスなどのコマンドラインツールを使用するのとどのように違いますか?

A: AWS DataSync は、AWS への大規模なアクティブデータセットの移動を完全に自動化および高速化します。Amazon S3、Amazon EFS、Amazon FSx for Windowsファイルサーバー、Amazon CloudWatch、および AWS CloudTrail とネイティブに統合されており、ストレージサービスへのシームレスで安全なアクセスを提供し、転送を詳しくモニタリングします。

DataSync は、専用のネットワークプロトコルとスケールアウトのアーキテクチャを使用して、データを転送します。 オンプレミスと AWS ストレージサービス間のデータ転送では、単一の DataSync タスクで 10 Gbps ネットワークリンクを完全に利用できます。

DataSync はデータ転送を完全に自動化します。再試行とネットワーク耐障害性メカニズム、ネットワークの最適化、組み込みのタスクスケジューリング、DataSync API とコンソールによるモニタリング、CloudWatch メトリックが組み込まれており、イベントおよびログを使って転送プロセスを詳細に確認できます。DataSync は、転送中と転送終了時の両方でデータの整合性検証を実行します。

DataSync はエンドツーエンドのセキュリティを提供し、AWS ストレージサービスと直接統合します。転送元と転送先の間で転送されるすべてのデータは TLS を介して暗号化され、AWS ストレージへのアクセスは IAM ロールなどの組み込みの AWS セキュリティメカニズムを介して有効になります。VPC エンドポイントを使用した DataSync が有効になり、組織と AWS の間で転送されるデータがパブリックインターネットを通過せず、ネットワークを介してコピーされるデータのセキュリティがさらに向上します。

Q: バケット間でオブジェクトを転送するには、AWS DataSync をいつ利用したらいいですか? また S3 レプリケーションと S3 バッチオペレーションはいつ実行したらいいですか?

A: AWS には、バケット間でオブジェクトをコピーするための複数のツールが用意されています。

継続的なデータ配信、データパイプライン、データレイクの取り込み、および複数のバケット間でのデータの統合または分割には、AWS DataSync を使用します。

特定の宛先バケットへのデータの継続的なレプリケーションには、S3 レプリケーションを使用します。

S3 オブジェクトの大規模なバッチオペレーションを行うには、S3 バッチオペレーションを使用します。それには、オブジェクトをコピーしたり、オブジェクトタグやアクセスコントロールリスト (ACL) を設定したり、Amazon S3 Glacier からのオブジェクトの復元を開始したり、AWS Lambda 関数を呼び出してオブジェクトを使ってカスタムアクションを実行したり、S3 オブジェクトロックのリーガルホールドを管理したり、S3 オブジェクトロックの保持日を管理したりすることなどがあります。

Q:  AWS DataSync と AWS Snowball Edge はいつ使用しますか?

A: AWS DataSync は、オンラインデータ転送に最適です。DataSync を使用して、AWS との間でアクティブなデータの移行が可能です。分析や処理を目的としてクラウドにデータを転送したり、オンプレミスのストレージ容量を解放するためにデータをアーカイブし、ビジネス継続性を確保する目的で AWS にデータをレプリケートしたりできます。

AWS Snowball Edge は、帯域幅が制限されているお客様や、リモート環境、切断された環境、または厳しい環境からデータを転送するお客様のオフラインデータ転送に最適です。 

Q:  AWS DataSync と AWS Storage Gateway はいつ使用しますか?

A: AWS DataSync を使用して既存のデータを Amazon S3 に移行し、次に AWS Storage Gateway のファイルゲートウェイ構成を使用して、移行したデータへのアクセスを保持し、オンプレミスのファイルベースアプリケーションからの継続的な更新に使用します。

DataSync とファイルゲートウェイの組み合わせを使用して、オンプレミスのインフラストラクチャを最小限に抑えながら、オンプレミスのアプリケーションをクラウドストレージにシームレスに接続できます。AWS DataSync を使用すると、AWS ストレージサービスへのオンラインデータ転送を自動化および高速化できます。 AWS DataSync を使用した最初のデータ転送フェーズの後、ファイルゲートウェイは、移行されたデータへの低レイテンシーアクセスをオンプレミスアプリケーションに提供します。NFS 共有で DataSync を使用する場合、ソースオンプレミスストレージからの POSIX メタデータが保持され、ファイルゲートウェイを使用してファイルにアクセスするときにソースストレージからのアクセス許可が適用されます。

Q: いつ AWS DataSync を使用し、いつ Amazon S3 Transfer Acceleration を使用しますか?

A: アプリケーションが既に Amazon S3 API に統合されていて、大きなファイルを S3 に転送するために高いスループットが必要な場合は、S3 Transfer Acceleration を使用できます。既存のストレージシステム (ネットワーク接続ストレージなど) や変更できない機器 (DNA シーケンサー、ビデオカメラなど) からデータを転送する場合や、複数の転送先が必要な場合は、AWS DataSync を使用します。DataSync はまた、内臓の再試行とネットワーク耐障害性メカニズム、データの整合性検証、および帯域幅のスロットリング、ニーズに合わせた柔軟な設定といった追加機能を提供することで、データ転送を自動化および簡素化します。

Q: いつ AWS DataSync を使用し、いつ AWS Transfer Family を使用しますか?

A: 現在 SFTP を使用して第三者とデータを交換している場合、AWS Transfer Family は、運用上の負担を軽減しながら、Amazon S3 との間で直接管理されるフルマネージド型の SFTP、FTPS、FTP 転送を提供します。

NFS サーバー、SMB ファイル共有、セルフマネージドオブジェクトストレージ、AWS Snowcone、Amazon S3、Amazon EFS、および Amazon FSx for Windows ファイルサーバー間の高速で自動化されたデータ転送が必要な場合は、AWS DataSync が適しています。DataSync は、アクティブなデータセットのオンライン移行、継続的に生成されるデータのタイムリーな転送、またはビジネス継続性のためのレプリケーションが必要なお客様に最適です。 

DataSync の料金の詳細
料金の詳細を確認する

AWS DataSync の料金はシンプルで予測可能な使用ベースであり、コピーするデータ量に対してのみ料金が発生します。 

詳細 
AWS アカウントにサインアップする
無料のアカウントにサインアップする

AWS 無料利用枠にすぐにアクセスできます。 

 

サインアップ 
コンソールで DataSync の使用を開始する
コンソールでデータの移動を開始する

AWS コンソールで AWS DataSync を使用して構築を開始します。

サインイン