全般

Q: AWS DataSync とは何ですか?

A: AWS DataSync は、AWS へのデータ移行を簡素化および高速化し、オンプレミスのストレージ、エッジロケーション、他のクラウド、および AWS ストレージ間でデータを移行するオンラインデータ移行および検出サービスです。

AWS DataSync Discovery は、オンプレミスストレージのパフォーマンスと使用状況を可視化し、データを AWS ストレージサービスに移行するためのレコメンデーションを提供することで、移行計画を簡素化し、AWS へのデータ移行を加速するのに役立ちます。DataSync Discovery を使用すると、自動化されたデータ収集と分析を通じてオンプレミスのストレージのパフォーマンスとキャパシティの使用状況をより良く把握できるため、移行するデータを迅速に特定し、生成されたレコメンデーションを使用して、パフォーマンスとキャパシティのニーズに合った AWS ストレージサービスを選択できます。

オンラインデータ転送の場合、AWS DataSync は、オンプレミスストレージ、エッジロケーション、他のクラウドプロバイダー、および AWS Storage サービスとの間の大量のデータのコピーを簡略化、自動化、高速化します。DataSync は、ネットワークファイルシステム (NFS) 共有、サーバーメッセージブロック (SMB) 共有、Hadoop 分散ファイルシステム (HDFS)、セルフマネージドオブジェクトストレージ、Google Cloud ストレージ、Azure Files、Azure データレイク Storage Gen2 を含む Azure Blob ストレージ、Wasabi Cloud Storage、Oracle Cloud Storage、Cloudflare R2 Storage, DigitalOcean Spaces、Backblaze B2 Cloud Storage、AWS Snowcone、Snow 上の Amazon S3 互換ストレージ、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic File System (Amazon EFS) ファイルシステム、Amazon FSx for Windows File Server ファイルシステム、Amazon FSx for Lustre ファイルシステム、Amazon FSx for OpenZFS ファイルシステム、および Amazon FSx for NetApp ONTAP ファイルシステムとの間でデータをコピーできます。

Q: AWS DataSync を使用するメリットは何ですか?

A: AWS DataSync を使用すると、データを安全かつ迅速に検出して移行できます。DataSync Discovery を使用すると、オンプレミスのストレージ使用状況をより良く理解し、AWS への移行に関する推定コストとプランを知らせるレコメンデーションを受け取ることができます。データの移行では、DataSync を使用すると、オープンソースツールを使用してカスタムソリューションを構築したり、高価な商用ネットワークアクセラレーションソフトウェアのライセンスを取得して管理したりすることなく、数百万のファイルからなる大規模なデータセットをコピーすることができます。DataSync を使用して、AWS との間でアクティブなデータを移行したり、オンプレミスのストレージ容量を解放するためにデータをアーカイブしたり、ビジネス継続性を確保する目的で AWS にデータをレプリケートしたり、分析や処理を目的としてクラウドにデータを転送したりできます。

Q: AWS DataSync Discovery はどのような問題を解決してくれますか?

A: AWS DataSync Discovery は、AWS へのデータ移行を簡素化および高速化します。DataSync Discovery を使用すると、オンプレミスのストレージシステムに関するデータを自動的に収集し、DataSync コンソールで集計結果を表示できます。DataSync Discovery は、収集されたデータからパフォーマンス、キャパシティ、および使用状況を分析し、移行のために AWS Storage サービスを推奨します。DataSync Discovery を使用すると、オンプレミスのストレージの使用状況をより良く理解し、移行するデータを迅速に特定し、パフォーマンスのニーズを満たし、ストレージのコストを最適化する AWS Storage サービスを選択できます。

Q: AWS DataSync はどのような問題を解決しますか?

A: AWS DataSync を使用すると、オンラインデータ転送の複雑さとコストが軽減され、オンプレミスストレージ、エッジロケーション、他のクラウドプロバイダー、AWS Storage サービスとの間でデータセットを簡単に転送できます。DataSync は、Amazon S3 API、または他のクラウドストレージ API を使用して、HDFS クライアントとして、標準のストレージプロトコル (NFS、SMB) で既存のストレージシステムやデータソースに接続します。専用のネットワークプロトコルとスケールアウトアーキテクチャを使用して、ストレージシステムと AWS のサービス間のデータ転送を高速化します。DataSync は、ファイルとオブジェクトの移動、データ転送のスケジューリング、転送の進行状況の監視、暗号化、データ転送の検証、顧客への問題の通知を自動的にスケーリングおよび処理します。DataSync では、コピーしたデータの量に対してだけ支払うことになり、最低料金や前払いの義務はありません。

発見

Q: AWS DataSync Discovery ではどのストレージシステムがサポートされていますか?

AWS DataSync Discovery は現在、ONTAP 9.7 以降を実行する NetApp FAS および AFF シリーズのアレイをサポートしています。今後、追加のストレージシステムのサポートが追加される予定です。

Q: AWS DataSync Discovery は、ストレージシステムに関してどのような情報を収集しますか?

AWS DataSync Discovery は、ストレージ管理 API インターフェイスを使用して、ストレージシステムに関する情報と、パフォーマンスおよび使用状況のメトリクスを収集します。システム情報には、合計ストレージキャパシティ、ボリューム設定、エクスポート/共有名などの属性が含まれます。ストレージシステムのメトリクスには、ボリュームスループットや IOPS などのパフォーマンスと、割り当て済みキャパシティや使用済みキャパシティなどの使用状況メトリクスが含まれます。DataSync Discovery は、収集されたシステム情報とメトリクスを使用して、AWS Storage への移行に関するレコメンデーションを生成します。

Q: AWS DataSync Discovery はどのようにレコメンデーションを決定しますか?

AWS DataSync Discovery は、オンプレミスのストレージシステムから収集されたデータを分析し、AWS ストレージサービスの機能、キャパシティ、およびパフォーマンス機能と照合します。必要に応じて、DataSync Discovery は、検討用に 1 つ以上の AWS ストレージサービスを推奨します。

Q: AWS DataSync Discovery を本番稼働用システムで使用できますか? ユーザーやアプリケーションにどのような影響がありますか?

オンプレミスのストレージシステムで AWS DataSync Discovery を使用しても、ユーザーとアプリケーションに顕著な影響はありません。

Q: AWS DataSync Discovery は、ストレージシステムに関して収集されたデータをどこに保存しますか?

収集されたデータは、DataSync サービスによって保存および管理されます。データは、AWS DataSync コンソールで表示するか、AWS CLI または AWS Software Development Kit (SDK) を使用してアクセスできます。

Q: AWS DataSync Discovery は、検出ジョブによって収集されたデータをどのくらいの期間保存しますか?

収集されたデータとレコメンデーションは、検出ジョブの終了後 60 日間保持されます。

データの移動

Q: データはどこからどこへ移動できますか?

A: DataSync は次のストレージロケーションタイプをサポートしています: ネットワークファイルシステム (NFS) 共有、サーバーメッセージブロック (SMB) 共有、Hadoop 分散ファイルシステム (HDFS)、セルフマネージドオブジェクトストレージ、Google Cloud ストレージ、Azure Files、Azure データレイク Storage Gen2 を含む Azure Blob ストレージ、Wasabi Cloud Storage、Oracle Cloud Storage、Cloudflare R2 Storage, DigitalOcean Spaces、Backblaze B2 Cloud Storage、AWS Snowcone、Snow 上の Amazon S3 互換ストレージ、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic File System (Amazon EFS) ファイルシステム、Amazon FSx for Windows File Server ファイルシステム、Amazon FSx for Lustre ファイルシステム、Amazon FSx for OpenZFS ファイルシステム、および Amazon FSx for NetApp ONTAP ファイルシステム。

Q: AWS DataSync を使用してデータを AWS に移行するにはどうすればよいですか?

A: AWS DataSync を使用して、オンプレミス、エッジ、または他のクラウドにあるデータを Simple Storage Service (Amazon S3)、Amazon EFS、Amazon FSx for Windows File Server、Amazon FSx for Lustre、Amazon FSx for OpenZFS、および Amazon FSx for NetApp ONTAP に移行できます。DataSync を設定して、データセット全体の初期コピーを作成し、オンプレミスから AWS への最終的なカットオーバーまで、変更データの後続の増分転送をスケジュールします。また、DataSync には暗号化と整合性の検証が含まれているため、データは安全、無傷で、すぐに使用できる状態で転送されます。ネットワーク接続に依存するワークロードへの影響を最小限に抑えるために、移行を時間外に実行するようにスケジュールしたり、組み込みの帯域幅スロットルを構成して DataSync が使用するネットワーク帯域幅の量を制限したりできます。 DataSync は、類似したメタデータ構造を持つストレージシステム間でメタデータを保持し、エンドユーザーとアプリケーションをスムーズに移行して、ターゲットの AWS ストレージサービスを使用できるようにします。

移行のベストプラクティスとヒントについては、ストレージのブログである 「AWS DataSync を使用したストレージの移行」をお読みください。

Q: AWS DataSync を使用してコールドデータをアーカイブするにはどうすればよいですか?

A: AWS DataSync を使用して、コールドデータをオンプレミスストレージシステムから、Amazon S3 Glacier Flexible Retrieval (旧 S3 Glacier) または Amazon S3 Glacier Deep Archive などの耐久性のある安全な長期ストレージに直接移動できます。DataSync の除外フィルターを使用して一時ファイルやフォルダのコピーを除外するか、包含フィルターまたはマニフェストを使用してソースの場所からファイルのサブセットのみをコピーします。ニーズに合わせて最も費用対効果の高いストレージサービスを選択できます。任意の S3 ストレージクラスにデータを転送するか、Amazon EFS 低頻度アクセスストレージクラス (EFS IA) にデータを保存するために EFS Lifecycle Management で DataSync を使用します。組み込みのタスクスケジューリング機能を使用して、ログ、生映像、電子医療記録などのコンプライアンスまたは監査目的で保持する必要があるデータを定期的にアーカイブします。 

Q: AWS DataSync を使用して、ビジネスの継続性のためにデータを AWS にレプリケートするにはどうすればよいですか?

A: AWS DataSync を使用すると、あらゆる Simple Storage Service (Amazon S3) ストレージクラスに定期的にファイルをレプリケートしたり、スタンバイファイルシステムのデータを Amazon EFS、Amazon FSx for Windows File Server、Amazon FSx for Lustre、Amazon FSx for OpenZFS、または Amazon FSx for NetApp ONTAP に送信したりできます。組み込みのタスクスケジューリング機能を使用して、データセットへの変更が送信先ストレージに定期的にコピーされるようにします。AWS DataSync を利用したデータ保護については、こちらの AWS ストレージブログをお読みください。

Q: 進行中のワークフローでオンプレミスと AWS 間の定期的な転送に AWS DataSync を使用するにはどうすればよいですか?

A: AWS DataSync を使用して、オンプレミスシステムと AWS の間で継続的に転送して処理できます。DataSync は、アクティブなファイルを AWS にすばやく移動させる必要がある業界で重要なハイブリッドクラウドストレージワークフローを高速化するのに役立ちます。これには、ライフサイエンス業界での機械学習、メディアとエンターテインメント業界での動画制作、金融サービス業界でのビッグデータ分析、石油とガス業界での地震研究などがあります。DataSync はタイムリーな配信を提供し、依存するプロセスが遅延しないようにします。包含フィルターと除外フィルターまたはマニフェストを指定して、タスクを実行するたびに転送するファイルまたはオブジェクトを指定できます。

Q: AWS DataSync を使って、他のクラウドから AWS にデータをコピーすることはできますか?

A: はい。AWS DataSync を使用すると、Amazon S3 API を使用して Google クラウドストレージから、 SMB プロトコルを使用して Azure Files から、または Azure データレイク Storage 第 2 世代を含む Azure Blob Storage からデータをコピーできます。Wasabi Cloud Storage、Oracle Cloud Storage、Cloudflare R2 Storage, DigitalOcean Spaces、Backblaze B2 Cloud Storage からデータを移動することもできます。 DataSync エージェントを簡単にクラウド環境または Amazon EC2 にデプロイし、転送元と転送先のロケーションを作成し、タスクを開始してデータのコピーを開始できます。ハイブリッドおよびマルチクラウド環境向けの AWS ソリューションの詳細をご覧ください

Q: AWS DataSync を使用してデータレイクを構築できますか?

A: はい。AWS DataSync では、オンプレミスのデータセットや他のクラウドにあるデータを Amazon S3 に自動転送することで、簡単にデータレイクを構築することができます。DataSync では、Amazon S3 API、または他のクラウドストレージ API を使用して、HDFS クライアントとして、標準的なストレージプロトコル (NFS、SMB) で、データセット全体を簡単かつ迅速に転送することができます。最初にデータセットを転送した後、AWS への新しいデータの転送をスケジュールすることができます。また、DataSync には暗号化と整合性の検証が含まれているため、データは安全、無傷で、すぐに使用できる状態で転送されます。ネットワーク接続に依存するワークロードへの影響を最小限に抑えるために、移行を業務時間外に実行するようにスケジュールしたり、組み込みの帯域幅スロットルを構成して DataSync が使用するネットワーク帯域幅の量を制限したりすることができます。Amazon S3 にデータが保存されると、ネイティブの AWS のサービスを利用して、ビッグデータ分析、人工知能 (AI)、機械学習 (ML)、ハイパフォーマンスコンピューティング (HPC)、ならびにメディアデータ処理を行うアプリケーションを実行し、非構造化データセットからインサイトを得ることができます。 データレイクの構築と活用の詳細については、AWS データレイクストレージのウェブページを参照してください。

Q: AWS DataSync を使用して AWS ストレージサービス間でデータを転送するにはどうすればよいですか?

A: DataSync を使用して、同じ AWS アカウント内の Simple Storage Service (Amazon S3)、Amazon EFS、Amazon FSx for Windows File Server、Amazon FSx for Lustre、Amazon FSx for OpenZFS、または Amazon FSx for NetApp ONTAP 間でファイルまたはオブジェクトを転送できます。同じ AWS リージョン内の AWS のサービス間、中国を除く異なる商用 AWS リージョン内のサービス間、または AWS GovCloud (米国東部と米国西部) リージョン間でデータを転送できます。これには DataSync エージェントをデプロイする必要はなく、AWS DataSync コンソール、AWS コマンドラインインターフェイス (CLI)、または AWS Software Development Kit (SDK) を使用してエンドツーエンドで設定できます。

Q: AWS DataSync を使用して Amazon WorkDocs に移行できますか?

A: はい。AWS DataSync は、移行に使用する Amazon S3 バケットへのファイルのアップロードを自動化することにより、Amazon WorkDocs Migration Service で必要なステップをすばやく実行できるようにします。DataSync を使用すると、ホームディレクトリや部署の共有物を WorkDocs に簡単にすばやく移行できます。 WorkDocs への移行に DataSync を使用する方法については、ブログ記事「AWS DataSync を使用した Amazon WorkDocs へのネットワークファイル共有の移行」を参照してください。

使用方法

Q: AWS DataSync Discovery の使用を開始するにはどうすればよいですか?

オンプレミスの VM 環境に AWS DataSync エージェントをデプロイすることから始めます。 DataSync コンソール、CLI、または SDK を使用して、オンプレミスのストレージに接続するように DataSync Discovery を設定し、検出ジョブを実行して、パフォーマンス、キャパシティ、および使用状況のメトリクスとともにストレージシステムに関するデータを収集します。検出ジョブの実行中に、DataSync コンソールのダッシュボードからストレージシステムに関する情報を表示できます。検出ジョブが完了すると、収集されたデータが分析され、Amazon EFS、Amazon FSx、Amazon S3 などの AWS ストレージサービスに移行するためのレコメンデーションが生成されます。これらのレコメンデーションは、AWS Storage サービスの選択のガイドとして使用できます。また、AWS DataSync を使用してデータを移行できます。

Q: AWS DataSync を使用してデータの移行を開始するにはどうすればよいですか?

A: AWS マネジメントコンソールで数回クリックするか、AWS コマンドラインインターフェイス (CLI) を使用することで、AWS DataSync を使用してデータを転送することができます。開始するには、次の 3 つの手順を実行します。

1.オンプレミス、エッジ、または他のクラウドストレージシステムと AWS ストレージサービス間でデータを転送するには、エージェントをデプロイします - DataSync エージェントをデプロイし、マネジメントコンソールまたは API を介して AWS アカウントに関連付けます。エージェントは、NFS サーバー、SMB ファイル共有、Hadoop クラスター、またはセルフマネージドオブジェクトストレージもしくはクラウドオブジェクトストレージにアクセスして、データを読み込んだり、書き込んだりするために使用されます。 同じ AWS アカウント内の AWS ストレージサービス間でデータを転送するためにエージェントをデプロイする必要はありません。

2.データ転送タスクの作成 - データソースと転送先の場所、および目的のタスクのスケジューリングやタスクレポートの有効化など、転送を設定するために使用するオプションを指定して、タスクを作成します。

3.転送を開始 - タスクを開始し、コンソールまたは Amazon CloudWatch でデータ移動をモニタリングし、タスクレポートを使用して転送タスクを監査します。

Q: AWS DataSync のエージェントをデプロイするにはどうすればよいですか?

A: AWS DataSync のエージェントを、使用しているオンプレミスハイパーバイザー、パブリッククラウド環境、または Amazon EC2 にデプロイします。オンプレミスファイルサーバーまたは Snow 上の Amazon S3 互換ストレージとの間でデータをコピーするには、AWS コンソールからエージェント仮想マシンイメージをダウンロードし、オンプレミスの VMware ESXi、Linux カーネルベース仮想マシン (KVM)、または Microsoft Hyper-V ハイパーバイザーにデプロイします。NFS や SMB プロトコルを使用してファイルサーバーにアクセスしたり、Hadoop クラスターの NameNodes や DataNodes にアクセスしたり、Amazon S3 API を使用してオブジェクトストレージにアクセスしたりできるように、エージェントをデプロイする必要があります。 AWS Outposts バケットの S3 と AWS リージョンの S3 バケット間の転送を設定するには、エージェントを Outpost にデプロイします。AWS Snowcone デバイスと AWS ストレージ間の転送を設定するには、デバイスにプリインストールされている DataSync エージェント AMI を使用します。

パブリッククラウド環境と AWS Storage の間でデータをコピーする場合、DataSync エージェントをクラウド環境または Amazon EC2 にデプロイすることができます。AWS DataSync は AWS DataSync エージェントと AWS ストレージサービスの間で転送中のデータを圧縮するため、パブリッククラウド環境に AWS DataSync エージェントをデプロイすることで送信費用を削減できる場合があります。 

同じ AWS アカウント内の AWS ストレージサービス間でデータを転送するためにエージェントをデプロイする必要はありません。クラウド内のセルフマネージドファイルサーバーとの間、または異なる AWS アカウントの AWS ストレージサービス間でデータをコピーするには、DataSync エージェント AMI を使用して Amazon EC2 インスタンスを起動します。

Q: AWS DataSync のエージェントのリソース要件はどのようなものですか?

A: エージェントを実行するために最低限必要なリソースは、こちらで見つけることができます。

Q: AWS DataSync データ転送タスクを開始するにはどうすればよいですか?

A: AWS DataSync は、AWS マネジメントコンソールまたは AWS コマンドラインインターフェイス (CLI) を使用してタスクを開始すると、データをコピーします。タスクが実行されるたびに、転送元と転送先で変更がスキャンされ、転送元と転送先でのデータとメタデータの相違のコピーが実行されます。変更された内容を判別するために使用する転送元の特性を設定し、特定のファイルやオブジェクトのデータを転送するための包含フィルターと除外フィルターまたはマニフェストを定義し、転送先のファイルまたはオブジェクトを転送元で変更したときに上書きするか、転送元で見つからなかった場合に削除するかを制御します。

Q: AWS DataSync はコピーされたデータが正しいことをどのように保証しますか?

A: AWS DataSync はデータの転送と保存を行う際に、転送先に書き込まれたデータが転送元から読み出されたデータと一致するかどうかについて完全性チェックを実施します。さらに、オプションの検証チェックを実行して、転送の終了時に送信元と送信先を比較できます。 DataSync は、送信元と送信先に保存されているデータのフルファイルチェックサムを計算して比較します。データセット全体を確認することも、DataSync が転送したファイルまたはオブジェクトのみを確認することもできます。

Q: AWS DataSync によって転送されているデータのステータスを監査およびモニタリングするにはどうすればよいですか?

A: タスクレポートを使用して、すべてのタスク実行にわたる転送操作を確認することで、データ転送プロセスを監査できます。タスクレポートを使用すると、タスクを実行するたびに、転送、スキップ、検証、削除されたすべてのファイルの概要レポートと詳細なレポートを取得できます。タスクレポートには、転送されたファイルとバイトの総数が表示され、サイズ、パス、タイムスタンプ、ファイルチェックサム、オブジェクトバージョン ID (該当する場合) などのファイル属性が含まれます。また、AWS Glue、Amazon Athena、Amazon QuickSight を使用して、タスクレポートを自動的にカタログ化、クエリ、視覚化して、データ転送プロセスに関する重要な情報を得ることができます。

AWS マネジメントコンソールまたは CLI を使用して、転送されているデータのステータスをモニタリングできます。Amazon CloudWatch メトリクスを使用すると、コピーされたファイルの数およびデータの量を確認できます。 また、個々のファイルの CloudWatch Logs へのロギングを有効にすることで、特定の時間に転送されたものや、DataSync によって実行されたコンテンツの整合性検証の結果を確認することができます。

これらのソリューションを組み合わせることで、監査、モニタリング、レポート、トラブルシューティングが簡素化され、利害関係者にタイムリーに最新情報を提供できます。

Q: AWS DataSync が転送するファイルとフォルダをフィルタリングできますか?

A: はい。タスク実行時に毎回転送されるファイル、フォルダ、オブジェクトを制限するため、除外フィルター、包含フィルター、またはその両方を指定できます。または、マニフェストを使用して、転送元の場所から転送するファイルまたはオブジェクトのサブセットを指定することもできます。

包含フィルターは、タスクの実行時に含めるべきファイルとフォルダパスまたはオブジェクトキーを指定し、転送元と転送先で DataSync がスキャンする範囲を制限します。除外フィルターは、コピーの対象から除外するファイルとフォルダパスまたはオブジェクトキーを指定します。  タスクの作成または更新時に、除外フィルターと包含フィルターの両方を設定できます。タスクの開始時には、タスクに設定されたフィルターを上書きして更新することができます。DataSync で一般的なフィルターを使用する方法については、この AWS ストレージのブログをお読みください。

マニフェストは、タスクの実行時に含めるべきファイルパスやオブジェクトキーを一覧表示する CSV 形式のファイルであり、転送元と転送先で DataSync がスキャンする範囲を制限します。タスクを作成または更新する場合、マニフェストファイルに数百万の転送元ファイルまたはオブジェクトを指定できます。DataSync は、マニフェストに一覧表示されているファイルのみを比較して転送します。タスクの開始時には、マニフェストファイルを上書きして更新することができます。Amazon S3 からデータをコピーする場合、転送する各オブジェクトの S3 バージョン ID をオプションで指定することもできます。詳細については、こちらのブログをご覧ください。

フィルターとマニフェストは一緒に使用できないことに注意してください。

Q: マニフェストファイルの使用は包含フィルターの使用とどう違うのですか?

A: マニフェストは転送元の場所から転送されるファイルまたはオブジェクトの明示的なリストですが、包含フィルターは転送元から転送されるファイルやフォルダのパターンを指定する文字列です。フィルター内のパターンと一致するファイルとフォルダのみがコピーされます。パターンは、ファイルまたはフォルダパス全体であっても、プレフィックスに一致するすべてのファイルまたはオブジェクトをコピーする必要があることを示すワイルドカード (*) 文字で終わるプレフィックスであってもかまいません。包含フィルターは、一部のファイルやオブジェクト、またはいくつかの特定のフォルダのみをコピーしたいお客様に最適です。自動化されたワークフローの一部として移動されたデータセットなど、よく知られているデータセットをお持ちのお客様は、マニフェストを使用することで、ファイルまたはオブジェクトストレージシステム全体をスキャンして変更を確認する必要がなくなります。マニフェストファイルを使用すると、お客様は転送する数百万の転送元ファイルまたはオブジェクトを指定でき、DataSync はマニフェストに一覧表示されているファイルのみを比較します。お客様は。マニフェストを使用して Amazon S3 バケットから特定のバージョンのオブジェクトをコピーすることもできます。

Q: AWS DataSync をスケジュールに従って転送するように設定できますか?

A: はい。AWS DataSync コンソールまたは AWS コマンドラインインターフェイス (CLI) を使用して、繰り返し転送を管理するスクリプトを作成および実行する必要なく、タスクをスケジュールできます。タスクスケジューリングは、設定したスケジュールでタスクを自動的に実行します。コンソールには、毎時、毎日、または毎週のオプションが直接提供されます。これにより、データセットへの変更が自動的に検出され、送信先ストレージにコピーされることを保証できます。

Q: AWS DataSync はファイルをコピーするときにディレクトリ構造を保持しますか?

A: はい。ファイルを転送するとき、AWS DataSync は転送先に転送元ロケーションの構造にあるものと同じディレクトリ構造を作成します。

Q: AWS DataSync のタスクが中断されるとどうなりますか?

A: タスクが中断された場合 (ネットワーク接続が切断された、AWS DataSync のエージェントが再起動された場合など)、タスクの次の実行で不足しているファイルが転送され、この実行が終わるとデータは完全かつ一貫性のあるものになります。タスクが開始されるたびに、増分コピーが実行され、変更部分だけが転送元から転送先に転送されます。

Q: AWS Direct Connect で AWS DataSync を使用できますか?

A: Direct Connect リンクを使う AWS DataSync により、ブリックサービスエンドポイント、またはプライベート VPC エンドポイントへアクセスすることができます。VPC エンドポイントを使用する場合、DataSync エージェントと AWS のサービス間で転送されるデータは、パブリックインターネットを通過せず、パブリック IP アドレスも必要ありません。これにより、ネットワーク経由でコピーするデータのセキュリティが向上します。 DataSync Discovery は現在、パブリックサービスエンドポイントでのみサポートされています。

Q: AWS DataSync は VPC エンドポイントや AWS PrivateLink をサポートしますか?

A: はい。VPC エンドポイントは、データ移行のユースケース向けにサポートされています。オンプレミスまたはインクラウドでデプロイされた AWS DataSync エージェントの間で転送されるデータが、パブリックのインターネットを通過せず、またはパブリックの IP アドレスを必要としないようにするために、VPC エンドポイントを使用できます。VPC エンドポイントを使用すれば、ネットワークトラフィックをAmazon Virtual Private Cloud (Amazon VPC) 内に保つことにより、データのセキュリティを向上させることができます。 DataSync 向けの VPC エンドポイントでは、サポートされている AWS のサービスに VPC をプライベートに接続することを可能にする、可用性の高いスケーラブルな AWS PrivateLink が使用されています。

Q: AWS DataSync で VPC エンドポイント を使うよう設定するにはどうしたらよいですか?

AWS DataSync で VPC エンドポイントを使用するには、選択した VPC で DataSync サービスの AWS PrivateLink インターフェイス VPC エンドポイントを作成し、DataSync エージェントを作成する際、このエンドポイント Elastic Network Interface (ENI) を選択します。エージェントはこの ENI に接続して有効化され、その後、エージェントによって転送されたすべてのデータは設定された VPC 内に保持されます。VPC エンドポイントの設定は、AWS DataSync Console、AWS Command Line Interface (CLI)、もしくは AWS SDK のいずれかにより行えます。詳細については、「Using AWS DataSync in a Virtual Private Cloud」(仮想プライベートクラウドでの AWS DataSync の使用) を参照してください。

AWS Storage 間の移行

Q: AWS DataSync ではどの AWS Storage サービスがサポートされてますか?

AWS DataSync は、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic File System (Amazon EFS)Amazon FSx for Windows File ServerAmazon FSx for LustreAmazon FSx for OpenZFS、および Amazon FSx for NetApp ONTAP との間でのデータ移行をサポートします。
 

Amazon S3

Q: Amazon S3 Glacier Instant Retrieval、Amazon S3 Glacier Flexible Retrieval (旧 S3 Glacier)、Amazon S3 Glacier Deep Archive、またはその他の S3 ストレージクラスにデータをコピーできますか?

A: はい。AWS DataSync で使用する S3 バケットを設定する場合、DataSync がオブジェクトの保存に使用する S3 ストレージクラスを選択できます。DataSync は、S3 Standard、S3 Intelligent-Tiering、S3 Standard-Infrequent Access (S3 Standard-IA)、S3 One Zone-Infrequent Access (S3 One Zone-IA)、Amazon S3 Glacier Flexible Retrieval、 Amazon S3 Glacier Instant Retrieval、Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive) へのデータの直接保存をサポートしています。Amazon S3 ストレージクラスの詳細については、Amazon Simple Storage Service デベロッパーガイドをご覧ください。

オブジェクトごとの最小課金容量より小さいオブジェクトは、S3 標準に保存されます。たとえば、サイズが 0 バイトでメタデータだけを保持するフォルダオブジェクトは、S3 標準に保存されます。Amazon S3 ストレージクラスを使用する際の考慮事項については、当社のドキュメントと DataSync を使用する場合の S3 リクエストコストの評価をご覧ください。最小課金容量の詳細については、 Amazon S3 料金表をご覧ください

Q: S3 標準 – IA および S3 1 ゾーン – IA ストレージクラスからデータをコピーできますか?

A: はい。AWS DataSync タスクのソースの場所として S3 を使用する場合、サービスは、コピー先にコピーする必要があるすべてのオブジェクトをバケットから取得します。S3 標準 – IA および S3 1 ゾーン – IA ストレージからオブジェクトを取得すると、オブジェクトのサイズに基づいて取得料金が発生します。ドキュメントで、Amazon S3 ストレージクラスを使用する際の検討事項についてお読みください。

Q: Amazon S3 Glacier Instant Retrieval からデータをコピーすることはできますか?Amazon S3 Glacier Flexible Retrieval (旧 S3 Glacier) と Amazon S3 Glacier Deep Archive からデータをコピーすることはできますか?

A: AWS DataSync タスクのソースの場所として S3 を使用する場合、サービスは、コピー先にコピーする必要があるすべてのオブジェクトをバケットから取得しようとします。S3 Glacier Instant Retrieval ストレージクラスにアーカイブされているオブジェクトを取得すると、オブジェクトのサイズに応じて取り出し料金が高くなります。S3 Glacier Flexible Retrieval または S3 Glacier Deep Archive ストレージクラスにアーカイブされたオブジェクトを取得すると、エラーが発生します。アーカイブされたオブジェクトの取得エラーは DataSync によってログに記録され、タスク完了ステータスは失敗になります。Amazon S3 ストレージクラスを使用する際の考慮事項と DataSync を使用する際の S3 リクエストコストを評価する場合の考慮事項については、こちらのドキュメントをご覧ください。

Q: AWS DataSync は、Amazon S3 バケットにどのようにアクセスしますか?

A: AWS DataSync は、お客様が提供する IAM ロールを想定しています。ロールにアタッチするポリシーによって、ロールが実行できるアクションが決まります。DataSync が、お客様に代わってこのロールを自動生成するか、ロールを手動で設定できます

Q: AWS DataSync は、Amazon S3 のオブジェクトとの間で、どのようにファイルやフォルダの変換を行いますか?

A: ファイルまたはフォルダを Amazon S3 へコピーした場合、ファイルまたはフォルダとオブジェクトの間に、1 対 1 の関係が生じます。ファイルやフォルダのタイムスタンプ、およびユーザー ID、グループ ID、およびアクセス許可を含む POSIX パーミッションは、S3 のユーザーメタデータに保存されます。NFS 共有では、S3 ユーザーメタデータに保存されているファイルメタデータはファイルゲートウェイと完全に相互利用が可能で、AWS DataSync によって Amazon S3 に保存されているデータへのオンプレミスでのファイルベースアクセスが行えます。

DataSync が、このユーザーメタデータを含むオブジェクトを NFS サーバーにコピーして戻す際には、ファイルのメタデータは復元されます。NFS から S3 にコピーバックするときに、シンボリックリンクとハードリンクも復元されます。

SMB ファイル共有からコピーする際には、デフォルトの POSIX パーミッションが S3 のユーザーメタデータに保存されます。SMB ファイル共有にコピーして戻す際には、DataSync でそのファイル共有にアクセスできるように設定されていたユーザーに基づいて所有権が設定され、デフォルトのパーミッションが割り当てられます。

HDFS からコピーする際には、ファイルやフォルダのタイムスタンプ、ユーザーやグループの所有権、POSIX のパーミッションが S3 のユーザーメタデータに保存されます。Amazon S3 から HDFS にコピーして戻す際には、ファイルとフォルダのメタデータが復元されます。

DataSync のファイルとメタデータの保存の方法の詳細については、ドキュメントをご覧ください。

Q: セルフマネージドオブジェクトストレージまたは Azure Blob ストレージ (プレビュー) と Amazon S3 の間でオブジェクトを転送するときに保持されるオブジェクトメタデータは何ですか?

A: セルフマネージドオブジェクトストレージまたは Azure Blob ストレージ (プレビュー) と Amazon S3 の間でオブジェクトを転送する場合、DataSync はオブジェクトをオブジェクトメタデータとタグとともにコピーします。

Q: Amazon S3 バケット間でオブジェクトを転送するときに保持されるオブジェクトメタデータは何ですか?

A: Amazon S3 バケット間でオブジェクトを転送する場合、DataSync はオブジェクトをオブジェクトメタデータとタグとともにコピーします。DataSync は、オブジェクト ACL や以前のオブジェクトバージョンなどの他のオブジェクト情報をコピーしません。

Q: AWS DataSync で Amazon S3 ストレージクラスを使用する場合、どの Amazon S3 リクエストおよびストレージコストが適用されますか?

A: 一部の S3 ストレージクラスには、データ取得、最小ストレージ容量、最小ストレージ期間など、コストに影響する可能性のある動作があります。DataSync は、これらの要因に対処するためにデータの管理を自動化し、データ取得を最小限に抑える設定を提供します。

オブジェクトごとの最小容量が請求されるのを回避するために、AWS DataSync は小さなオブジェクトを S3 標準に自動的に保存します。データ取得料金を最小限に抑えるために、特定のタスクによって転送されたファイルのみを検証するように DataSync を構成できます。最小保存期間に関する料金を回避するために、DataSync にはオブジェクトを上書きおよび削除するための制御機能があります。Amazon S3 ストレージクラスを使用する際のコストに関する考慮事項については、当社のドキュメントと DataSync を使用する場合の S3 リクエストコストの評価をご覧ください。

Q: オブジェクトを AWS Outposts の Amazon S3 バケットとの間でコピーすることはできますか?

A: はい。AWS Outposts の Amazon S3 と AWS リージョン内の Amazon S3 バケットとの間で、オブジェクトのコピーを実行できます。AWS DataSync では、オブジェクトとともにオブジェクトのメタデータとタグもコピーされます。DataSync を Outposts の Amazon S3 バケットにアクセスさせる場合、Outpost に DataSync EC2 をデプロイします

DataSync を Outposts の Amazon S3 に使用する場合、AWS リージョン内の Amazon S3 バケットとの間でのみデータを転送できます。DataSync タスクでサポートされている転送元と転送先の詳細については、ドキュメントを参照してください。

Amazon EFS

Q: AWS DataSync は、Amazon EFS ファイルシステムにどのようにアクセスしますか?

A: AWS DataSync は、NFS プロトコルを使用して Amazon EFS ファイルシステムにアクセスします。DataSync サービスは、DataSync サービスによって管理される Elastic Network Interfaces (ENI) の VPC 内からファイルシステムをマウントすることで行われます。DataSync は、ユーザーの代わりにこうした ENI の作成、使用、削除を完全に管理します。 マウントターゲットまたは EFS アクセスポイントを使用して EFS ファイルシステムをマウントすることを選択することができます。

Q: AWS DataSync をすべての Amazon EFS ストレージクラスで使用できますか?

A: はい。AWS DataSync を使用してファイルを Amazon EFS にコピーし、EFS Lifecycle Management を設定して、一定期間アクセスされていないファイルを低頻度アクセス (IA) ストレージクラスに移行できます。

Q: Amazon EFS ファイルシステムのリソースポリシーで AWS DataSync を使用するにはどうすればよいですか?

A: IAM アイデンティティポリシーとリソースポリシーの両方を使用して、クラウド環境に最適化されたスケーラブルな方法で、Amazon EFS リソースへのクライアントアクセスを制御することができます。EFS ファイルシステム用の DataSync ロケーションを作成するとき、DataSync が EFS にアクセスするときに仮定する IAM ロールを指定することができます。その後、EFS ファイルシステムポリシーを使用して、IAM ロールのアクセスを設定することができます。DataSync は EFS ファイルシステムをルートユーザーとしてマウントするため、IAM ポリシーでは、elasticfilesystem:ClientRootAccess のアクションを許可する必要があります。

Q: AWS DataSync を使用して、Amazon EFS ファイルシステムを別の AWS リージョンにレプリケートできますか?

A: はい。Amazon EFS が提供する組み込みレプリケーションに加えて、AWS DataSync を使用して、同じ AWS アカウント内の 2 番目の Amazon EFS ファイルシステムへの Amazon EFS ファイルシステムの定期的なレプリケーションをスケジュールすることもできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Q: NFS 共有と Amazon EFS 間、または 2 つの Amazon EFS ファイルシステム間でデータをコピーするときにどのようなメタデータが保持されますか?

A: AWS DataSync は、ファイルとフォルダのタイムスタンプ、およびユーザー ID、グループ ID、アクセス許可を含む POSIX のパーミッションをコピーします。詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Q: HDFS と Amazon EFS の間でデータをコピーするときにどのようなメタデータが保持されますか?

A: AWS DataSync は、ファイルとフォルダのタイムスタンプと POSIX アクセス許可をコピーし、ユーザー ID とグループ ID のデフォルト値を適用します。詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Amazon FSx for Windows File Server

Q: AWS DataSync は、Amazon FSx for Windows File Server ファイルシステムにどのようにアクセスしますか?

A: AWS DataSync は、SMB プロトコルを使用して Amazon FSx for Windows File Server ファイルシステムにアクセスし、AWS コンソールまたは CLI で設定したユーザー名とパスワードで認証を行います。DataSync サービスは、DataSync サービスによって管理される Elastic Network Interfaces (ENI) の VPC 内からファイルシステムをマウントすることで行われます。DataSync は、ユーザーの代わりにこうした ENI の作成、使用、削除を完全に管理します。

Q: SMB 共有と Amazon FSx for Windows File Server ファイルシステム間、または 2 つの Amazon FSx ファイルシステム間でコピーする際、どのような Windows メタデータが転送されますか?

A: AWS DataSync は、ファイルのタイムスタンプ、ファイル所有者、標準ファイル属性、NTFS 随意アクセスリスト (DACL)、NTFS システムアクセスコントロールリスト (SACL) などの Windows メタデータをコピーします。 詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Q: AWS DataSync を使用して、Amazon FSx for Windows File Server ファイルシステムを別の AWS リージョンにレプリケートできますか?

A: はい。AWS DataSync を使用して、同じ AWS アカウント内の 2 番目のファイルシステムへの Amazon FSx for Windows File Server ファイルシステムの定期的なレプリケーションをスケジュールできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Amazon FSx for Lustre

Q: AWS DataSync は、Amazon FSx for Lustre ファイルシステムにどのようにアクセスしますか?

A: FSx for Lustre ファイルシステムとの間でコピーする DataSync タスクを作成すると、DataSync サービスにより、ファイルシステムが配置されているのと同じ VPC とサブネットに Elastic Network Interfaces (ENI) が作成されます。  DataSync はこれらの ENI を使用して、ルートユーザーとして Lustre プロトコルを使用して FSx for Lustre ファイルシステムにアクセスします。  FSx for Lustre ファイルシステム用の DataSync ロケーションリソースを作成する際に、ENI に適用するセキュリティグループを 5 つまで指定し、DataSync サービスからのアウトバウンドアクセスを設定することができます。  セキュリティグループは、FSx for Lustre が必要とするネットワークポート上のアウトバウンドトラフィックを許可するように設定する必要があります。  FSx for Lustre ファイルシステムのセキュリティグループは、FSx for Lustre ファイルシステムの DataSync ロケーションリソースに割り当てたセキュリティグループからのインバウンドアクセスを許可するように設定する必要があります。

Q: NFS 共有または Amazon EFS ファイルシステムと Amazon FSx for Lustre の間、または 2 つの Amazon FSx for Lustre ファイルシステム間でデータをコピーする際、どのようなメタデータが保持されますか?

A: AWS DataSync は、ファイルとフォルダのタイムスタンプ、およびユーザー ID、グループ ID、アクセス許可を含む POSIX のパーミッションをコピーします。詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Q: AWS DataSync を使用して、1 つの FSx for Lustre ファイルシステムから別のファイルシステムへデータを移行することはできますか?

A: はい。AWS DataSync を使用して、FSx for Lustre ファイルシステムから同じ AWS アカウント内の 2 番目のファイルシステムにコピーできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Q: AWS DataSync を使用して、Amazon FSx for Lustre ファイルシステムを別の AWS リージョンにレプリケートできますか?

A: はい。AWS DataSync を使用して、同じ AWS アカウント内の 2 番目のファイルシステムへの Amazon FSx for Lustre ファイルシステムの定期的なレプリケーションをスケジュールできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Q: ある Amazon FSx for Lustre ファイルシステムから別のファイルシステムにコピーする際、DataSync はストライピングやレイアウトの設定をコピーしますか?

A: いいえ。ファイルはコピー先のファイルシステム上のファイルレイアウトやストライピング設定を使用して書き込まれます。

Amazon FSx for OpenZFS

Q: AWS DataSync は、Amazon FSx for OpenZFS ファイルシステムにどのようにアクセスしますか?

A: FSx for OpenZFS ファイルシステムとの間でコピーする DataSync タスクを作成すると、DataSync サービスにより、ファイルシステムが配置されているのと同じ VPC とサブネットに Elastic Network Interfaces (ENI) が作成されます。  DataSync はこれらの ENI を使用して、ルートユーザーとして OpenZFS プロトコルを使用して FSx for OpenZFS ファイルシステムにアクセスします。  FSx for OpenZFS ファイルシステム用の DataSync ロケーションリソースを作成する際に、ENI に適用するセキュリティグループを 5 つまで指定し、DataSync サービスからのアウトバウンドアクセスを設定することができます。  セキュリティグループは、FSx for OpenZFS が必要とするネットワークポート上のアウトバウンドトラフィックを許可するように設定する必要があります。 FSx for OpenZFS ファイルシステムのセキュリティグループは、FSx for OpenZFS ファイルシステムの DataSync ロケーションリソースに割り当てたセキュリティグループからのインバウンドアクセスを許可するように設定する必要があります。

Q: NFS 共有または Amazon EFS ファイルシステムと Amazon FSx for OpenZFS の間、または 2 つの Amazon FSx for OpenZFS ファイルシステム間でデータをコピーする際、どのようなメタデータが保持されますか?

A: AWS DataSync は、ファイルとフォルダのタイムスタンプ、およびユーザー ID、グループ ID、アクセス許可を含む POSIX のパーミッションをコピーします。詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Q: AWS DataSync を使用して、1 つの FSx for OpenZFS ファイルシステムから別のファイルシステムへデータを移行することはできますか?

A: はい。AWS DataSync を使用して、FSx for OpenZFS ファイルシステムから同じ AWS アカウント内の 2 番目のファイルシステムにコピーできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Q: AWS DataSync を使用して、Amazon FSx for OpenZFS ファイルシステムを別の AWS リージョンにレプリケートできますか?

A: はい。AWS DataSync を使用して、同じ AWS アカウント内の 2 番目のファイルシステムへの Amazon FSx for OpenZFS ファイルシステムの定期的なレプリケーションをスケジュールできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Amazon FSx for NetApp ONTAP

Q: AWS DataSync は、Amazon FSx for Netapp ONTAP ファイルシステムにどのようにアクセスしますか?

A: タスクを作成すると、DataSync は、Amazon FSx for NetApp ONTAP ファイルシステムが配置されているのと同じ VPC の優先サブネットに Elastic Network Interfaces (ENI) を作成します。優先サブネットは、FSx for ONTAP ファイルシステムを作成するときに設定され、DataSync はそのサブネットに作成した ENI を使用して、FSx for ONTAP ファイルシステムにアクセスします。FSx for ONTAP ファイルシステム用の DataSync Location リソースを作成する際に、ENI に適用するセキュリティグループを 5 つまで指定し、DataSync サービスからのアウトバウンドアクセスを設定することができます。FSx for ONTAP ファイルシステムのセキュリティグループを設定して、FSx for ONTAP ファイルシステムの DataSync Location リソースに割り当てたセキュリティグループからのインバウンドアクセスを許可するようにする必要があります。

Q: AWS DataSync は、Amazon FSx for NetApp ONTAP でどのプロトコルバージョンを使用することができますか?

A: AWS DataSync は、NFSv3、SMB 2.1、SMB 3 の使用をサポートしています。DataSync は現在、FSx for ONTAP での NFSv4 以上の使用はサポートしていません。

Q: Amazon FSx for NetApp ONTAP ファイルシステムとの間でデータをコピーするとき、AWS DataSync はファイルシステムのメタデータを保持しますか?

A: はい、AWS DataSync は NFS プロトコルを使用する場合、ファイルとフォルダのタイムスタンプ、およびユーザー ID、グループ ID、アクセス許可を含む POSIX のパーミッションをコピーします。SMB プロトコルを使用する場合、DataSync はファイルおよびフォルダのタイムスタンプ、所有権、および ACL をコピーします。詳細については、当社のドキュメントからコピーされたメタデータ全体のリストを参照してください。

Q: Amazon FSx for NetApp ONTAP にデータを移行する場合、どのプロトコルを使用すればよいですか?

A: SMB プロトコルを介してユーザーにサービスを提供する Windows サーバーまたは NAS 共有から移行する場合、DataSync SMB ソースロケーションと FSx for ONTAP ロケーションの SMB プロトコルを使用し、FSx for ONTAP ボリュームのセキュリティスタイルが NTFS 用に設定されていることを確認します。NFS プロトコルを介してユーザーにサービスを提供する Unix もしくは Linux サーバーまたは NAS 共有から移行する場合、DataSync NFS ソースロケーションと FSx for ONTAP ロケーションの NFS プロトコルを使用し、FSx for ONTAP ボリュームのセキュリティスタイルが Unix 用に設定されていることを確認します。マルチプロトコル移行については、ブログ Amazon FSx for NetApp ONTAP によるマルチプロトコルワークロードの実現で説明されているベストプラクティスを確認し、SMB プロトコルを使用してファイルシステムのメタデータを最も忠実に保持する必要があります。FSx for ONTAP ボリュームのセキュリティスタイルの設定に関する詳細については、FSx for ONTAP ボリュームの管理に関するドキュメントを参照してください。

Q: AWS DataSync を使用して、異なるプロトコルを使用して同じ Amazon FSx for NetApp ONTAP ファイルシステムにアクセスすることは可能ですか?

A: はい、ただし、各プロトコル (NFS または SMB) に対して、個別の DataSync ロケーション/タスクリソースを作成する必要があります。データの上書きやデータ検証の問題を避けるため、複数の DataSync タスクを使って同じボリュームパスに同時にコピーすることはお勧めしません (同じプロトコルを使う場合も、異なるプロトコルを使う場合も同じです)。

Q: AWS DataSync を使用して、Amazon FSx for NetApp ONTAP iSCSI LUN との間でデータを転送することはできますか?

A: いいえ、DataSync は、NFS または SMB プロトコルを使用した FSx for ONTAP ボリュームとの間でのファイルデータのコピーのみをサポートしています。

Q: AWS DataSync を使用して、1 つの Amazon FSx for NetApp ONTAP ファイルシステムから別のファイルシステムへデータをコピーできますか?

A: はい。AWS DataSync を使用して、FSx for ONTAP ファイルシステムから同じ AWS アカウント内の 2 番目のファイルシステムにコピーできます。この機能は、同じリージョンとクロスリージョンの両方のデプロイで利用でき、DataSync エージェントを使用する必要はありません。

Q: AWS DataSync を使って、Amazon FSx for NetApp ONTAP ファイルシステムを、別の AWS リージョンにある別のファイルシステムにレプリケートすることはできますか?

A: DataSync はファイルシステム間でデータをレプリケートするのに使用できますが、FSx for ONTAP ファイルシステム間でレプリケートするには NetApp SnapMirror を使用することをお勧めします。SnapMirror を使用すると、ファイルシステム内のファイルの数やサイズに関係なく、低い RPO を実現できます。

Q: AWS DataSync でスナップショットディレクトリをコピーしないように設定するには、どうすればよいですか?

A: DataSync は自動的に「.snapshot」という名前のフォルダを除外します。また、除外フィルターを使用して、指定したパターンに一致するファイルやフォルダをコピーしないようにすることも可能です。

AWS Snow ファミリーデバイス間の移動

Q: AWS Snowcone と AWS ストレージサービス間でデータを移行するにはどうすればよいですか?

A: DataSync エージェントは Snowcone デバイスに AMI としてプリインストールされています。AWS にオンラインでデータを移行するには、AWS Snowcone デバイスを外部ネットワークに接続し、AWS OpsHub または CLI を使用して DataSync エージェント AMI を起動します。AWS マネジメントコンソールまたは CLI を使用してエージェントを有効化し、AWS Snowcone の NFS ストアと Amazon S3、Amazon EFS、Amazon FSx for Windows File Server、Amazon FSx for Lustre、Amazon FSx for OpenZFS、または Amazon FSx for NetApp ONTAP の間でオンラインデータ移行タスクを設定します。

Q: Snow 上の Amazon S3 互換ストレージと AWS ストレージサービスの間でデータを移動する方法を教えてください

A: まず、オンプレミス環境に DataSync エージェントをデプロイします。AWS マネジメントコンソールまたは CLI を使用してエージェントをアクティブ化し、Amazon S3 互換ストレージ上のバケットと Amazon S3、Amazon EFS、または任意の Amazon FSx ファイルシステムの間でデータを移動するように DataSync タスクを設定します。

パフォーマンス

Q:  AWS DataSync がファイルシステムを AWS にコピーする速度はどれくらいですか?

A: AWS DataSync が特定のデータセットをコピーできる速度は、データの量、転送元と転送先のストレージから得られる I/O 帯域幅、使用可能なネットワーク帯域幅、およびネットワーク条件によって異なります。オンプレミスと AWS ストレージサービス間のデータ転送では、単一の DataSync タスクで 10 Gbps ネットワークリンクを完全に利用できます。

Q:  AWS DataSync のタスクが使用するネットワーク帯域幅の量をコントロールできますか?

A: はい。組み込みの帯域幅スロットルを設定することで、AWS DataSync が使用するネットワーク帯域幅の量をコントロールできます。 データ転送タスクの実行中に、この制限を増減できます。これにより、同じネットワーク接続に依存している他のユーザーやアプリケーションへの影響を最小限に抑えることができます。

Q: AWS DataSync のパフォーマンスを監視するにはどうすればよいですか?

A: AWS DataSync は Amazon CloudWatch メトリックを生成して、転送プロセスの詳細な可視性を提供します。これらのメトリックを使用して、ファイルの数とコピーされたデータの量、およびファイルの検出と検証の進行状況を確認できます。DataSync コンソールで、これらのメトリックを使用して CloudWatch グラフを直接表示できます。

Q: AWS DataSync は、転送元ファイルシステムのパフォーマンスに影響しますか?

A: オンプレミスのファイルストアの容量と転送されるファイルの数とサイズによっては、エージェントがそのストレージからデータを読み書きするため、同じソースデータストアにアクセスするときに AWS DataSync が他のクライアントの応答時間に影響することがあります。タスクの帯域幅制限を設定すると、ストレージシステムに対する I/O を制限することで、この影響を軽減できます。

セキュリティとコンプライアンス

Q: AWS DataSync Discovery はどのようにオンプレミスストレージにアクセスしますか?

AWS DataSync Discovery は、DataSync エージェントを使用して、ストレージシステムの管理/API インターフェイスにアクセスします。すべてのアクセス権は読み取り専用です。ストレージへのアクセスに使用される API の詳細については、DataSync のドキュメントを参照してください。

Q: AWS DataSync Discovery を使用する場合、オンプレミスストレージシステムの認証情報を指定するにはどうすればよいですか? また、それらはどのように保護されますか?

ストレージシステムを検出するように AWS DataSync Discovery を設定するときは、ストレージの API インターフェイスにアクセスするためのユーザー名とパスワードを指定します。その後、AWS DataSync Discovery は AWS Secrets Manager にシークレットを自動的に作成し、認証情報を保存します。DataSync Discovery が検出ジョブを実行すると、シークレットからパスワードを取得および再暗号化し、その暗号化されたパスワードをジョブに使用されるエージェントに送信します。パスワードは、ジョブの期間中のみエージェントのメモリに保持され、パスワードがメモリの外部に永続化されることはありません。

Q: データは、転送中および保存中に暗号化されていますか?

A: はい。転送元と転送先の間で転送されるすべてのデータは、Transport Layer Security (TLS、Secure Sockets Layer (SSL) の代替) を使用して暗号化されます。データは、AWS DataSync 自体に保持されることはありません。このサービスは、S3 バケットのデフォルトの暗号化保存中のデータの Amazon EFS ファイルシステム暗号化保存中および転送中の Amazon FSx 暗号化の使用をサポートしています。

Q: AWS DataSync はどのようにして NFS サーバーまたは SMB ファイル共有にアクセスしますか?

A: AWS DataSync は、IT 環境あるいは Amazon EC2 にデプロイするエージェントを使用して、NFS または SMB プロトコルを通じてファイルにアクセスします。このエージェントは AWS 内の DataSync サービスエンドポイントに接続し、AWS マネジメントコンソールまたは CLI から安全に管理されます。

Q: AWS DataSync はどのようにして Hadoop クラスター上の HDFS にアクセスしますか?

A: AWS DataSync は、IT 環境あるいは Amazon EC2 にデプロイするエージェントを使用し、Hadoop クラスターにアクセスします。DataSync エージェントは HDFS クライアントとして動作し、クラスター内の NameNodes および DataNodes と通信します。タスクを開始すると、DataSync はプライマリ NameNode にクエリを実行し、クラスター上のファイルとフォルダの場所を特定します。その後、DataSync はクラスター内の DataNodes と通信して、ファイルやフォルダを HDFS へ、または HDFS からコピーします。

Q: AWS DataSync は、Amazon S3 プロトコルをサポートするセルフマネージドストレージまたはクラウドオブジェクトストレージにどのようにアクセスしますか?

A: AWS DataSync は、データセンターやパブリッククラウド環境、または Amazon EC2 にデプロイしたエージェントを使用して、Amazon S3 API のオブジェクトにアクセスします。このエージェントは AWS 内の DataSync サービスエンドポイントに接続し、AWS マネジメントコンソールまたは CLI から安全に管理されます。

Q: AWS DataSync はどのようにして Azure Blob ストレージコンテナ (プレビュー) にアクセスするのですか?

A: AWS DataSync は、Azure 環境または Amazon EC2 にデプロイしたエージェントを使用して、Azure Blob ストレージコンテナ内のオブジェクトにアクセスします。エージェントは AWS 内の DataSync サービスエンドポイントに接続し、AWS マネジメントコンソールまたは CLI から安全に管理されます。エージェントは、DataSync Azure Blob ロケーションの作成時に指定した SAS トークンを使用して Azure コンテナを認証します。

Q: AWS DataSync では、転送先ストレージに接続するために VPN を設定する必要がありますか?

A: いいえ。プレミスとの間でデータをコピーする場合、VPN/トンネルをセットアップしたり、インバウンド接続を許可したりする必要はありません。AWS DataSync エージェントは、標準のネットワークポートを使用してファイアウォールを経由するように設定できます。また、Amazon Virtual Private Cloud (Amazon VPC) 内に、VPC エンドポイントを使用して AWS DataSync をデプロイできるようになりました。VPC エンドポイントを使用する場合、DataSync エージェントと AWS のサービスの間で転送されるデータは、パブリックインターネットを通過したり、パブリック IP アドレスを必要としたりしません。

Q: AWS DataSync エージェントはどのように AWS に安全に接続しますか?

A: AWS DataSync エージェントは、選択した AWS リージョン内の DataSync サービスエンドポイントに接続します。公共インターネットのエンドポイント、Federal Information Processing Standards (FIPS) が承認したエンドポイント、もしくは自分の VPC にあるエンドポイントの内から、接続先を選択できます。エージェントをアクティブ化すると、エージェントが AWS アカウントに安全に関連付けられます。詳細については、サービスエンドポイントを選択およびエージェントのアクティブ化を参照してください。

Q:  AWS DataSync エージェントは、どのようにしてパッチ適用および更新されますか?

A: 基盤となるオペレーティングシステムと AWS DataSync ソフトウェアパッケージの両方を含むエージェント VM の更新は、エージェントがアクティブ化されると AWS が自動的に適用します。更新は、エージェントがアイドル状態で、データ転送タスクを実行していないときに無停止で適用されます。

Q: AWS DataSync は、どのコンプライアンスプログラムをサポートしていますか?

A: AWS には、クラウドで最長のコンプライアンスプログラムがあります。AWS は、お客様が要件をナビゲートできるように支援することを約束いたします。AWS DataSync は、世界および業界のセキュリティ基準に適合していると評価されています。DataSync は PCI DSS、ISO 9001270012701727018SOC 1、2、および 3 に適合しており、さらに HIPAA 対応を遵守しています。 DataSync は、FedRAMP Moderate の AWS 米国東部/西部リージョンおよび FedRamp High の AWS GovCloud (米国) リージョンでも承認されています。これにより、お客様が AWS のセキュリティを確認し、ご自身の義務を果たすことが容易になります。詳細情報およびリソースについては、コンプライアンスのページを参照してください。また、コンプライアンスプログラムによる対象範囲内のサービスのページにアクセスして、サービスおよび認定の詳細な一覧を参照することも可能です。

Q: AWS DataSync は PCI に準拠していますか?

A: はい。AWS DataSync は PCI-DSS に準拠しており、支払い情報の転送に使用できます。AWS Artifact で PCI コンプライアンスパッケージをダウンロードして、AWS で PCI 準拠を実現する方法の詳細をご覧いただけます。

Q: AWS DataSync は、HIPAA 対応ですか?

A: はい。AWS DataSync は HIPAA 対応です。つまり、AWS で HIPAA BAA を使用している場合、DataSync を使用して保護されるべき医療情報 (PHI) を転送できます。

Q: AWS DataSync は、AWS 米国東部/西部で FedRAMP JAB Moderate Provisional Authorization を使用していますか?

A: はい。AWS DataSync は、米国東部/西部リージョンの Federal Risk and Authorization Management Program (FedRAMP) Moderate ベースラインに基づき、Joint Authorization Board (JAB) から Provisional Authority to Operate (P-ATO) を受け取りました。連邦または法人のお客様は、AWS 東部/西部リージョンの認証境界で AWS DataSync を使用して、影響度が中レベルのデータを取得できます。

Q: AWS DataSync には、AWS GovCloud (米国) リージョンに FedRAMP JAB High Provisional Authorization をお持ちですか?

A: はい。AWS DataSync は、米国 GovCloud リージョンの Federal Risk and Authorization Management Program (FedRAMP) High ベースラインに基づき、Joint Authorization Board (JAB) から Provisional Authority to Operate (P-ATO) を受け取りました。連邦または法人のお客様は、AWS GovCloud (米国) リージョンの認証境界で AWS DataSync を使用して、影響度の高いデータを取得できます。

AWS DataSync をいつ選択するか

Q:  AWS DataSync は、rsync や Amazon S3 コマンドラインインターフェイスなどのコマンドラインツールを使用するのとどのように違いますか?

A: AWS DataSync は、AWS への大規模なアクティブデータセットの移動を完全に自動化および高速化します。Amazon S3、Amazon EFS、Amazon FSx、Amazon CloudWatch、およびAWS CloudTrail とネイティブに統合されており、ストレージサービスへのシームレスで安全なアクセスを提供し、転送を詳しくモニタリングします。

DataSync は、専用のネットワークプロトコルとスケールアウトのアーキテクチャを使用して、データを転送します。 オンプレミスと AWS ストレージサービス間のデータ転送では、単一の DataSync タスクで 10 Gbps ネットワークリンクを完全に利用できます。

DataSync はデータ転送を完全に自動化します。再試行とネットワーク耐障害性メカニズム、ネットワークの最適化、組み込みのタスクスケジューリング、タスクレポートによる監査、DataSync API とコンソールによるモニタリング、CloudWatch メトリクスが組み込まれており、イベントおよびログを使って転送プロセスを詳細に確認できます。DataSync は、転送中と転送終了時の両方でデータの整合性検証を実行します。

DataSync はエンドツーエンドのセキュリティを提供し、AWS ストレージサービスと直接統合します。転送元と転送先の間で転送されるすべてのデータは TLS を介して暗号化され、AWS ストレージへのアクセスは IAM ロールなどの組み込みの AWS セキュリティメカニズムを介して有効になります。VPC エンドポイントを使用した DataSync が有効になり、組織と AWS の間で転送されるデータがパブリックインターネットを通過せず、ネットワークを介してコピーされるデータのセキュリティがさらに向上します。

Q: バケット間でオブジェクトを転送するには、AWS DataSync をいつ利用したらいいですか? また S3 レプリケーションと S3 バッチオペレーションはいつ実行したらいいですか?

A: AWS には、バケット間でオブジェクトをコピーするための複数のツールが用意されています。

継続的なデータ配信、データパイプライン、データレイクの取り込み、および複数のバケット間でのデータの統合または分割には、AWS DataSync を使用します。

特定の宛先バケットへのデータの継続的なレプリケーションには、S3 レプリケーションを使用します。

S3 オブジェクトの大規模なバッチオペレーションを行うには、S3 バッチオペレーションを使用します。それには、オブジェクトをコピーしたり、オブジェクトタグやアクセスコントロールリスト (ACL) を設定したり、Amazon S3 Glacier Flexible Retrieval (旧 S3 Glacier) からのオブジェクトの復元を開始したり、AWS Lambda 関数を呼び出してオブジェクトを使ってカスタムアクションを実行したり、S3 Object Lock のリーガルホールドを管理したり、S3 Object Lock の保持日を管理したりすることなどがあります。

Q:  AWS DataSync と AWS Snowball Edge はいつ使用しますか?

A: AWS DataSync は、オンラインデータ転送に最適です。DataSync を使用して、AWS との間でアクティブなデータの移行が可能です。分析や処理を目的としてクラウドにデータを転送したり、オンプレミスのストレージ容量を解放するためにデータをアーカイブし、ビジネス継続性を確保する目的で AWS にデータをレプリケートしたりできます。

AWS Snowball Edge は、帯域幅が制限されているお客様や、リモート環境、切断された環境、または厳しい環境からデータを転送するお客様のオフラインデータ転送に最適です。 

Q:  AWS DataSync と AWS Storage Gateway はいつ使用しますか?

A: AWS DataSync を使用して既存のデータを Amazon S3 に移行し、次に AWS Storage Gateway のファイルゲートウェイ構成を使用して、移行したデータへのアクセスを保持し、オンプレミスのファイルベースアプリケーションからの継続的な更新に使用します。

DataSync とファイルゲートウェイの組み合わせを使用して、オンプレミスのインフラストラクチャを最小限に抑えながら、オンプレミスのアプリケーションをクラウドストレージにシームレスに接続できます。AWS DataSync を使用すると、AWS ストレージサービスへのオンラインデータ転送を自動化および高速化できます。 AWS DataSync を使用した最初のデータ転送フェーズの後、ファイルゲートウェイは、移行されたデータへの低レイテンシーアクセスをオンプレミスアプリケーションに提供します。NFS 共有で DataSync を使用する場合、ソースオンプレミスストレージからの POSIX メタデータが保持され、ファイルゲートウェイを使用してファイルにアクセスするときにソースストレージからのアクセス許可が適用されます。

Q: いつ AWS DataSync を使用し、いつ Amazon S3 Transfer Acceleration を使用しますか?

A: アプリケーションが既に Amazon S3 API に統合されていて、大きなファイルを S3 に転送するために高いスループットが必要な場合は、S3 Transfer Acceleration を使用できます。既存のストレージシステム (ネットワーク接続ストレージなど) や変更できない機器 (DNA シーケンサー、ビデオカメラなど) からデータを転送する場合や、複数の転送先が必要な場合は、AWS DataSync を使用します。DataSync はまた、組み込みの再試行とネットワーク耐障害性メカニズム、データの完全性の検証、および帯域幅のスロットリング、ニーズに合わせた柔軟な設定といった追加機能を提供することで、データ転送を自動化および簡素化します。

Q: いつ AWS DataSync を使用し、いつ AWS Transfer Family を使用しますか?

A: 現在 SFTP を使用して第三者とデータを交換している場合、AWS Transfer Family は、運用上の負担を軽減しながら、Amazon S3 との間で直接管理されるフルマネージド型の SFTP、FTPS、FTP、および AS2 転送を提供します。

NFS サーバー、SMB ファイル共有、Hadoop クラスター、セルフマネージドまたはクラウドオブジェクトストレージ、AWS Snowcone、Amazon S3、Amazon EFS、および Amazon FSx 間の高速で自動化されたデータ転送が必要な場合は、AWS DataSync が適しています。DataSync は、アクティブなデータセットのオンライン移行、継続的に生成されるデータのタイムリーな転送、またはビジネス継続性のためのレプリケーションが必要なお客様に最適です。 

DataSync の料金の詳細
料金の詳細を確認する

AWS DataSync の料金はシンプルで予測可能な使用ベースであり、コピーするデータ量に対してのみ料金が発生します。 

詳細 
AWS アカウントにサインアップする
無料のアカウントにサインアップする

AWS 無料利用枠にすぐにアクセスできます。 

 

サインアップ 
コンソールで DataSync の使用を開始する
コンソールでデータの移動を開始する

AWS コンソールで AWS DataSync を使用して構築を開始します。

サインイン