データ転送とは何ですか?
データ転送とは何ですか?
データ転送は、システムの再構成の一環で、またはデータの利用とセキュリティを強化するために、システム間でデータを移動するプロセスです。通常、ネットワークを介してソースから宛先にデータをコピーします。
ソースコピーとターゲットコピーの両方を保持する場合、データレプリケーションまたはデータバックアップと呼ばれ、2 つのコピー間の変更を継続的に同期する必要があります。ソースコピーが削除または廃止された場合、このプロセスはデータ移行と呼ばれます。
データ転送には、データストレージデバイスをある場所から別の場所に物理的に輸送することも含まれる場合があります
データ転送はなぜ行われるのですか?
企業がデータをある場所またはシステムから別の場所またはシステムに転送する理由はいくつかあります。
クラウドへのデータの移行
クラウドへのデータ移行は、企業がローカルのオンプレミスデータをクラウドベースのインフラストラクチャに再配置できるため、最も一般的なデータ転送形式の 1 つです。クラウドへの移行により、企業はストレージとコンピューティングを無制限に拡張できるだけでなく、データ使用量のスケーラビリティも向上し、組織全体でデータへのアクセスを強化できるようになります。クラウドへの移行は、データモダナイズの標準的な部分です。
データのバックアップ
データのバックアップはディザスタリカバリに不可欠であり、企業にはデータの多数のポイントインタイムコピーが提供され、運用の継続性が確保されます。企業はバックアップを作成して複数の場所に配布することで、セキュリティ体制を強化し、災害による最悪の事態を防ぐことができます。多くの場合、データのコピーを遠隔地に転送してバックアップを作成することは、データ管理の標準的な部分です。
データアーカイブ
データアーカイブには、あまり使用されないデータを長期保管設備に送信することが含まれます。これらの代替データウェアハウスを使用することで、企業はアクティブな運用のスペースを解放して、より重要なデータセットを保管できます。ファイルをデータアーカイブに転送することで、現在のワークロードであまりスペースを占有することなく、必要に応じてデータにアクセスできるようにもなります。
ハイブリッドワークフロー
ハイブリッドクラウドワークフロー (クラウドでのバーストとも呼ばれる) は、企業がピーク時に追加の需要に対応するために一時的にデータをクラウドに転送する場合に発生します。この形式のデータ共有には、クラウドとの間の大量の移動を管理するために、高速なデータ転送速度、信頼性の高い転送、および大きなネットワーク帯域幅が必要です。
データ転送はどのように行われますか?
企業がデータ転送に使用できる主なワークフロー戦略は 2 つあります。
手動データ転送
手動データ転送戦略では、クラウドサービスプロバイダーが物理デバイスを企業に送り、ユーザーがデータをロードして返送します。これにより、すべてのデータがクラウドアカウントに安全にアップロードされ、転送プロセス中にデータの完全性が損なわれることについて企業が抱く懸念が軽減されます。物理デバイスによるアプローチでは、帯域幅の制限やデータ転送速度の低下など、他の通信チャネルに影響する大規模なデータセットの移動に関する懸念も解消されます。
自動データ転送
自動データ転送は、ネットワークベースのツールとサービスを利用して、人間の介入なしに異なるシステム間でデータを転送します。自動アプローチは、外部のバックアップサイトに依存する企業などの、データを頻繁にまたは継続的に移動する必要があるビジネスに特に役立ちます。企業によっては、ファイル転送プロトコルシステムを自動化して、あるサーバーから別のサーバーへのファイルの移動を効率化する場合があります。組織は継続的にデータを転送することも、データをバッチ処理することもできます。これにより、負担は軽減されますが、時間がかかります。
データ転送に関する主な考慮事項は何ですか?
企業がデータ転送を行うときに考慮すべき重要な考慮事項がいくつかあります。
可用性
データ転送のコンテキストでの可用性とは、アクセスを妨げるような中断なしに、企業が必要とするときにいつでもサービスを利用できることです。データ転送プロセスでの高可用性の計画には、回復力のあるサービスの使用、データソースへのアクセス性の確保、および耐障害性のあるデータセンターの使用が含まれます。
信頼性
信頼性とは、ソースから送信されたデータが、データの破損、複製、損失なしにターゲットに確実に届くようにすることです。信頼性には、データパイプラインのすべてのステップの可視性を高めるエンドツーエンドの検証を実装することが含まれます。完全な可視性により、データエンジニアはデータ転送プロセスのあらゆる問題を特定し、前述の問題を引き起こす前に問題を解決できます。
効率
データ転送の効率とは、消費するリソースをできるだけ抑えながら、データ転送プロセスを合理化することです。効率的なデータ転送システムは、非同期転送や同期転送などの戦略を使用して、潜在的な中断を最小限に抑え、転送速度を最大化します。
データ圧縮技術の向上、シリアル伝送の代わりのパラレル伝送の使用、可能な場合の有線接続の利用により、効率が向上します。
レイテンシー
レイテンシーとはデータ転送速度の変動であり、多くの場合、コンピューターネットワークの状態や特定の時点での合計帯域幅使用量などの要因に関連しています。レイテンシーが大きいと、プラットフォーム間のデジタル通信の効率が低下し、予期しない中断が発生する可能性があります。
冗長性
冗長性とはデータを不必要に複製することであり、会社に目に見えるメリットをもたらすことなく時間とリソースを消費します。データバックアップを作成するときなどの特定のシナリオでは、データの複製は必要であり、データ転送の主な理由になる場合もあります。データの 2 つめのコピーを作成する理由がない場合、同じデータの 2 つのバージョンが作成されるデータ転送によって、システムに冗長性が生じます。
セキュリティ
組織は、セキュリティインシデントが発生する可能性を最小限に抑えるために、安全なデータ転送方法を常に順守する必要があります。ネットワークとデータ保護により、機密情報がプライベートに保たれます。データ伝送システムおよびシステム間通信プロトコルの大部分は、移動中のデータを全行程をとおして可能な限り安全に保つために、厳格なセキュリティ防御を採用しています。
AWS クラウドサービスはデータ転送要件をどのようにサポートできますか?
AWS は、AWS クラウドに向かうか、その内部でのデータ転送に役立つ幅広いソリューションを提供しています。例えば、次を使用できます。
- AWS DataSync は、エンドツーエンドのセキュリティ、シンプルな計画、データ移動管理により、データを安全に検出して AWS に移行します。
- AWS Direct Connect は、AWS への専用ネットワーク接続を作成します。これにより、複数の暗号化オプションにより、お客様のネットワークと AWS 間を移動するデータを保護します。
- Amazon Data Firehose は、データをストリーミングします。リアルタイムストリームをデータレイク、ウェアハウス、分析サービスに確実にロードするができます。
- AWS Snowcone は、安全で頑丈なデバイスにアクセスして、AWS のコンピューティング機能とストレージ機能をエッジ環境に導入し、AWS との間でデータを転送します。
- AWS Transfer Family は、AWS との間のファイルデータ転送を簡単に管理します。
今すぐ無料アカウントを作成して、AWS でのデータ転送の使用を開始しましょう。