メインコンテンツに移動

データポータビリティ (データ移植) とは何ですか?

データポータビリティとは、2 つのシステム間で自由にデータを移動できることです。現代の企業には、ユースケース、地理的位置、規制、お客様の期待に応じて、さまざまなデータストレージとアクセスの要件があります。データポータビリティにより、企業はクラウドサービスプロバイダーとオンプレミスシステム間で必要に応じてデータを転送できるため、要件を最大限満たすことができます。

データポータビリティはなぜ重要ですか?

レガシーシステムでは、お客様に独自のデータ形式とライセンス義務が強制され、お客様は特定のシステムに縛り付けられていました。データの移動に関する複雑な技術的課題、コストの上昇、ベンダーロックインの強制などがありました。データポータビリティがなければ、組織のデータには、そのデータが保存されているプラットフォームからしかアクセスできません。このようなサイロ化されたアプローチでは、データへのアクセス不能やデータ品質の問題が発生する可能性があります。

データポータビリティの利点は次のとおりです。

分析のためのデータアクセシビリティをサポート

データポータビリティはデータサイロを解消し、複数のシステムから単一の中央リポジトリにデータがシームレスに流れるようにします。信頼できる唯一の情報源を作成することで、ビジネスアナリストはよりアクセスしやすいシステムを用意し、そこから情報を引き出すことができます。さらに、アナリストはこの一元化されたデータプールで BI、ML、AI 向けのさまざまなツールセットを使用して、他の部門にリアルタイムの洞察と意思決定機能を提供できます。

カリフォルニア州消費者プライバシー法と GDPR への準拠をサポート

一般データ保護規則 (GDPR) の第 20 条には、すべての個人がデータポータビリティの権利を有すると記載されています。さらに、カリフォルニア州消費者プライバシー法 (CCPA) は、組織に対して、異なる場所間でデータを移植できるシステムを実装することを義務付けています。これにより、不要なデータサイロが排除され、データの民主化が促進されます。

これらのデータ保護法は、データ管理者がデータポータビリティを実装することを保証し、データ主体と関係するすべての当事者が自身の情報を管理できるようにします。

データ品質管理を強化

データポータビリティには、すべてのデータが企業内を自由に移動し、最終的に信頼できる唯一の情報源に到達できるシステムを構築することが含まれます。この方法でデータを照合することで、組織はデータ品質管理チェックを実施して、データの検証、重複排除、メタデータのタグ付けを確認できます。これらの手法により、重複したデータ、無効なデータ、古いデータをすべて削除して、高品質で完全なデータのみを一元化されたデータストレージシステムに配信できます。

データポータビリティはどのように実装されますか?

企業はデータポータビリティを実装するために、いくつかの戦略を採用しています。

オープンデータ形式

JavaScript Object Notation (JSON)、Extensible Markup Language (XML)、Parquet、カンマ区切り値 (CSV) など、データポータビリティを容易にする非専有のデータ形式がいくつかあります。これらの形式はそれぞれ、データウェアハウスやビジネスインテリジェンスプラットフォームで広くサポートされているため、データポータビリティの統合が容易になり、アナリストはデータセットを操作できます。データポータビリティの要求に応じて、常に個人データを提供し、これらのオープンデータ形式で個人データを送信します。

お客様による選択

企業は、お客様が自身のデータを完全に制御できるフレームワークを利用することで、システムにデータポータビリティを実装できます。企業が従うべき基本的なフレームワークは次のとおりです。

  • お客様が、IoT デバイスからのすべての情報、位置データ、ウェアラブルデバイスからのデータ、企業とのやり取りから生成されるデータを含め、自身のデータを所有する。
  • お客様が、自身が選択した形式でコンテンツを保存できる。
  • お客様が、自身のデータを保存する地理的な場所を選択する。この場所は、お客様が個人データを他の場所に送信することを要求しない限り変更されない。
  • お客様は、いつでも自身のデータをダウンロードまたは削除できる。

お客様が自身のデータを完全に制御できるようにすることで、お客様は手間をかけずにプロバイダーを切り替えたり、データを再配置したりできます。

相互運用性

相互運用可能な形式を使用すると、データを変更せずに異なるシステムやネットワーク間を簡単に移動できるため、データポータビリティが向上します。相互運用可能なシステムでは、シームレスなデータ移動を促進するために、標準化されたアプリケーションプログラミングインターフェイス (API) と接続を利用する必要があります。

さらに、サーバーメッセージブロック (SMB)、ネットワークファイルシステム (NFS)、ハイパーテキスト転送プロトコルセキュア (HTTPS)、SSH ファイル転送プロトコル (SFTP) などの標準データ転送プロトコルを実装すると、データのシームレスな移動が促進されます。

データポータビリティを維持するためのベストプラクティスは何ですか?

企業がデータポータビリティを維持し、データポータビリティの要求を確実に満たすために使用できる戦略は数多くあります。

データを理解する

企業が使用するデータの種類と形式、データの入手元と保存場所、企業内でのデータの取り扱い方法を幅広く理解することで、適切な転送システムの使用を促進できます。システム内のすべてのデータを完全に可視化することで、データポータビリティを実装する準備が整い、その対象範囲が包括的になります。

自動化を実装する

企業が使用するデータ転送方法を自動化することで、開発者は標準化されたデータ形式とプロトコルを必然的に採用することになり、異なるシステム間でこれらの自動処理が容易になります。自動システムにより、以下が実現します。

  • データポータビリティの労力が軽減される
  • データ整合性が向上する
  • システム間のデータ移行が改善される
  • データ転送システムが改善される

データガバナンスを一元化する

データガバナンスフレームワークは、組織が保存するデータをどのように管理および使用するかを決定します。データガバナンスを一元化し、信頼できる全社的なシステムを確立することで、保持、削除、監査、アクセス管理に関するデータポリシーを標準化できます。効果的なデータガバナンスは効果的なデータポータビリティにつながり、データを追跡可能、移動可能な状態にでき、コンプライアンスを維持できます。

データ品質管理を確保する

データ品質に関するあらゆる問題を調査して、その根本原因を突き止めます。データの検証または変換プロセスにはエラーがある可能性があり、それが原因でデータ管理システムで大きな問題が発生することがあります。これらのデータ品質管理の問題を解決することで、データの整合性を維持し、データシステム全体を問題なく移動可能な状態に保つことができます。

AWS はデータポータビリティの要件をどのようにサポートしていますか?

お客様に選択肢と自由を提供することは、AWS 全体の中核的な原則です。お客様は、自身のデータの保存場所、保存方法、アクセスできるユーザーなど、常にデータの所有権と管理権を保持しています。AWS は、さまざまな種類のデータベースを提供しており、それぞれ異なるタイプのデータに適しています。お客様が単一タイプのデータベースを使い続けるという契約上の義務はありません。次のことが可能です。

  • AWS で他のベンダーのデータベースを実行する
  • データベースを実行するインスタンスのタイプをいつでも変更する
  • AWS からデータをエクスポートする

AWS が行うすべてにより、お客様は利用できる最適なクラウドサービスと機能を自由に選択できます。

AWS は、AWS へのデータ移行とAWS からのデータ移行の両方をサポートする多くのツールと文書化された手法を提供しています。AWS のサービスは、SQL、Linux、Xen などの多数のオープンスタンダードに基づいて構築されています。例えば、次のことができます。

  • AWS Direct Connect を使用して、ネットワークリンクでデータセンターを AWS リージョン内の仮想プライベートクラウド (VPC) に直接プライベート接続する
  • AWS DataSync を使用して、ファイルシステムデータを Amazon S3 または Amazon EFS にコピーまたは複製する
  • AWS Storage Gateway – ファイルゲートウェイを使用して、既存のオンプレミスアプリケーションを、Amazon S3 にオブジェクトとして保存されるファイル用のクラウドストレージに接続する
  • AWS Storage Gateway – テープゲートウェイを使用して、既存のオンプレミスアプリケーションをテープバックアップ用のクラウドストレージに接続する
  • AWS Storage Gateway – ボリュームゲートウェイを使用して、既存のオンプレミスアプリケーションをブロックボリューム用のクラウドストレージに接続する
  • AWS Database Migration Service を使用して、データベースを最小限のダウンタイムで迅速かつ安全に AWS に移行する
  • Amazon S3 Transfer Acceleration を使用して、地理的に離れた場所からでも Amazon S3 へのデータの読み書きを行う
  • Amazon Data Firehose を使用して、複数のストリーミングデータソースを収集して取り込む。

Amazon Data Portability API を使用すると、ユーザーは Amazon サービスから自分の個人データにアクセスし、機械で読み取り可能な形式でエクスポートできます。これにより、開発者はユーザーデータの安全な取得と転送を支援するツールを作成でき、透明性、ユーザー管理、データプライバシー規制への準拠をサポートできます。

今すぐ無料アカウントを作成して、AWS でデータポータビリティの使用を開始しましょう。