跳至主要内容

什么是数据可移植性(数据移植)?

数据可移植性是指在两个系统之间自由迁移数据的能力。现代企业对数据存储和访问的要求各不相同,具体取决于使用案例、地理位置、法规要求及客户期望。数据可移植性使企业可以根据需要在云服务提供商和本地系统之间传输数据,从而最大限度地满足需求。

为什么数据可移植性如此重要?

遗留系统强制客户使用专有数据格式并履行许可义务,将客户锁定在特定系统中。围绕数据迁移的复杂技术挑战、不断攀升的成本以及强加的供应商锁定。如果缺乏数据可移植性,则仅能通过存储数据的平台访问组织的数据。这种孤岛式的方法可能导致数据无法访问和数据质量问题。

数据可移植性的好处包括:

支持数据可访问性以供分析

数据可移植性可消除数据孤岛,使数据能够从多个系统顺畅流向单一中央存储库。通过建立单一事实来源,业务分析师可通过更易访问的系统获取所需信息。此外,分析师可在此集中式数据池上运用多种商业智能、机器学习和人工智能工具,从而为其他部门提供实时见解和决策支持功能。

支持符合《加州消费者隐私法》(CCPA)和《通用数据保护条例》(GDPR)的合规要求

《通用数据保护条例》(GDPR)第 20 条规定,每个人都有权要求数据可移植性。此外,《加州消费者隐私法》(CCPA)要求组织实施能够在不同地点之间传输数据的系统,消除不必要的数据孤岛,并促进数据民主化。

这些数据保护法确保数据控制者落实数据可移植性,使数据主体及所有相关方能够掌控其信息。

强化数据质量管理

数据可移植性涉及创建系统,使所有数据能够在企业内部自由移动,最终汇聚到单一事实来源。通过这种方式整合数据,组织可以实施数据质量管理检查,以筛选数据验证、数据去重和元数据标记。这些实践将移除所有重复、无效或过时的数据,确保仅向集中式数据存储系统传输高质量的完整数据。

数据可移植性如何实现?

企业采用多种策略,以实现数据可移植性。

开放数据格式

存在多种促进数据可移植性的非专有数据格式,例如 JavaScript 对象表示法(JSON)、可扩展标记语言(XML)、Parquet 格式以及逗号分隔值(CSV)格式。这些格式均得到数据仓库和商业智能平台的广泛支持,使得数据可移植性易于集成,并且有利于分析师与数据集进行交互。响应数据可移植性请求时,始终以这些开放数据格式提供个人数据并传输个人数据。

客户选择

企业可通过利用赋予客户完全数据控制权的框架,将数据可移植性功能集成到其系统中。以下是企业应遵循的一些基本框架:

  • 客户拥有自己的数据,包括来自物联网设备的所有信息、位置数据、可穿戴设备数据,以及与企业互动过程中生成的数据。
  • 客户可按照自己选择的格式存储内容。
  • 客户可选择数据存储的地理位置,该位置不会出现变化,除非客户要求将个人数据传输至其他位置。
  • 客户可随时下载或删除其数据。

让客户完全控制自己的数据,确保其能够轻松更换提供商和重新放置数据。

互操作性

使用可互操作的格式,数据无需进行修改即可在不同系统和网络之间轻松移动,从而增强数据可移植性。可互操作的系统应采用标准化的应用程序编程接口(API)和连接方式,以实现数据的无缝传输。

此外,实施标准数据传输协议,例如服务器消息块协议(SMB)、网络文件系统(NFS)、安全超文本传输协议(HTTPS)和 SSH 文件传输协议(SFTP),均可促进数据的无缝传输。

保持数据可移植性的最佳实践有哪些?

企业可使用多种策略,以维持数据可移植性,并确保满足数据可移植性请求。

了解您的数据

深入了解企业使用的数据类型和格式、数据来源与存储位置以及数据处理方式,有助于推动采用正确的传输系统。通过全面掌控系统中的所有数据,您可以更好地实现数据可移植性,且其覆盖范围始终保持全面。

实现自动化

通过自动化企业使用的数据传输方式,促使开发人员采用标准化的数据格式和协议,从而促进不同系统间的自动化流程。自动化系统表示:

  • 减少数据可移植性的工作量
  • 增强数据一致性
  • 改进系统间的数据迁移
  • 改进数据传输系统。

集中数据治理

数据治理框架决定组织如何管理和使用其存储的数据。通过集中数据治理和建立可靠的全公司系统,您可以围绕数据保留、删除、审计和访问管理制定标准化数据策略。有效的数据治理实现高效的数据可移植性,确保您的数据保持可追溯性、可移动性及合规性。

确保数据质量管理

调查任何数据质量问题,以查找其根本原因。您的数据验证或转换过程可能存在错误,进而导致数据管理系统出现更严重的问题。通过解决这些数据质量管理问题,您可以保持数据完整性,同时确保整个数据系统保持可移动性且不会出现问题。

AWS 如何支持您的数据可移植性需求?

为客户提供选择和自由是 AWS 始终秉持的核心原则。我们的客户始终保留对其数据的所有权和控制权,包括存储位置、存储方式以及谁有权访问。AWS 提供多种数据库类型,每种数据库都适用于不同类型的数据。客户没有合同义务必须使用单一类型的数据库。您可以:

  • 在 AWS 上运行其他供应商的数据库
  • 随时更改数据库运行的实例类型
  • 将数据导出到 AWS

AWS 所做的一切,都让客户能够自由选择最适合的云服务和功能。

AWS 提供多种工具和记录在案的技术,以支持数据迁入及迁出 AWS。我们的服务基于众多开放标准构建,例如 SQL、Linux 和 Xen。例如,您可以使用:

借助 Amazon 数据可移植性 API,用户能够以机器可读格式访问并导出其存储在 Amazon 服务中的个人数据。这确保开发人员能够创建工具,促进用户数据的安全检索和传输,以支持透明度、用户控制权以及数据隐私法规的合规性。

立即创建免费账户,开始在 AWS 上使用数据可移植性。