一般性问题

问:什么是 AWS DataSync?

答:AWS DataSync 是一项在线数据传输服务,它可简化和加速通过互联网或 AWS Direct Connect 在 AWS 存储服务之间复制大量数据的操作,并实现该过程自动化。DataSync 可以在 Network File System (NFS)、服务器消息块 (SMB) 文件服务器或 AWS Snowcone、Amazon Simple Storage Service (Amazon S3) 存储桶、Amazon Elastic File System (Amazon EFS) 文件系统和 Amazon FSx for Windows File Server 文件系统之间复制数据。

问:为什么应该使用 AWS DataSync?

答:AWS DataSync 使您能够复制包含数百万文件的大型数据集,而无需使用开源工具构建自定义解决方案,也无需许可和管理价格高昂的商业网络加速软件。您可以使用 DataSync 将现用数据迁移到 AWS,将数据传输到云进行分析和处理,还可以存档数据以释放本地存储容量,或者将数据复制到 AWS 以实现业务连续性。

问:AWS DataSync 可以为我解决什么问题?

答:AWS DataSync 可降低在线数据传输的复杂性和成本,从而简化本地存储系统与 Amazon S3、Amazon Elastic File System (EFS) 和 Amazon FSx for Windows File Server 之间的数据集传输。DataSync 使用标准存储协议(NFS、SMB)或 Amazon S3 API 连接现有的存储系统和数据源。它使用专用网络协议和扩展架构,以加速 AWS 之间的传输。DataSync 可自动扩展并处理以下任务:移动文件和对象、计划数据传输、监控传输进度、加密、验证数据传输并在出现问题时通知客户。使用 DataSync 时,您只需为复制的数据量付费,无需最低消费承诺或预付费用。

问:可以从哪里传入和传出数据?
答:AWS DataSync 可在 Network File System (NFS)、服务器信息块 (SMB) 文件服务器、自行管理的对象存储或 AWS Snowcone、Amazon Simple Storage Service (Amazon S3) 存储桶、Amazon Elastic File System (Amazon EFS) 文件系统和 Amazon FSx for Windows File Server 文件系统之间传输数据。

问:如何使用 AWS DataSync 将数据迁移到 AWS?

答:您可以使用 AWS DataSync 将本地数据迁移到 Amazon S3、Amazon EFS 和 Amazon FSx for Windows File Server。配置 DataSync 以生成您的整个数据集的初始副本,以及计划更改数据的后续增量传输,直到完成从本地到 AWS 的最后切换。DataSync 包括加密和完整性验证,有助于确保数据安全到达、完好无损且可随时使用。为了将对依赖于您网络连接的工作负载的影响降到最低,您可以将迁移安排在非工作时间运行,或通过配置内置带宽限制来限制 DataSync 使用的网络带宽量。 DataSync 保留具有相似元数据结构的存储系统之间的元数据,以支持最终用户和应用程序平稳过渡到使用目标 AWS 存储服务。阅读存储博客“使用 AWS DataSync 迁移存储”,了解有关迁移最佳实践和提示的更多信息。

问:如何使用 AWS DataSync 存档冷数据?

答:您可以使用 AWS DataSync 将冷数据直接从成本高昂的本地存储系统移动到持久且安全的长期存储空间,例如 Amazon S3 GlacierAmazon S3 Glacier Deep Archive。使用 DataSync 的筛选功能将临时文件和文件夹排除在复制范围外,仅复制源位置的文件子集或在多个存储目标之间拆分单个文件系统。您可以根据需求选择最具成本效益的存储服务:将数据传输到任何 S3 存储类,或组合使用 DataSync 和 EFS 生命周期管理将数据存储在 Amazon EFS 不频繁访问存储类 (EFS IA) 中。使用内置的任务计划功能定期存档应保留的数据,以满足合规性或审计目的,例如日志、原始影像或电子版医疗记录。 

问:如何将 AWS DataSync 用于持续工作流程的本地和 AWS 之间的重复传输。

答:您可以使用 AWS DataSync 加快和安排将本地系统中的数据传入或传出 AWS 以进行处理的过程。它有助于加快某些行业内的关键混合云存储工作流程,这些行业需要将活跃文件快速迁移到 AWS,包括媒体和娱乐行业中的视频制作、石油和天然气行业中的地震研究、生命科学行业中的机器学习以及金融行业中的大数据分析。DataSync 有助于实现及时交付以确保不会延迟相关流程。您可以指定排除筛选条件和/或包含筛选条件,以确定每次运行任务时传输的文件、文件夹或对象。

问:如何使用 AWS DataSync 将数据复制到 AWS 以实现业务连续性?

答:利用 AWS DataSync,您可以定期将文件复制到 Amazon S3 存储类中,或针对备用文件系统将数据发送到 Amazon EFS 或 Amazon FSx for Windows File Server 中。使用内置的任务计划功能,确保对数据集的更改可定期复制到您的目标存储中。 阅读这篇 AWS 存储博客, 了解有关使用 AWS DataSync 进行数据保护的更多信息

问:如何使用 AWS DataSync 构建数据湖?

答:使用 AWS DataSync,您可以将有价值的本地数据集自动传输到 Amazon S3,进而轻松构建数据湖。DataSync 支持使用标准存储协议(NFS 或 SMB)或 Amazon S3 API 简单快速地传输整个数据集。整个数据集传输完毕之后,可以安排新数据从本地到 AWS 的后续增量传输。DataSync 包括加密和完整性验证,有助于确保数据安全到达、完好无损且可随时使用。为了将对依赖于您网络连接的工作负载的影响降到最低,您可以将传输任务安排在非工作时间运行,或通过配置内置带宽限制来限制 DataSync 使用的网络带宽量。将数据传输到 Amazon S3 后,您就可以使用原生 AWS 服务运行大数据分析、人工智能 (AI)、机器学习 (ML)、高性能计算 (HPC) 和媒体数据处理应用程序,以便从非结构化数据集中获得洞察信息。 阅读 AWS 数据湖存储网页了解有关构建和利用数据湖的更多信息。

问:如何使用 AWS DataSync 迁移到 Amazon WorkDocs?

答:AWS DataSync 属于 Amazon WorkDocs 迁移服务。DataSync 使您可以更加轻松快速地将主目录和部门共享内容迁移到 WorkDocs。 要了解有关使用 DataSync 迁移到 WorkDocs 的更多信息,请阅读博客“使用 AWS DataSync 将网络共享文件迁移到 Amazon WorkDocs”。

使用量

问:如何开始使用 AWS DataSync?

答:您可以在 AWS 管理控制台中单击几下或通过 AWS 命令行界面 (CLI),使用 AWS DataSync 传输数据。要开始使用,请执行下列 3 个步骤:

1.部署代理 – 部署 DataSync 代理,并通过管理控制台或 API 将其关联到您的 AWS 账户。代理将用于访问您的 NFS 服务器、SMB 文件共享或自行管理的对象存储,以从中读取数据或向其写入数据。

2.创建数据传输任务 – 通过指定您的数据源位置和目标位置以及您要用于配置传输的任何选项(如所需的任务计划)来创建任务。

3.开始传输 – 启动任务并在控制台中或使用 Amazon CloudWatch 监控数据移动。

问:如何部署 AWS DataSync 代理?

答:您可以将 AWS DataSync 代理部署到本地监控程序或 Amazon EC2 中。要将数据复制到本地文件服务器或从中复制数据,请从 AWS 控制台下载代理虚拟机映像,并将其部署到本地 VMware ESXi、基于 Linux 内核的虚拟机 (KVM) 或 Microsoft Hyper-V 监控程序中。要将数据复制到云中的文件服务器或从中复制数据,您可以使用 DataSync 代理 AMI 创建 Amazon EC2 实例。在这两种情况下,都必须部署代理,以便其可以使用 NFS、SMB 协议或 Amazon S3 API 访问您的文件服务器。要在 AWS Snowcone 设备和 AWS 存储之间设置传输,请使用设备上预装的 DataSync 代理 AMI。

问:AWS DataSync 代理的资源要求是什么?

答:您可以在此处查找运行代理所需的最少资源。

问:我如何启动 AWS DataSync 数据传输任务?

答:当您通过 AWS 管理控制台AWS 命令行界面 (CLI) 启动任务时,AWS DataSync 将复制数据。每次任务运行时,它都将扫描源是否存在更改,并复制源与目标之间的任何差异。您可以配置源的哪些特性用于确定更改的内容,定义要包括和排除特定文件或文件夹的筛选条件,以及控制是否应在源发生更改时覆盖目标中的文件或对象,或在源中找不到时删除它们。

问:AWS DataSync 如何确保正确复制数据?

答:当 AWS DataSync 传输和存储数据时,它将执行完整性检查,以确保写入目标的数据与从源读取的数据相匹配。此外,可以选择性地执行验证检查来在传输结束时对比源和目标。 DataSync 将计算和对比源和目标中存储的数据的完整文件校验和。您可以检查整个数据集或仅检查 DataSync 传输的文件或对象。

问:如何监控 AWS DataSync 正在传输的数据的状态?

答:您可以使用 AWS 管理控制台或 CLI 来监控正在传输的数据的状态。利用 Amazon CloudWatch 指标,您可以查看已复制的文件数和数据量。 将单个文件记录到 CloudWatch Logs 使您能够识别在给定时间传输的内容,以及 DataSync 执行的内容完整性验证结果。这简化了监控、报告和故障排查过程,并且让您能够为利益相关者提供及时的更新。您可以在 AWS 管理控制台或 CLI 中找到其他信息(如传输进度)。

问:是否可以筛选 AWS DataSync 传输的文件和文件夹?

答:可以。您可以指定排除筛选条件和/或包含筛选条件,以限制每次运行任务时传输的文件、文件夹或对象。创建任务时,您可以配置应始终排除在复制之外的文件路径或对象键。然后,在启动任务时,配置应包含在执行任务中的文件路径或对象键。如果没有配置筛选条件,则每次运行任务时,AWS DataSync 都会将所有更改从源传输到目标位置。请阅读这篇 AWS 存储博客,详细了解如何将常见筛选器与 DataSync 结合使用

问:是否可以配置 AWS DataSync 以按计划进行传输?

答:可以。您可以使用 AWS DataSync 控制台或 AWS 命令行界面 (CLI) 来计划任务,而不必编写和运行脚本来管理重复的传输。任务计划会根据您配置的计划按照控制台中直接提供的每小时、每天或每周选项来自动运行任务。这能够帮助您确保您数据集的更改会自动被检测并复制到您的目标存储中。

问:AWS DataSync 在复制文件时能否保留目录结构?

答:符合。在传输文件时,AWS DataSync 在目标位置创建与源位置中的结构相同的目录结构。

问:如果 AWS DataSync 任务中断,会发生什么情况?

答:如果任务中断(例如,如果网络连接断开或 AWS DataSync 代理重新启动),则将在下次运行任务时传输缺失的文件,并且数据将在此运行结束时保持完整性和一致性。每次启动任务时,它都将执行增量复制,仅向目标传输源中所做的更改。

问:我能否将 AWS DataSync 与 AWS Direct Connect 结合使用?

答:可以。您可以将 AWS DataSync 与 Direct Connect 链接结合使用,以访问公共服务终端节点或私有 VPC 终端节点。使用 VPC 终端节点时,在 DataSync 代理和 AWS 服务之间传输的数据不需要访问公共互联网,也不需要公共 IP 地址,这增加了在网络上复制数据时的安全性。

问:AWS DataSync 是否支持 VPC 终端节点或 AWS PrivateLink?

答:支持。您可以使用 VPC 终端节点来确保在本地或云中部署的 AWS DataSync 代理之间传输的数据不会访问公有互联网或需要公有 IP 地址。使用 VPC 终端节点在 Amazon Virtual Private Cloud (Amazon VPC) 中保持网络流量,从而提高数据的安全性。 适用于 DataSync 的 VPC 终端节点由高度可用的可扩展技术 AWS PrivateLink 提供支持,允许您将 VPC 私密连接到受支持的 AWS 服务。

问:如何配置 AWS DataSync 来使用 VPC 终端节点?

答:要将 VPC 终端节点与 AWS DataSync 结合使用,您可以在选择的 VPC 中为 DataSync 服务创建一个 AWS PrivateLink 接口 VPC 终端节点,然后在创建 DataSync 代理时选择此终端节点弹性网络接口 (ENI)。您的代理将连接到此 ENI 以激活,随后由该代理传输的所有数据都将保持在您配置的 VPC 中。您可以使用 AWS DataSync 控制台、AWS 命令行界面 (CLI) 或 AWS 开发工具包配置 VPC 终端节点。要了解更多信息,请参阅在 Virtual Private Cloud 中使用 AWS DataSync,并阅读关于使用 VPC 终端节点时的迁移最佳做法的 AWS 存储博客

从 Amazon S3 传出或向其传入数据

问:是否可以将我的数据复制到 Amazon S3 Glacier、Amazon S3 Glacier Deep Archive 或其他 S3 存储类?

答:可以。将 S3 存储桶配置为用于 AWS DataSync 时,您可以选择 DataSync 用于存储对象的 S3 存储类。DataSync 支持将数据直接存储到 S3 标准、S3 智能分层、S3 标准-不经常访问(S3 标准 – IA)、S3 单区域-不经常访问(S3 单区 – IA)、Amazon S3 Glacier (S3 Glacier) 和 Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive) 中。有关 Amazon S3 存储类的更多信息,请参阅 Amazon Simple Storage Service 开发人员指南

比每个对象的最小收费容量小的对象将存储在 S3 标准中。例如,大小为零字节且只保存元数据的文件夹对象将存储在 S3 标准中。在我们的文档中阅读使用 Amazon S3 存储类的注意事项,有关最低收费容量的更多信息,请参阅 Amazon S3 定价

问:是否可以从 S3 标准 – IA 和 S3 单区 – IA 向外复制数据?

答:可以。将 S3 用作 AWS DataSync 任务的源位置时,服务将从需要复制到目标的存储桶中检索所有对象。从 S3 标准 – IA 和 S3 单区 – IA 存储检索对象将产生检索费用,具体费用取决于对象大小。在我们的文档中阅读使用 Amazon S3 存储类的注意事项

问:是否可以从 S3 Glacier 和 Amazon S3 Glacier Deep Archive 向外复制数据?

答:将 S3 用作 AWS DataSync 任务的源位置时,服务将尝试从需要复制到目标的存储桶中检索所有对象。检索存档在 S3 Glacier 或 S3 Glacier Deep Archive 存储类别中的对象将导致错误。检索存档对象时发生的任何错误将由 DataSync 记录,并且会导致任务完成失败的状态。在我们的文档中阅读使用 Amazon S3 存储类的注意事项

问:AWS DataSync 如何访问我的 Amazon S3 存储桶?

答:AWS DataSync 承担了您提供的 IAM 角色。您附加到角色的策略可决定该角色可以执行哪些操作。DataSync 可以代表您自动生成该角色,您也可以手动配置角色

问:AWS DataSync 如何将文件和文件夹转换为 Amazon S3 中的对象或从中转换文件和文件夹?

答:将文件或文件夹复制到 Amazon S3 时,文件或文件夹与对象之间存在一对一关系。文件和文件夹元数据时间戳和 POSIX 权限,包括用户 ID、组 ID 和权限,均存储在 S3 用户元数据中。存储在 S3 用户元数据中的文件元数据可与文件网关互操作,从而提供对 AWS DataSync 存储在 Amazon S3 中的数据的本地文件访问。

当 DataSync 将包含此用户元数据的对象复制回 NFS 服务器时,系统将恢复文件元数据。从 NFS 复制回 S3 时,符号链接和硬链接也会存储。

从 SMB 文件共享复制时,默认 POSIX 权限存储在 S3 用户元数据中。当复制回 SMB 文件共享时,所有权将根据在 DataSync 中配置以访问该文件共享的用户进行设置,并且分配默认权限。

在我们的文档中了解有关 DataSync 如何存储文件和元数据的更多信息。

问:在自行管理的对象存储与 Amazon S3 之间传输对象时,会保留什么信息?

答:在自行管理的对象存储与 Amazon S3 之间传输对象时,DataSync 会将对象与对象元数据和标签一起复制。

问:将 Amazon S3 存储类与 AWS DataSync 结合使用时,会产生哪些 S3 请求和存储费用?

答:有些 S3 存储类会产生可能会影响您的费用的行为,如数据检索、最低存储容量和最小存储持续时间。DataSync 会通过自动管理数据来解决这些因素,并会提供设置来最大限度减少数据检索。

为避免每个对象的最低容量费用,AWS DataSync 将自动在 S3 标准中存储小型对象。为将数据检索费用降到最低,您可以将 DataSync 配置为仅验证由指定任务传输的文件。为避免最低存储持续时间费用,DataSync 可对覆盖和删除对象进行控制。在我们的文档中阅读使用 Amazon S3 存储类的注意事项

问:我是否可以在 AWS Outposts 上向 Amazon S3 存储桶中复制对象数据以及从中复制数据?

答:可以。您可以在 AWS Outposts 上的 Amazon S3 和 AWS 区域中的 Amazon S3 存储桶之间复制对象。DataSync 复制对象以及对象元数据和对象标记。为了使 DataSync 能够访问 Outposts 存储桶上的 Amazon S3,请在 Outpost 上部署 DataSync EC2 代理

将 DataSync 与 Outposts 上的 Amazon S3 结合使用时,仅可从 AWS 区域中的 Amazon S3 存储桶传出或向其中传入数据。您可以在我们的文档中了解有关 DataSync 任务的受支持的来源和目标的更多信息。

从 Amazon EFS 传出或向其传入数据

问:AWS DataSync 如何访问我的 Amazon EFS 文件系统?

答:AWS DataSync 使用 NFS 协议访问您的 Amazon EFS 文件系统。DataSync 服务通过其托管的弹性网络接口 (ENI) 在 VPC 中挂载您的文件系统。DataSync 代表您完全管理这些 ENI 的创建、使用和删除。

问:是否可以将 AWS DataSync 与所有 EFS 存储类一起使用?

答:可以。您可以使用 AWS DataSync 将文件复制到 EFS 中,还可以将 EFS 生命周期管理配置为将一段时期内未访问的文件迁移到不频繁访问 (IA) 存储类。

从 Amazon FSx for Windows File Server 传出或向其传入数据

问:DataSync 如何访问我的 Amazon FSx 文件系统?

答:AWS DataSync 使用 SMB 协议评估您的 Amazon FSx 文件系统,通过您在 AWS 控制台或 CLI 中配置的用户名和密码进行身份验证。DataSync 服务通过其托管的弹性网络接口 (ENI) 在 VPC 中挂载您的文件系统。DataSync 代表您完全管理这些 ENI 的创建、使用和删除。

问:从 SMB 共享复制到 Amazon FSx 时传输哪些 Windows 元数据?

答:DataSync 复制 Windows 元数据,包括文件时间戳、文件拥有者、标准文件属性和 NTFS 自由决定访问列表 (DACL)。复制 NTFS 系统访问控制列表 (SACL) 的功能将随后在 2020 年增加。您可以在文档中了解更多信息,并查看已复制元数据的完整列表。

从 AWS Snowcone 传出或向其传入数据

问:如何在 AWS Snowcone 和 AWS 存储服务之间传输数据?

答:DataSync 代理已作为 AMI 预安装在 Snowcone 设备上。要将数据在线传输到 AWS,请将 AWS Snowcone 设备连接到外部网络,并使用 AWS OpsHub 或 CLI 启动 DataSync 代理 AMI。使用 AWS 管理控制台或 CLI 激活代理,然后在 AWS Snowcone 的 NFS 存储与 Amazon S3、Amazon EFS 或 Amazon FSx for Windows File Server 之间设置在线数据传输任务。

性能

问:AWS DataSync 将我的文件系统复制到 AWS 有多快?

答:AWS DataSync 复制给定数据集的速率需综合考虑数据量、源和目标存储可达到的 I/O 带宽、可用的网络带宽,以及网络条件。单个 DataSync 代理可完全占用 10Gbps 的网络链接。

问:我能否控制 AWS DataSync 任务使用的网络带宽量?

答:可以。通过配置内置带宽限制,您可以控制 AWS DataSync 将使用的网络带宽量。这有助于最大限度地降低对依赖于同一网络连接的其他用户或应用程序的影响。

问:如何监控 AWS DataSync 的性能?

AWS DataSync 可生成 Amazon CloudWatch 指标以提供对传输流程的精细可见性。利用这些指标,您可以查看已复制的文件数和数据量以及文件发现和验证进度。您可以直接在 DataSync 控制台中查看包含这些指标的 CloudWatch 图表

问:AWS DataSync 是否会影响我的源文件系统的性能?

答:根据您的本地文件存储的容量,以及要传输文件的数量和大小,AWS DataSync 可能会在访问同一源数据存储时,影响其他客户端的响应时间,因为代理将从该存储系统读取或写入数据。为任务配置带宽限制会降低此影响,因为它会限制存储系统的 I/O。

安全性与合规性

问:我的数据在传输和存储过程中是否加密?

答:可以。在源和目标之间传输的所有数据都通过传输层安全性 (TLS) 加密,它替代了安全套接字层 (SSL)。数据从来不会保留在 AWS DataSync 中。该服务支持使用 S3 存储桶的默认加密静态数据的 Amazon EFS 文件系统加密Amazon FSx For Windows File Server 的静态和传输中加密

问:AWS DataSync 如何访问我的 NFS 服务器或 SMB 文件共享?

答:AWS DataSync 使用您部署到 IT 环境或 Amazon EC2 的代理,通过 NFS 或 SMB 协议访问您的文件。此代理连接到 AWS 中的 DataSync 服务终端节点并从 AWS 管理控制台或 CLI 安全地进行管理。

问:AWS DataSync 如何访问自行管理对象存储?

答:AWS DataSync 使用您部署到 IT 环境或 Amazon EC2 的代理,以使用 Amazon S3 API 访问您的对象。此代理连接到 AWS 中的 DataSync 服务终端节点并从 AWS 管理控制台或 CLI 安全地进行管理。

问:AWS DataSync 是否需要 VPN 才能连接到我的目标存储?

答:不需要,向本地或从本地复制数据时,无需设置 VPN/隧道或允许入站连接。可以将您的 AWS DataSync 代理配置为使用标准网络端口来路由通过防火墙。您还可以使用 VPC 终端节点在您的 Amazon Virtual Private Cloud (Amazon VPC) 中部署 DataSync。使用 VPC 终端节点时,在 DataSync 代理和 AWS 服务之间传输的数据不需要遍历公有互联网,也不需要公有 IP 地址。

问:AWS DataSync 代理如何安全地连接到 AWS?

答:您的 AWS DataSync 代理在您选择的 AWS 区域内连接到 DataSync 服务终端节点。您可以选择让代理连接到面向公有互联网的终端节点、经联邦信息处理标准 (FIPS) 验证的终端节点或其中一个 VPC 内的终端节点。安全地激活代理可将其与您的 AWS 账户关联。要了解更多信息,请参阅选择服务终端节点激活代理

问:如何修补和更新我的 AWS DataSync 代理?

答:一旦代理被激活,服务将管理代理 VM 的更新,同时包括底层操作系统和 AWS DataSync 软件包。当代理处于空闲状态且没有执行数据传输任务时,将以非破坏性的方式应用更新。

问:AWS DataSync 支持哪些合规性计划?

答:AWS 具有在云中运行时间最长的合规性计划。AWS 致力于帮助客户满足他们的要求。AWS DataSync 已经过评估,达到了全球和行业安全标准。除了符合 HIPAA 要求以外,DataSync 还符合 PCI DSS、ISO 90012700127017 27018,以及 SOC 1、2 和 3。 DataSync 还在 AWS 美国东部/西部区域按照 FedRAMP 中等影响进行了授权,在 AWS GovCloud(美国)区域按照 FedRamp 高影响进行了授权。这使您能够更轻松地验证我们的安全性,并履行您自己的义务。有关更多信息和资源,请访问我们的合规性页面。您也可以转到按合规性计划提供的范围内服务页面,以查看服务和认证的完整列表。

问:AWS DataSync PCI 是否合规?

答:支持。AWS DataSync 符合 PCI-DSS,这意味着您可以使用它来传输付款信息。您可以在 AWS Artifact 中下载 PCI 合规性文件包,以详细了解如何在 AWS 上实现 PCI 合规性。

问:AWS DataSync 是否符合 HIPAA 要求?

答:可以。AWS DataSync 符合 HIPAA 要求,这意味着如果您有适用于 AWS 的 HIPAA BAA,则可以使用 DataSync 来传输受保护的健康信息 (PHI)。

问:AWS DataSync 是否在 AWS 美国东部/西部区域获得了 FedRAMP JAB 中等影响临时授权?

答:AWS DataSync 已经在美国东部/西部区域依据联邦风险与授权管理计划 (FedRAMP) 中等影响基线的要求从联合授权委员会 (JAB) 取得了临时操作授权 (ATO)。如果您是联邦或商业客户,您可以在 AWS 美国东部/西部区域的授权边界内将 AWS DataSync 用于中等及更低影响等级的数据。

问:AWS DataSync 是否在 AWS GovCloud(美国)区域获得了 FedRAMP JAB 高影响临时授权?

答:AWS DataSync 已经在美国 GovCloud 区域依据联邦风险与授权管理计划 (FedRAMP) 高影响基线的要求从联合授权委员会 (JAB) 取得了临时操作授权 (ATO)。如果您是联邦或商业客户,您可以在 AWS GovCloud(美国)区域的授权边界内将 AWS DataSync 用于高影响及更低等级的数据。

何时选择 AWS DataSync

问:AWS DataSync 与使用 rsync 或 Amazon S3 命令行接口等命令行工具有何不同?

AWS DataSync 可完全自动化并加快向 AWS 移动大型有效数据集的过程,其速度最高可达命令行工作的 10 倍。它与 Amazon S3、Amazon EFS、Amazon FSx for Windows File Server、Amazon CloudWatchAWS CloudTrail 原生集成,这可对您的存储服务提供无缝和安全的访问体验,还可对传输进行细致监控。

DataSync 使用专用网络协议和扩展架构来传输数据。单个 DataSync 代理可占用 10Gbps 的网络链接。

DataSync 实现了数据传输的完全自动化。它包含重试和网络弹性机制、网络优化、内置任务计划、监控功能(通过 DataSync API 和控制台实现)、CloudWatch 指标、事件和日志,可提供对传输流程的精细可见性。DataSync 在传输期间和传输结束时都执行数据完整性验证。

DataSync 提供端到端的安全性并直接与 AWS 存储服务集成。源和目标之间传输的所有数据都通过 TLS 加密,并通过内置的 AWS 安全机制(如 IAM 角色)启用对 AWS 存储的访问。启用使用 VPC 终端节点的 DataSync,以确保在组织和 AWS 之间传输的数据不需要遍历公有互联网,这进一步增加了在网络上复制数据时的安全性。

问:何时使用 AWS DataSync 以及何时使用 AWS Snowball Edge?

答:AWS DataSync 是在线数据传输的理想工具。您可以使用 DataSync 将现用数据迁移到 AWS,将数据传输到云进行分析和处理,还可以存档数据以释放本地存储容量,或者将数据复制到 AWS 以实现业务连续性。

AWS Snowball Edge 适用于离线数据传输,适合带宽受限或从偏远、断开连接或严峻的环境中传输数据的客户。 

问:何时使用 AWS DataSync 以及何时使用 AWS Storage Gateway?

答:使用 AWS DataSync 将现有数据迁移到 Amazon S3,然后使用 AWS Storage Gateway 的文件网关配置来保留对已迁移数据的访问权限,并从本地基于文件的应用程序进行持续更新。

您可以组合使用 DataSync 和文件网关来尽量缩减本地基础设施,同时将本地应用程序无缝连接到您的云存储。AWS DataSync 使您能够加速向 AWS 存储服务在线传输数据的过程并实现自动化。然后,文件网关可为您的本地应用程序提供对已迁移数据的低延迟访问。 

问:何时使用 AWS DataSync 以及何时使用 Amazon S3 Transfer Acceleration?

答:如果您的应用程序已经与 Amazon S3 API 集成,并且您在向 S3 传输大型文件时需要更高的吞吐量,则可以使用 S3 Transfer Acceleration。如果您想要从现有存储系统(例如网络附带的存储)或从无法更改的仪器(例如 DNA 顺序分析仪、摄像机)传输数据,或者如果您想要使用多个目标位置,则可以使用 AWS DataSync。此外,通过提供内置重试和网络弹性机制、数据完整性验证与灵活配置等额外功能,DataSync 还可以简化数据传输并实现自动化,以满足您的特定需求,包括带宽限制等。

问:何时使用 AWS DataSync 以及何时使用 AWS Transfer for SFTP?

答:如果您当前使用 SFTP 与第三方交换数据,则 AWS Transfer for SFTP 提供可直接传入和传出 Amazon S3 的完全托管 SFTP 传输,同时减少您的运营负担。

如果您希望在 NFS 服务器、SMB 文件共享、自行管理的对象存储、AWS Snowcone、Amazon S3、Amazon EFS 和 Amazon FSx for Windows File Server 之间进行加速的自动化数据传输,您可以使用 AWS DataSync。对于需要在线迁移现用数据集、及时传输持续生成的数据,或复制用以实现业务连续性的客户,DataSync 是理想之选。 

详细了解 DataSync 定价
了解有关定价的更多信息

AWS DataSync 具有简单、可预测且基于使用量的定价;只对您所复制的数据量付费。 

了解更多 
注册 AWS 账户
注册免费账户

立即享受 AWS 免费套餐。 

 

注册 
开始在控制台中使用 DataSync
开始在控制台中移动数据

开始在 AWS 控制台中使用 AWS DataSync 进行构建。

登录