[SEO 副标题]
本指南演示了如何使用由 AWS 解决方案架构师开发的开源 CQLReplicator 工具,将自行管理的 Apache Cassandra 集群迁移到完全托管式的 Amazon Keyspaces 服务。CQLReplicator 工具通过启动 Discovery(发现)和 Replicator(复制器)这两个 AWS Glue 作业来实现准实时的数据迁移。Discovery 作业会从 Cassandra 源收集和存储最新的主键。Replicator 作业会扫描 Amazon Keyspaces 分类账,查询 Cassandra 源,并将最新数据插入 Amazon Keyspaces 表中。使用此工具,您可以通过将 Cassandra 集群转移到 AWS 云端来减少运营开销,通过与 Amazon CloudWatch 集成来实现集中监控,并通过 CQLReplicator 提供的自动化功能简化迁移体验。
注意:[免责声明]
架构图

[架构图描述]
第 1 步
在 AWS CloudShell 中启动 CQLReplicator,这将创建两个 AWS Glue 作业,分别名为 Discovery 和 Replicator。
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
AWS Glue 可自动执行提取、转换、加载(ETL)过程,从而减少手动设置和管理需求,而 Amazon Keyspaces 则可以减轻数据库管理任务负担,让用户可以专注于应用程序开发。这两项服务集成了记录和监控功能,有利于高效排查故障和解决问题,并通过简化操作和提高可靠性来强化卓越运营。
-
安全性
AWS Glue 使用 AWS Key Management Service(AWS KMS)进行静态数据加密,并使用 TLS 来保护传输中数据。AWS Identity and Access Management(IAM)策略支持精细访问控制,从而仅允许获得授权的用户访问。AWS CloudTrail 和 CloudWatch 提供日志记录和监控,让用户能够全面掌握活动和资源使用情况,为合规和审计工作提供帮助。通过综合运用这些功能,有利于确保 ETL 过程的良好安全性。
-
可靠性
Amazon Keyspaces 是一项完全托管且高度可用的 NoSQL 数据库服务,无需手动管理基础设施和跨区域复制,并提供加密和持续备份等多种内置安全功能。借助这些功能,用户将无缝、安全地进行操作,无需应对 Apache Cassandra 的复杂性。
-
性能效率
Amazon Keyspaces 提供毫秒级的低延迟响应时间,具有可微调的一致性水平和经优化的 Cassandra 查询语言(CQL)功能。AWS Glue 会自动执行数据准备和集成任务,动态扩展 ETL 作业所需资源,并提供内置数据目录的无服务器架构,从而加快数据集的发现。通过综合运用这些服务,简化了数据工作流,无需大量手动干预,确保了运营的高效性和高性能。
-
成本优化
Amazon S3 和 Amazon Keyspaces 服务采用即用即付定价模式,因此您只需为所使用的存储和吞吐量付费。Amazon S3 采用分层存储类,会根据访问模式自动将数据转移到成本较低的存储,从而减少不频繁访问数据的开支。此外,Amazon Keyspaces 采用无服务器架构,因此不再需要预置和管理服务器,进一步降低了运营成本。通过综合运用这些服务,以经济实惠的方法实现了可扩展的存储和高效的数据管理,无需有关硬件基础设施维护的开销。
-
可持续性AWS Lambda 函数基于无服务器模式架构,优化了资源分配并减少了维护物理硬件基础设施的需求。此外, Lambda 仅在响应基表数据的更改时触发,从而减少了计算资源的运行时间。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。