什么是数据库管理?
数据库管理系统可帮助组织存储、访问数据,并与业务团队、软件应用程序和最终用户共享数据。随着组织利用生成式人工智能(AI)技术进行创新,安全、高效且可管理的数据库存储变得愈发重要,因为这类技术需要海量数据支撑。
然而,数据库存在多种类型,每种类型都针对特定的业务目标和项目需求而设计。例如,传统的关系数据库管理系统(DBMS),如 Microsoft SQL Server,是存储结构化数据(包括电子商务交易)和执行复杂查询的理想之选。开发人员使用 SQL 数据操作语言对表的列和行进行数据的添加、修改和删除操作。
与此同时,软件团队在处理需要访问非结构化数据的项目时,通常会采用 NoSQL 数据库。 与关系数据库管理系统不同,NoSQL 数据库采用灵活的数据控制语言,以处理键值对、文档和宽列存储。
为组织选择数据库管理系统时,请考虑以下因素:
- 许可、实施和数据库维护的成本。
- 内部专业团队可根据需求增长,提供数据库配置、架构设计、技术支持及扩展服务。
- 安全性和合规性要求,包括数据驻留、服务可用性及数据隐私。
- 与应用程序、服务或访问数据库的用户相关的使用案例。
某些组织可能最初在本地管理关系数据库,但最终会迁移至云或混合架构,以实现更高效的数据检索。确保数据库注意事项与业务目标保持一致,有助于在数据库设置后避免复杂问题。数据库管理员可分配资源、应对数据完整性限制,以及管理数据互操作性。
有哪些数据库管理策略?
数据库是业务流程、应用程序和用户访问的基础。因此,组织在处理已安装的数据库系统时需要采取战略性方法。下面,我们将分享一些数据管理实践,帮助您保持数据质量、降低成本以及确保良好的用户体验。
设计时需考虑可扩展性
可扩展数据库使组织能够缓解流量增长,这种增长可能使现有计算资源(如处理器和数据存储)达到极限。您可对数据库进行水平扩展和垂直扩展。
水平扩缩
水平扩缩是指增加更多数据集群,而不是将流量定向至单一数据库。该方法可均衡传入流量,防止整个数据库系统因负载过重而瘫痪。传入请求可重定向至包含数据的特定组件,从而实现快速的数据检索。要实现数据库的水平扩展,可采用以下方法:
- 数据库分片,即将数据库划分为若干部分并进行分布式部署。
- 负载均衡,一种可将网络流量分配到数据库集群的方法。
- 只读副本,用于复制主数据库,并为需要频繁访问特定数据的应用程序提供服务。
垂直扩缩
垂直扩缩是一种增加数据库所用计算资源的方法。与水平扩缩类似,它使数据库系统在流量激增时仍能可靠运行。然而,垂直扩缩并不涉及更改数据库设计。
在本地环境中对物理数据库进行垂直扩展成本高昂,因为组织必须投资额外的数据库服务器并相应地进行配置。为使垂直扩缩更轻松且更经济高效,组织纷纷基于云数据库进行构建。使用 AWS 云数据库时,您可以:
- 部署数据库,无需配置服务器基础设施。
- 将数据库扩展至所需容量。
- 仅为所使用的计算资源付费。
制定数据备份策略
使用数据库时,组织有责任确保数据的完整性和可用性,并最大限度地降低数据安全风险。良好的备份策略包括复制数据并将其安全存储。此外,还包括及时恢复这些策略以及防止运营中断的措施。
通过有效的数据库备份策略,您可以迅速从停机状态恢复,并确保业务连续性。例如,如果您持续记录数据库变更,即可将其恢复至被修改或无法使用之前的某个时间点。
根据法律要求,某些行业的组织必须在特定时期内保留历史数据的副本。如果要将数据库系统从某个基础设施迁移到其他基础设施,创建数据库备份也大有助益。此类任务通常涉及整合来自各种来源的数据(例如关系数据库),并在新构架中恢复数据。在此过程中,后续的数据转换即使执行得极其细致,仍可能导致数据不准确。在这种情况下,您可以使用备份以回滚更改。
AWS Backup 可简化跨云和混合环境的数据备份与保护。它能自动执行数据保护,监控数据资产,并提供灾难恢复功能,助您满足合规性要求。以下是开始备份 AWS 数据库的方法。
- 注册 AWS,并启动 AWS Backup 控制台。
- 创建备份计划,并配置备份策略、方法、报告及其他参数。
- 分配要备份的数据库,包括 Amazon Elastic Block Store(EBS)卷、Amazon Relational Database Service(RDS)数据库以及 Amazon DynamoDB 表
- 开始备份。
- 监控您的备份,并在需要时进行恢复。
实施精细访问控制
组织必须对谁有权访问其数据库中所存储信息实施控制。您需要在访问控制机制中进行验证和授权。验证使您能够验证请求访问数据库的用户身份。同时,授权可指明是否应向特定用户授予访问权限。它们共同构成访问控制方法的基础,这些方法可保障现代数据库的安全,例如
- 基于角色的访问权限控制(RBAC)遵循最低权限原则提供数据库访问权限。通过此方法,您仅向用户授予其角色所需的必要数据访问权限。
- 基于属性的访问权限控制(ABAC)在允许访问特定数据前,会考虑时间、位置及用户要求等动态因素。
除监管访问权限外,组织还应持续监控和审计数据库,以发现未经授权的访问尝试并增强其安全韧性。
AWS IAM 允许您设置权限防护机制,以实现对云工作负载的精细化访问控制。您可以生成最低权限策略、审查权限,并设置进一步限制访问的条件。医疗保健平台提供商 Wellola 在向开发人员授予其功能访问权限时使用 IAM 以执行严格的数据治理和保护。
监控和微调性能
随着时间推移,数据库系统可能出现性能下降和瓶颈问题。如果不及时处理,依赖这些数据库的应用程序和服务将受到负面影响。为确保可靠访问已存储的数据,您需要持续监控和微调数据库性能的方法。例如,数据库可能遇到并发控制问题,尤其是在多个用户处理快速变化的数据时。这可能导致数据不一致。
传统的数据库监控高度依赖人工干预,导致问题识别与补救措施实施之间存在延迟。现代数据库受益于自动化的性能监控,这有助于加速问题解决。
使用 Amazon Relational Database Service(Amazon RDS)时,您可访问自动显示数据库关键指标的仪表板。例如,您可以查看数据库是否正在运行、其消耗的资源以及只读副本的状态。此外,您还可将 AWS RDS 与其他 AWS 服务进行集成。例如,
- Amazon CloudWatch 允许您监控内置的 RDS 指标,并触发警报以激活后续操作。
- Amazon EventBridge 捕获表示 Amazon RDS 环境中变更的事件并将事件路由至其他 AWS 服务。
- Amazon CloudTrail 记录访问数据库时对 RDS 发起的 API 调用。
建立数据整合以支持分析
组织中,每个应用程序数据库都以孤岛的形式存在。要通过分析获得可操作的见解,您需要整合来自多个数据库的数据。例如,您可能拥有一组数据库,其中存储结构化、非结构化和半结构化数据的混合数据。然而,要分析这些数据,需要将其提取、转换、加载(ETL)到支持更灵活数据模型和更复杂数据结构的存储中。
实现此目标的最佳方式是建立数据管道,将相关数据库连接至数据仓库或数据湖。如此一来,您可将事务性数据和运营数据转换为商业智能(BI)应用程序能够有效分析的格式。
Amazon Redshift 是云数据仓库,可帮助您整合数据库,而无需复杂的数据管道。零 ETL 功能可自动从 Amazon RDS、Amazon Aurora 和 Amazon DynamoDB 中进行数据摄取,助您实现近乎实时的分析。例如,当电子商务应用程序将交易记录存储在您托管于 AWS 的结构化查询语言(SQL)数据库中时,数据会自动转换并发送到 Amazon Redshift。
AWS 如何支持您的数据库管理系统?
管理数据库系统需要在安全性、可扩展性、功能和治理之间取得平衡。此类工作需要专业知识、技术支持以及数据专业人员与关键利益相关者之间的协作。依托高效的数据库管理策略,您可降低基础设施成本、维护数据完整性,并在云中实现更高效的创新。
探索 AWS 数据库服务,助您为现代应用程序构建稳健的数据基础。