亚马逊AWS官方博客

从数据库连接到自然语言查询:Amazon QuickSuite 数据分析全流程实践

摘要:本文将详细介绍如何使用 Amazon Quick Suite 连接数据库(支持公网和私网方式),创建可视化 Dashboard 和 Topics,并将其整合到 Space 中,最终构建一个完整的自然语言数据问答系统,让数据分析变得像聊天一样简单。


. 背景介绍

在数字化转型的浪潮中,企业积累了海量的业务数据,这些数据分散存储在各类数据库中。然而,传统的数据分析方式往往需要专业的技术人员编写复杂的 SQL 查询或构建可视化报表,这不仅耗时耗力,也限制了业务人员快速获取数据洞察的能力。如何让非技术人员也能通过自然语言直接与数据对话,成为企业提升数据驱动决策能力的关键需求。

Amazon Quick Suite 是亚马逊云科技推出的 AI 驱动的数字工作空间,它将研究能力、数据驱动的洞察和自动化工具整合到统一的体验中。Amazon Quick Suite 集成了 Amazon Quick Sight BI能力,不仅提供强大的可视化分析功能,更通过 AI 代理实现了自然语言问答。用户可以用日常语言提问,如上个季度销售额最高的产品是什么?哪个区域的客户增长最快?,系统即可自动理解问题并返回准确的数据洞察。关于如何开通Amazon Quick Suite,请参考https://docs.aws.amazon.com/quicksuite/latest/userguide/setting-up.html

Amazon Quick Suite 的核心优势在于:

  • 统一的数据访问:无缝连接企业所有数据源,包括文档、企业应用、数据库、数据仓库和实时互联网信息
  • AI 驱动的智能分析:通过 AI 代理简化复杂任务,让各技能水平的业务用户都能快速做出决策
  • 协作式工作空间:通过 Spaces 功能整合文件、DashboardTopics、知识库等资源,打造团队协作中心

本文将详细介绍如何使用 Amazon Quick Suite 连接数据库(支持公网和私网方式),创建可视化 Dashboard Topics,并将其整合到 Space 中,最终构建一个完整的自然语言数据问答系统,让数据分析变得像聊天一样简单。

. 核心组件说明

  • 数据源连接:支持通过公网或 VPC 私网连接多种数据库(Amazon RDSRedshiftMySQLPostgreSQLOracle 等)以及 SaaS 应用(SalesforceServiceNowJira 等)
  • Dataset从数据源导入并定义的数据集,支持数据转换、计算字段和层级结构
  • Dashboard交互式可视化仪表板,展示数据的多维度分析,支持参数、筛选器和自定义操作
  • Topics为自然语言问答精心策划的数据主题,定义了业务术语、同义词和数据关系
  • Spaces协作空间,整合 DashboardTopics、文件、知识库和应用操作,支持团队成员进行数据问答和分享
  • AI 代理:Amazon Quick Suite 的智能问答引擎,理解用户的自然语言问题并生成准确答案
  • SPICE 引擎:超快速、并行、内存计算引擎,提供快速响应的查询性能

. 实施步骤

步骤一:连接数据库

1.1 通过公网连接数据库

前提条件:

操作步骤:

1. 登录 Amazon Quick Suite 控制台

2. 创建数据源连接

  • 在主页选择“Data source”
  • 点击“Create data source”
  • 选择数据源类型(如 MySQLPostgreSQLRDSRedshift 等)。

3. 配置连接参数

关键配置项:

  • 连接名称
  • 数据库服务器主机名或终端节点
  • 端口号(如 MySQL 默认 3306PostgreSQL 默认 5432, StarRocks 默认9030
  • 数据库名称
  • 用户名和密码

4. 测试并保存连接

1.2 通过 VPC 私网连接数据库

适用场景:

  • 数据库位于 VPC 内部,未开放公网访问
  • 需要更高的安全性和网络隔离
  • 符合企业安全合规要求

如果数据库与Amazon Quick Suite 在同一地区,可以通过VPC connection进行私网链接。具体请参考 https://docs.aws.amazon.com/quicksuite/latest/userguide/vpc-setup-for-quicksight.html

前提条件:

  • Amazon Quick Suite版本为Enterprise Edition
  • 用户有系统管理员权限
  • 已创建 VPC、子网和安全组
  • 网络 ACL 和路由表配置正确

操作步骤:

1. 配置 Amazon Quick Suite VPC Connection

  • Amazon Quick Suite 管理控制台选择“Manage VPC connections”
  • 点击“Add VPC connection”
  • 输入连接名称
  • 选择 VPC ID
  • 选择两个子网
  • 选择安全组

2. 配置安全组规则

  • 入站规则:允许 Amazon Quick Suite ENI 访问数据库端口,具体根据地区请参考Amazon Quick Suite IP 地址段
  • 出站规则:允许数据库响应流量
  • /目标配置:使用安全组 ID 相互引用

3. 创建数据源并选择 VPC 连接

VPC connection创建成功后,会在状态栏中标成Available

当数据库与Amazon Quick Suite不在同一地区时,可以选择用VPC PeeringAmazon Transit Gateway的方式将网络打通。下面以VPC Peering为例:

步骤二:创建 Dataset

操作步骤:

1. 选择数据表或编写自定义 SQL

成功连接数据库后,Amazon Quick Suite 会显示可用的数据库和表列表。此时您有两种方式选择数据:

方式一:直接选择数据表

在左侧面板中,展开数据库名称,浏览可用的表(Tables)和视图(Views)。找到需要的表后,点击表名即可选中。系统会自动加载表的结构信息,包括字段名称、数据类型等元数据。您可以在右侧预览窗口中查看表的前几行数据,确认这是您需要的数据源。

方式二:使用自定义 SQL 查询

如果需要对数据进行筛选、关联或计算,可以点击界面上的 “Use custom SQL” 按钮。在弹出的 SQL 编辑器中,您可以编写自定义查询语句,例如:

编写完成后,点击 “Confirm Query” 按钮执行查询。

2. 配置数据导入方式

  • SPICE:将数据导入内存引擎,查询速度快,适合频繁查询
  • Direct query:直接查询数据源,数据实时性高,适合大数据集

3. 数据准备和转换(可选)

如果需要对结果做转换,例如修改字段数据类型,重命名字段,创建新计算字段(如利润率 = (收入成本) / 收入),设置字段格式(日期格式、数字格式、货币符号等),创建层级结构(如:国家 > 省份 > 城市)等,可以在dataset进行编辑。

4. 配置数据刷新计划

如果有数据有增量变换,可以页面配置dataset刷新计划,按照刷新频率和时间对数据进行刷新。

步骤三:构建可视化 Dashboard

操作步骤:

1. 创建新的分析(Analysis)

在创建完数据集后,可以对相应数据集做Analyses

Datasets 页面选择已创建的 Dataset,点击“Create analysis”进入可视化编辑界面。

2. 添加可视化图表

在编辑界面上可以选择各类可视化类型(柱状图、折线图、饼图、热力图、表格、KPI 卡片等)。在选取相应字段和聚合方式后,便可以得到相应的图表。在分析页面中,我们可以利用各种工具对数据进行筛选、美化。包括:

  • 添加字段筛选器(如日期范围、产品类别)
  • 创建参数(如动态阈值、对比时间段)
  • 配置筛选器控件类型(下拉列表、多选、日期选择器等)
  • 设置筛选器作用范围(单个图表或整个 Dashboard)等

此外,分析页面也可以配置图表联动,如点击跳转到详细页面,添加自定义操作,配置钻取功能等。

当图表制作完成后,便可以点击右上角“Publish”进行发布。发布时可以配置图表的访问权限与级别等信息。

步骤四:创建 Topics 用于自然语言问答

4.1 什么是 Topics

Topics Amazon Quick Suite 中为自然语言问答设计的数据主题。它定义了:

  • 数据字段的业务含义和同义词(如”收入”也可以叫”营收”、”销售额”)
  • 字段之间的关系和层级结构
  • 常见的业务问题模式
  • 数据的默认聚合和计算规则

通过精心设计的 TopicsAI 代理能够更准确地理解用户的自然语言问题,并返回正确的数据答案。

4.2 创建 Topics

操作步骤:

在左侧Amazon Quick Sight栏下选中Topic,进入Topic 页面。点击“Create Topic”进行Topic的创建。在选择数据源后,系统会开始自动分析数据结构并生成初始 Topic

进入创建好的Topic后,可以在Data标签页面下看到相应数据字段,并可以对相应字段进行操作,包括:

  • 为每个字段设置业务友好的显示名称
    • 例如:order_date → “订单日期
    • 例如:total_amount → “总金额
  • 添加同义词以提高识别准确率

总金额的同义词:销售额、营收、收入、金额

订单日期的同义词:下单时间、购买日期、交易日期

  • 为字段添加描述说明其业务含义

点开每个字段后,也配置字段属性和聚合方式,包括:

  • 设置字段类型(维度或度量)
  • 定义默认聚合方式:

度量字段:求和、平均、计数、最大值、最小值

维度字段:计数、去重计数

  • 设置字段的显示格式(货币、百分比、日期格式等)
  • 标记关键字段(如主要的时间维度、金额字段)

更多关于Topic的玩法请参考docs.aws.amazon.com/quicksuite/latest/userguide/topics.html

Topic创建完成后,我们可以对 Topic进行验证和测试。此时可以选择用模型帮助生成相应测试问题:

Agent返回结果后,可以根据测试结果调整同义词和字段配置,然后迭代优化直到问答准确率满意后对Topic进行分享。

步骤五:创建 Space 并整合资源

5.1 什么是 Spaces

Spaces Amazon Quick Suite 中的协作空间,它将文件、DashboardTopics、知识库和应用操作整合到统一的、可定制的知识中心。Spaces 的优势包括:

  • 统一的知识中心:将与特定主题、部门或项目相关的所有资源集中管理
  • 上下文化的对话:AI 代理在 Space 中回答问题时,会基于 Space 内的资源提供更精准的答案
  • 减少数据孤岛:团队成员可以共同贡献知识,简化信息发现
  • 灵活的协作:支持个人、团队和跨团队使用场景

5.2 创建 Space

操作步骤:

进入 Spaces 创建页面后,可以在页面点击“Create Space”,然后配置 Space 基本信息,包括 Space 名称、用途等。

然后就可以将刚刚创建好的DashboardTopic添加进Space进行引用。此处可以选择添加多个DashboardTopic以及其他形式的资源包括本地文件上传( csv, doc,docx, html, json, md, pdf, ppt, pptx, rtf, txt, xls, xlsx, xml, xslt, mp3, mp3_alt, wav, wav_alt, wave, m4a, m4a_alt, flac, flacalt, ogg, ogg_alt, mp4, mp4_alt, mov, m4v, mov_alt)、Amazon Quick Suite上创建的Knowledge basesActions(如审批流程、数据导出等)。

步骤六:使用自然语言进行数据问答

6.1 对Space中的数据做问答

Space创建完成后,用户便可以通过默认Chat Agent或者创建自己的Chat Agent对相应数据进行提问。

或者利用网页插件上的Chat Agent进行自然语言提问:

Chat Agent会自动识别问题并从 Space 中的 Topics Dashboard 获取答案,并支持多轮对话和追问。在Amazon Quick Suite 的最新更新上,Chat Agent也支持长期记忆。

6.2 理解和使用答案

提问完后,相应问答会保留在Topic页面的User Activity中,并可以通过点击图表上的View explanation对生成结果的过程进行追溯。

6.3 提问技巧

在进行提问时,可以考虑以下有效问题的要素:

  • 明确的时间范围:“去年”、”上个月”、”2025年第一季度”
  • 清晰的指标:使用 Topic 中定义的术语和同义词
  • 具体的维度:指定要分析的维度(地区、产品、客户等)
  • 明确的操作:排序、筛选、对比、计算等

. 总结

通过以上的步骤简介,您已经学会了如何使用 Amazon Quick Suite 构建完整的自然语言数据问答系统。从数据库连接(公网和私网方式)、Dataset 创建、Dashboard 可视化,到Topics 设计和 Spaces 整合,每个环节都是实现智能数据问答的关键。

Amazon Quick Suite 的核心价值在于:

  • 降低数据分析门槛:业务人员无需学习 SQL 或复杂的 BI 工具,用自然语言即可获取数据洞察
  • 提升决策效率:减少从提出问题到获得答案整个过程的时间,大幅缩短决策周期
  • 促进数据协作:通过 Spaces 打破数据孤岛,让团队成员共享知识和洞察
  • 安全可控:支持 VPC 私网连接和细粒度的权限管理,确保数据安全合规

随着 AI 技术的不断发展,Amazon Quick Suite 将持续演进,为企业提供更智能、更便捷的数据分析体验。建议您在实践中不断优化 Topics 的配置,积累常见问题模板,并收集用户反馈,持续提升问答系统的准确性和用户体验。

. 参考文档

1.  官方产品文档

[1] Amazon Quick Suite 官方文档

[2] Amazon QuickSight VPC 私网连接配置 

[3] 设置 VPC 以与 Amazon Quick Suite 配合使用

[4] AWS 区域、网站、IP 地址范围和端点

2. 核心功能文档

[5] Amazon QuickSight 数据源连接指南

[6] Amazon QuickSight Dataset 创建与管理

[7] Amazon QuickSight Dashboard 可视化构建 

[8] 使用 Amazon Quick Sight 主题

[9] Amazon QuickSight Spaces 协作空间使用指南

*前述特定亚马逊云科技生成式人工智能相关的服务目前在亚马逊云科技海外区域可用。亚马逊云科技中国区域相关云服务由西云数据和光环新网运营,具体信息以中国区域官网为准。

本篇作者

贾京京

亚马逊云科技解决方案架构师,负责媒体广告行业云计算方案和架构咨询。

李光举

亚马逊云科技资深解决方案架构师,负责基于亚马逊云科技的云计算方案架构的咨询和设计,曾任阿里技术专家,先后在淘宝、蚂蚁集团从事分布式系统、银行核心交易系统研发, 对微服务构建,大规模信息系统设计,GenAI理论与实践具有丰富经验,善于帮助客户基于云上架构快速构建现代应用系统,实现业务高速增长。

黎小为

亚马逊云科技解决方案架构师,负责亚马逊云科技解决方案构建,在加入亚马逊云科技之前,就职于腾讯、网易、京东等国内大型互联网企业,在GenAI 应用方面有丰富的经验。

李进

亚马逊云科技解决方案架构师,负责基于亚马逊云科技的架构咨询与方案设计。致力于帮助客户实现创新、提升效率、达成业务目标。在 GenAI、Serverless、音视频处理等方向具有丰富的实践经验。

朱晓阳

AWS 资深解决方案架构师, 负责基于AWS云计算的解决方案的架构设计和咨询,同时致力于AWS云计算服务在数字广告和社交应用领域的应用和推广. 在加入AWS之前,曾任IBM Cloud资深软件架构师. 在OpenStack, Docker, Kubernetes和DevOps领域有多年实战经验. 现致力于容器和服务网格相关领域的研究.


AWS 架构师中心:云端创新的引领者

探索 AWS 架构师中心,获取经实战验证的最佳实践与架构指南,助您高效构建安全、可靠的云上应用