亚马逊AWS官方博客

新功能 — Amazon QuickSight Q 回答了有关商业数据的自然语言问题

我们推出了 Amazon QuickSight,并将其用作第一个按会话付费定价的商业智能 (BI) 服务。今天,我们很高兴地宣布 Amazon QuickSight Q 的预览版,这是由机器学习 (ML) 提供支持的自然语言查询 (NLQ) 功能。借助于 Q,企业用户现在可以使用 QuickSight 使用日常语言提出有关其数据的问题,并在几秒钟内获得准确的答案。

例如,在回答诸如“我今年以来的销售额同比增长是多少?”或者“哪些产品同比增长最快?”等问题。 Q 会自动解析问题以了解意图、检索相应的数据,并在 QuickSight 中以数字、图表或表格的形式返回答案。Q 使用最先进的机器学习算法来了解数据之间的关系,并构建索引以提供准确的答案。此外,由于 Q 不要求 BI 团队在特定数据集上预构建数据模型,因此您可以针对所有数据提出问题。

对 Q 的需求
传统上,BI 工程师和分析师会创建仪表板,让业务用户更轻松地查看和监控关键指标。当出现新的业务问题但在现有仪表板上显示的数据中找不到答案时,业务用户必须向通常人员稀缺的 BI 团队提交数据请求,然后等待几周才能回答问题并将其添加到仪表板。

在查看概述每日销售趋势的仪表板的销售经理可能想知道与上个月、上一季度或去年同期相比,他们上周的总销售额是多少。他们可能想了解绝对销售额与增长率的比较如何,或者增长率如何按不同地区、产品线或客户群进行细分,以确定新的增长机会。这可能需要 BI 团队重建数据、创建新的数据模型并回答其他问题。这个过程可能需要几天到几周。此类特定的数据请求增加了可能人员不足的 BI 团队的工作量,增加了等待答案所花费的时间,并使需要数据以及时做出决策的业务用户和高管感到沮丧。

Q 的工作原理
要提出问题,只需在 QuickSight Q 搜索栏中键入问题即可。一旦开始输入问题,Q 会提供自动填充建议,其中包含关键短语和业务术语,以加快该过程。它还会自动执行拼写检查以及首字母缩写和同义词匹配,因此您不必担心拼写错误或记住数据中的确切商业术语。Q 使用自然语言理解技术从问题中提取商业术语(例如收入、增长、分配等)和意图,从来源检索相应的数据,并以数字和图表的形式返回答案。

Q 进一步从组织内部的用户互动中学习,以持续提高准确性。例如,如果 Q 不理解问题中的短语,例如 “我的产品” 指的是什么,Q 会提示用户从搜索栏中的建议选项的下拉菜单中进行选择。然后 Q 下次记得这句话,从而提高了使用的准确性。如果您问有关所有数据的问题,Q 会使用这些数据提供答案。用户不局限于提出仅限于预定义仪表板的问题,并且可以提出与您的业务相关的任何问题。

我们来看一下演示。我们假设有一家公司销售仪表板。

Quicksight 的仪表板

仪表板的业务用户只需在上面的 Q 搜索栏中输入问题,即可向下钻取、切片和切块数据。

让我们使用 Q 搜索栏来问一个问题:“向我展示去年加利福尼亚州的每周销售额。” Q 在几秒钟内生成数字和图表。

生成的仪表板

您可以单击答案中的 “看起来不错” 或 “不太正确”。点击 “不太正确” 时,您可以将反馈提交给 BI 团队以帮助改善问题。您还可以进一步调查答案。让我们在问题末尾加上 “对纽约”,然后按 Enter。将弹出一个新的答案。

生成的新图

接下来,让我们在加利福尼亚进一步调查。输入 “加利福尼亚最畅销的分类是什么。

类别详情

借助于 Q,您可以轻松地更改演示文稿。让我们针对同一个问题查看另一个图表。

折线图

接下来,让我们来看看最大的行业,“金融。” 在 Q 中输入 “向我显示财务部门的每周销售增长百分比”,然后指定 “折线图” 以检查每周销售收入增长。

销售收入显示增长,但有峰值和非高峰期。有了这些见解,您现在可能会考虑如何稳定以获得更好的利润结构。

开始使用 Amazon QuickSight Q
左侧导航栏上将出现一个新的 “Q Topic” 链接。主题是一个或多个数据集的集合,旨在表示用户可以提出问题的主题领域。例如,营销团队可能有 “广告支出”、“电子邮件营销活动”、“网站分析” 等的 Q 主题。此外,作为作者,您可以:

  • 将友好名称、同义词和描述添加到数据集和列中,以改善 Q 的答案。
  • 将主题分享给您的用户,以便他们可以提出有关主题的问题。
  • 查看用户提出的问题、Q 如何回答这些问题以及改进答案。

主题工具栏选择主题,然后设置主题名称及其说明

设置主题

单击继续按钮后,您可以通过两种方式将数据集添加到主题:通过选择添加数据集,可以将一个或多个数据集直接添加到主题中,也可以通过选择导入仪表板将现有的仪表板中所有的数据集导入主题。

下一步是使数据集采用自然语言友好。通常,数据集和列的名称基于技术命名约定,并不反映最终用户如何引用它们。Q 在很大程度上依赖名称来将正确的数据集和列与问题中使用的术语相匹配。因此,必须将此类技术名称转换为用户友好的名称,以确保它们能够被正确映射。以下是示例:

  • 数据集名称 — D_CUST_DLY_ORD_DTL → 友好名称:客户每日订单详情。
  • 列名:pdt_cd 列 → 友好名称:产品代码

此外,您可以为每列设置同义词,以便用户可以使用他们最喜欢的术语。例如,某些用户可能会输入术语“客户端”或“细分”而不是“行业”。 Q 提供了在键入查询时更正正确名称的功能,但 BI 运算符也可以为常用词设置同义词。单击左侧窗格中的“主题”,然后选择要设置同义词的仪表板。

然后选择“数据集”。

现在,我们可以将友好名称或同义词设置为别名,例如 “客户” 的 “客户端” 或 “行业” 的 “细分”。

设置友好名称

添加同义词后,用户可以保存更改并开始在 Q 搜索栏中提问。

Amazon QuickSight Q 预览今天上市
Q 提供预览版适用于美国东部(弗吉尼亚北部)美国西部(俄勒冈)美国东部(俄亥俄)欧洲(爱尔兰)。从 QuickSight 点击几下即可开始使用 Q。您可以将 Q 与 AWS 数据源(如 Amazon Redshift Amazon RDS、Amazon AuroraAmazon AthenaAmazon S3)或第三方商业来源(如 SQL Server、Teradata 和 Snowflake)一起使用。Salesforce、ServiceNow 和 Adobe 自动与 QuickSight 支持的所有数据源集成,包括 Analytics 或 Excel 等业务应用程序。

了解有关 Q 的更多信息,立即开始使用预览。

– Kame