亚马逊AWS官方博客

新:公布用于 Amazon QuickSight Q 的自动数据准备功能



2021 年 9 月发布的这篇文章中Jeff Barr 宣布 Amazon QuickSight Q 正式上市。总而言之,Amazon QuickSight Q 是一种自然语言查询功能,可让企业用户提出简单的数据问题。

QuickSight Q 由机器学习(ML)提供支持,允许您使用通俗语言查询数据,进而提供自助分析,从而无需摆弄控制面板、控件和计算。随着去年发布 QuickSight Q,您可以问一些简单的问题,比如“2021 年谁在欧洲、中东和非洲地区的销售额最高”,并在几秒钟内获得答案(包括图表、地图或表格等相关可视化效果)。

用于分析的数据通常存储在像 Amazon Redshift 这样的数据仓库中,不幸的是,这些数据仓库往往会针对通过 SQL 进行编程访问而优化,而不是针对自然语言交互进行优化。此外,可以理解,商业智能团队倾向于优化数据来源以供控制面板作者、商业智能工程师和其他数据团队使用,因此使用针对控制面板(例如,“CUST_ID”而不是“客户”)和 SQL 查询进行了优化的技术命名惯例。这些技术命名惯例不直观,不适合企业用户使用。
为了解决这个问题,商业智能团队花费数小时手动将技术名称翻译成常用的业务语言名称,为自然语言问题准备数据。

今天,我很高兴地宣布 Amazon QuickSight Q 将自动准备数据。自动数据准备利用机器学习来推断有关数据的语义信息,并将其作为有关列(字段)的元数据添加到数据集中,从而使您能够更快地准备数据以支持自然语言问题。

QuickSight Q 中主题的快速概述
随着 QuickSight Q 的推出,主题现已可用。主题是一个或多个数据集的集合,这些数据集代表了业务用户可以提出问题的主题领域。查看前面提到的示例(“2021 年谁在欧洲、中东和非洲地区的销售额最高”),将在创建本主题期间选择一个或多个数据集(例如,销售/区域销售数据集)。

作为作者,主题创建后:

  • 您将花时间从数据集中选择最相关的列以添加到主题中(例如,不包括时间戳、日期戳列等)。这可能具有挑战性,因为如果看不到控制面板和报告中列的使用情况数据,就很难客观地决定哪些列与您的业务用户最相关,并将其包含在主题中。
  • 然后,您将花费数小时查看数据并手动对其进行管理,以设置特定于自然语言的配置(例如,添加“地区”作为“区域”列的同义词)。
  • 最后,您需要花时间设置数据的格式,以确保数据在呈现时更有用。
  • QuickSight Q 主题

    QuickSight Q 主题

Amazon QuickSight Q 的自动数据准备的工作原理是什么?
基于分析创建:Amazon QuickSight Q 的全新自动数据准备功能可通过分析创建主题,从而节省时间,从而根据经过机器学习训练的模型自动选择用户友好的名称和同义词,旨在为相关数据字段查找同义词和常用术语,从而节省您花在进行所有翻译上的时间。此外,Amazon QuickSight Q 的自动数据准备不是选择最相关的列,而是根据高值列在分析中的使用方式自动选择这些列。然后,它将主题绑定到该现有分析的数据集,并在数据中准备一个包含唯一字符串值的索引,以实现自然语言搜索。

自动字段选择和分类:我之前提到过,Amazon QuickSight Q 的自动数据准备会选择高值列,但是它如何知道哪些列是高值的列? Amazon QuickSight Q 的自动数据准备可根据来自现有 QuickSight 资产(例如报告或控制面板)的信号自动选择列,以帮助您创建与企业用户相关的主题。除了从数据集中选择高值字段外,Amazon QuickSight Q 的自动数据准备还会导入作者在分析中创建的新计算字段,因此无需他们在主题中重新创建这些字段。

自动语言设置:在本文的开头,我谈到了对于企业用户来说并不直观的技术命名惯例。现在,您无需花时间翻译这些技术名称,而是使用常用术语自动使用友好名称和同义词更新列名。看看我们的销售数据集示例,CUST_ID 被分配了一个友好的名称,即“客户”和许多同义词。现在,同义词将自动添加到列中(可以选择进一步自定义),以支持可能与您的企业用户相关的广泛词汇。

列的友好名称和同义词

列的友好名称和同义词

自动元数据设置:Amazon QuickSight Q 的自动数据准备根据列值检测列的语义类型,并自动更新相应的配置。如果答案中出现特定列,则现在将设置为使用值的格式。这些格式源自您可能在分析中定义的格式。

语义类型设置

语义类型设置

现已推出
Amazon QuickSight Q 的自动数据准备现已在所有提供 QuickSight Q 的 AWS 区域推出。要了解更多信息,请访问 Amazon QuickSight Q 页面。加入 QuickSight 社区,与 QuickSight 社区中的其他人一起提问、回答问题和学习。

Veliswa x