亚马逊AWS官方博客

利用 Amazon DataZone 的新的生成式人工智能功能,进一步简化数据编目和发现(预览版)



今天,我们宣布为 Amazon DataZone 推出一项基于生成式人工智能(AI)的自动化功能预览版,该功能将大大减少为组织数据提供上下文所需的时间。这项新功能可使传统的劳动密集型数据编目过程自动化。它由 Amazon Bedrock 的大型语言模型(LLM)提供支持,可生成对数据资产及其架构的详细描述,并提出分析用例建议。您只需单击一下即可生成全面的业务上下文。

我们从客户那里了解到,组织中的数据使用者(数据分析师、科学家和工程师等)很难在元数据很少的情况下理解数据的相关性。所以他们要么花更多的时间来解读数据,要么继续向数据生产者提出问题。因此,这些拥有数据并将其提供给使用者的数据生产者(数据所有者、工程师和分析师等)需要为优先级较高的数据手动输入详细的上下文,以实现数据的可共享性和可发现性。这非常耗时,也是客户在系统中整理数据以供使用者自助服务时遇到的首要问题。

当我们于 2023 年 10 月正式发布 Amazon DataZone 时,我们推出了第一项功能,该功能通过生成式人工智能可自动生成业务目录资产的表名和列名。在 Amazon DataZone 的数据门户中,绿色的大脑图标表示自动生成的元数据建议。您可以接受、编辑或拒绝 Amazon DataZone 推荐的每项建议。

今日预览公告有什么新内容?
现在,除了列名和表名外,您还可以自动生成针对表和架构更详细的描述以及建议的用途。

当您在数据门户的业务元数据选项卡中选择生成摘要时,将生成新的内容来解释表格及其元数据。

您也可以接受、编辑和拒绝此建议。

选择架构选项卡时,您还可以看到新的描述建议和名称。您可以查看生成的元数据,然后选择接受、编辑或拒绝建议。

这项新功能将提高数据被发现的机会,减少数据使用者和生产者之间的来回沟通。未来,您将在广泛的数据见解基础上获得更丰富的搜索体验。

加入预览版试用
新的元数据生成功能现已可在 AWS 美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)地区预览。借助这种新的生成式人工智能功能,您可以通过加快数据编目和促进数据发现来减少获取见解的时间。要了解更多信息,请访问 Amazon DataZone:自动发现数据

您可以尝试一下该功能,并将反馈发送至 AWS re:Post for Amazon DataZone 或通过您常用的 AWS Support 联系人进行发送。

Channy