亚马逊AWS官方博客
利用 Amazon DataZone 的新的生成式人工智能功能,进一步简化数据编目和发现(预览版)
今天,我们宣布为 Amazon DataZone 推出一项基于生成式人工智能(AI)的自动化功能预览版,该功能将大大减少为组织数据提供上下文所需的时间。这项新功能可使传统的劳动密集型数据编目过程自动化。它由 Amazon Bedrock 的大型语言模型(LLM)提供支持,可生成对数据资产及其架构的详细描述,并提出分析用例建议。您只需单击一下即可生成全面的业务上下文。
我们从客户那里了解到,组织中的数据使用者(数据分析师、科学家和工程师等)很难在元数据很少的情况下理解数据的相关性。所以他们要么花更多的时间来解读数据,要么继续向数据生产者提出问题。因此,这些拥有数据并将其提供给使用者的数据生产者(数据所有者、工程师和分析师等)需要为优先级较高的数据手动输入详细的上下文,以实现数据的可共享性和可发现性。这非常耗时,也是客户在系统中整理数据以供使用者自助服务时遇到的首要问题。
当我们于 2023 年 10 月正式发布 Amazon DataZone 时,我们推出了第一项功能,该功能通过生成式人工智能可自动生成业务目录资产的表名和列名。在 Amazon DataZone 的数据门户中,绿色的大脑图标表示自动生成的元数据建议。您可以接受、编辑或拒绝 Amazon DataZone 推荐的每项建议。
今日预览公告有什么新内容?
现在,除了列名和表名外,您还可以自动生成针对表和架构更详细的描述以及建议的用途。
当您在数据门户的业务元数据选项卡中选择生成摘要时,将生成新的内容来解释表格及其元数据。
您也可以接受、编辑和拒绝此建议。
选择架构选项卡时,您还可以看到新的描述建议和名称。您可以查看生成的元数据,然后选择接受、编辑或拒绝建议。
这项新功能将提高数据被发现的机会,减少数据使用者和生产者之间的来回沟通。未来,您将在广泛的数据见解基础上获得更丰富的搜索体验。
加入预览版试用
新的元数据生成功能现已可在 AWS 美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)地区预览。借助这种新的生成式人工智能功能,您可以通过加快数据编目和促进数据发现来减少获取见解的时间。要了解更多信息,请访问 Amazon DataZone:自动发现数据。
您可以尝试一下该功能,并将反馈发送至 AWS re:Post for Amazon DataZone 或通过您常用的 AWS Support 联系人进行发送。
– Channy
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。