发布于: Apr 16, 2021
用户定义的函数 (UDF) 支持用户向其数据应用自定义操作,现已面向 Amazon Athena 正式推出。尽管 Athena 提供了各种内置功能,但用户仍可通过其自己的函数扩展这些功能,并将其直接用于查询中。这使得用户可以处理特定使用案例(例如编辑或加密敏感数据),而无需在其数据管道之外的其他位置执行复杂的数据处理步骤。
客户可以通过 Athena Query Federation SDK 使用 Java 编写 UDF。当 UDF 用于 Athena 查询时,它将通过 AWS Lambda 执行。UDF 可以用于 SQL 查询的 SELECT 和 FILTER 子句中,并且同一个查询中可以使用多个 UDF。Amazon Athena 用户可以通过 Athena 控制台、API 以及 JDBC 和 ODBC 驱动程序利用 UDF。
借助适用于 Amazon Athena 的 UDF,用户还可以利用由 AWS 服务和专有应用程序或 API 提供支持的功能。例如,处理产品评论数据的分析师可能需要将产品评论从一种语言转换成另一种。如果没有 UDF,则这可能会涉及将数据导出到翻译服务并在后续重新导入数据。要了解 Amazon Athena UDF 如何简化此过程以及其他使用案例,请参阅结合使用 SQL 函数与 Amazon Athena、Amazon Translate 和 Amazon Comprehend 翻译和分析文本。您还可以在 AWS YouTube 频道上观看视频教程。
要在 Amazon Athena 中开始使用 UDF,请参阅以下资源:
- Athena 文档使用用户定义的函数进行查询
- 要了解如何使用 Athena Query Federation SDK 编写自己的函数,请参阅使用 Lambda 创建和部署 UDF
- 如需示例 UDF 实施,请参阅 GitHub 上的 Amazon Athena UDF 连接器