发布于: Nov 17, 2023
AWS Glue for Apache Spark 现在支持与 Amazon OpenSearch Service 的原生连接,使用户无需安装或管理 OpenSearch 连接器库即可高效地从 Amazon OpenSearch Service 读取和写入数据。用户现在可以在 AWS Glue Studio 的无代码、拖放式可视界面中使用存储在 OpenSearch Service 索引中的数据作为源或目标,也可以直接在 AWS Glue ETL 任务脚本中使用。与 AWS Glue 的 ETL(提取、转换、加载)功能相结合后,这个新的连接器可以简化 ETL 管道的创建过程,从而使 ETL 开发人员能够节省构建和维护数据管道的时间。
要开始使用,请在 AWS Glue Data Catalog 中创建一个新的 Amazon OpenSearch Service 连接,然后将 OpenSearch Service 源或目标添加到您的 Glue ETL 任务中。从 OpenSearch Service 读取时,开发人员可以选择整个 OpenSearch Service 索引作为来源,也可以提交查询以选择特定的索引数据。写入 OpenSearch Service 时,用户可以在 Glue 中丰富、清理和转换数据,再将结果加载到 OpenSearch Service 索引。使用这些功能,ETL 开发人员能够在各种场景中使用 OpenSearch Service 和 AWS Glue。