发布于: Mar 3, 2020
Amazon Elasticsearch Service 现在提供 k 最近邻 (k-NN) 搜索,可通过相似度使用案例(如产品推荐、欺诈检测以及图像、视频和语义文档检索)增强搜索。k-NN 使用高效的轻型 Non-Metric Space Library (NMSLIB) 构建,支持对跨数千个维度的数十亿个文档进行大规模、低延迟的最近邻搜索,与运行任何常规 Elasticsearch 查询一样简单易行。
给定数据点的空间,k-NN 插件会查找距离查询数据点最近的数据点数 (k)。通过 k-NN 的新字段类型,您能够将 k-NN 搜索与 Elasticsearch 的各种功能(如聚合和筛选)无缝集成,以进一步提高搜索结果的精确度。Elasticsearch 的分布式架构使 k-NN 插件能够摄取和处理大型数据集,支持增量更新,从而为您提供具有快速推理功能的高性能相似度搜索引擎。
k-NN 相似度搜索由 Open Distro for Elasticsearch(Apache 2.0 许可的 Elasticsearch 发行版)提供支持。要详细了解 Open Distro for Elasticsearch 及其 k-NN 插件,请访问项目网站。
k-NN 相似度搜索现已在运行 Elasticsearch 7.1 及更高版本的域上推出。要了解更多信息,请参阅该文档。
Amazon Elasticsearch Service 域现已在全球 22 个区域推出 k-NN 相似度搜索:美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈、加利福尼亚北部)、AWS GovCloud(US-Gov-East、US-Gov-West)、加拿大(中部)、南美洲(圣保罗)、欧洲(爱尔兰、伦敦、法兰克福、巴黎、斯德哥尔摩)、亚太地区(新加坡、悉尼、东京、首尔、孟买、香港)、AWS 中国(北京,由光环新网运营)、AWS 中国(宁夏,由西云数据运营)以及中东(巴林)。有关 Amazon Elasticsearch Service 可用性的更多信息,请参阅 AWS 区域表。