MANZ 是奥地利的一家为法律和税务专业人员提供信息服务的公司,该公司希望彻底改变他们的注册用户搜索庞大法律文档库的方式。MANZ 的数据库中拥有 3 亿多份文档,他们希望利用向量嵌入内容实施一款先进的解决方案,以增强相似度搜索并发现文档之间更深层次的联系。通过与 AWS 合作伙伴 tecRacer Consulting 合作,MANZ 开发并成功部署了一款强大的解决方案,该解决方案缩短了部署时间,并使 MANZ 能够独立开发和完善他们的解决方案。

机会 | 寻找更好的策略以查找相似文档

作为奥地利知名的法律信息提供商,MANZ 需要使用一个强大的系统来高效、智能地搜索庞大的法律文档数据库。MANZ 开发了一个利用 OpenSearch 等强大技术的架构,但希望确保他们采用的方法能够实现他们的速度和效率目标。在开发新的系统以便更高效地管理和搜索大量的文档时,MANZ 遇到了一些挑战。

第一个挑战是缺乏向量数据库方面的经验。尽管 MANZ 拥有一支经验丰富的 IT 团队,但他们以前完全独立构建或管理向量数据库的经验微乎其微,尤其是一个能够处理 5000 万份文档的向量数据库。为了获得有关如何建立这样一个数据库系统的更多指导,MANZ 希望验证他们的初始架构草案是否能够满足长期需求。例如,调整集群的大小尤其具有挑战性。最后,缺乏使用其他非常专业的技术产品的经验进一步阻碍了我们前进的脚步。正因为如此,MANZ 委托 tecRacer 帮助开发和实施所需的文档搜索功能,以便将他们的业务提升到新的水平。


“在我们的项目中,我们从 tecRacer 的 AWS 专业知识中受益良多。凭借他们丰富的 OpenSearch 知识,尤其是集群设置和优化方面的知识,以及他们在处理服务基础知识方面的熟练程度,我们自己的 MANZ 软件开发专家得以为语义搜索和 RAG 聊天机器人等人工智能使用案例创建可靠的文档知识库。”

Andreas Scheuchl
MANZ 解决方案架构师

解决方案 | 与经验丰富的 AWS 合作伙伴一起实施向量搜索功能

MANZ 选择了 2023 年 AWS 年度系统集成商合作伙伴 tecRacer Consulting,以帮助该公司克服技术和运营挑战,特别是对大型文档库实施语义搜索功能方面。tecRacer 的团队专注于让 MANZ 能够构建自定义程度更高、更加优化的内部系统。这种方法确保了 MANZ 可以继续独立创新并保持对他们的基础设施的控制。该解决方案旨在借助 Amazon OpenSearch ServiceAmazon Neptune 等 AWS 产品高效地处理 3 亿多份文档。MANZ 希望避免可能导致查询时间延长的重大性能问题,因此 tecRacer 与他们密切合作,以通过下列方式优化他们的基础设施:

  • 正确调整 OpenSearch 集群的大小:确保集群大小适当,可以高效地处理大规模文档搜索。
  • 优化索引和分片功能:tecRacer 协助完善了配置索引和分片的方式,这是提高搜索速度的一个关键因素。
  • 微调查询:通过改进搜索查询逻辑和结构,性能得到了显著增强。

为了自动化和简化部署流程,tecRacer 利用 Terraform 提供了一种生产就绪型设置。这包括适用于 Amazon OpenSearch Service 和 Amazon Neptune 数据库的自动部署脚本,以及适用于备份和安全角色的关键配置。通过集成基础设施即代码(IaC),MANZ 能够轻松扩展他们的基础设施,同时保持一致的安全性和运营实践。tecRacer 认识到,MANZ 之前缺乏使用 OpenSearch 和 Amazon Neptune 数据库等 AWS 产品的经验,因此提供了涵盖部署、使用和最佳实践的定制实践讲习会,这样就使 MANZ 的团队能够独立开发和管理他们的解决方案。

成果 | MANZ 加速了文档搜索并提高了准确性

通过与 tecRacer 合作并利用来自 AWS 的强大云服务,MANZ 在他们的文档管理和搜索功能方面取得了实质性的进展。通过 tecRacer 实施的 IaC 以及快速、可靠的数据存储,MANZ 得以搜索 5000 万份文档并实现 200 到 300 毫秒的处理时间。如此出色的性能改善了 MANZ 法律专业人员的用户体验并提高了他们的运营效率。

与 MANZ 之前的搜索解决方案相比,切换到 Amazon OpenSearch Service 并使用向量搜索有望节省大量的成本,中期最多可节省 30%。tecRacer 的实施为管理大规模文档搜索提供了一种更经济实惠的方法,因此提高了性能和资源利用率。最后,tecRacer 量身定制的培训和资源为 MANZ 的内部团队提供了独立维护和发展解决方案所需的技能。MANZ 现在能够对系统进行迭代、集成新的功能以及优化性能,同时与他们不断变化的业务需求保持一致。


MANZ'sche Verlags und Universitätsbuchhandlung 的总部位于维也纳,是奥地利法律信息领域的领导者。MANZ 致力于为法律和税务专业人士提供全面的信息服务,无论是采用在线、印刷品还是研讨会形式。自 1849 年以来,MANZ-Rot 一直代表着法律从业者的法律确定性、质量和创新。该公司的大部分股权由家族掌控并历经五代传承,是 21 世纪的媒体公司 MANZ Group 旗下的一家公司。

关于 AWS 合作伙伴 tecRacer

tecRacer 的总部位于汉诺威,在杜伊斯堡、汉堡、法兰克福、慕尼黑、柏林、日内瓦、苏黎世和里斯本设立了另外八个办事处,并从一个单一来源提供 AWS(Amazon Web Services)咨询、培训、托管式服务和项目管理,它们都能无缝集成到从战略到实施和运营的整个云生命周期中。这一战略仍然是 Amazon Web Services 的明确侧重点。tecRacer 是 AWS 核心级服务、AWS Advanced Tier 培训、AWS 托管式服务和 AWS 经销合作伙伴。tecRacer 非常注重以客户为中心的解决方案和长期合作伙伴关系,可以帮助各个组织在 AWS 上实现他们的目标。

