“AWS 服务的完整性改变了我们的游戏规则。使用 AWS,我们可以有效地为客户提供服务并可靠地运行我们的解决方案。”—— Arnaud de La Bédoyère,Daxte 创始人
生成式人工智能 (AI) 能力每天都在进化,各公司需要快速适应最近的进展。Daxte 使用这项新技术创建了 LegalMap,这是法国首批用于法律文件的生成式人工智能解决方案之一。这种解决方案可以对搜索结果进行精细筛选,并系统地从数百万个文档中获取答案。LegalMap 解决方案建立在 Amazon Web Services (AWS) 之上,集高精度、推理性能、可扩展性和可靠性于一身。
使用 Amazon Textract 进行准确的文档扫描
Daxte 成立于 2022 年,该公司创建了生成式人工智能解决方案 LegalMap,旨在帮助从法国法律文件中搜索信息。为了给其解决方案开发人工智能模型,该公司使用自己的数据集对开源大型语言模型(例如来自 Hugging Face 的 Llama2 7b)进行了微调,并使用了
Amazon SageMaker——这是一项完全托管的服务,其中汇集了多种工具,可提供高性能、低成本的机器学习。Daxte 创始人 Arnaud de La Bédoyère 说道:“使用 Amazon SageMaker,我们可以高效地管理、开发、测试和部署我们的人工智能模型。”
当时 LegalMap 需要扫描 30 年的法律文件,并将其数字化以供人工智能模型使用。为了准确扫描,该公司采用了
Amazon Textract,这是一项从扫描文档中自动提取文本、手写内容、布局元素和数据的机器学习服务。该公司之所以选择 Amazon Textract,是因为它提供了完整的解决方案、响应迅速的团队和多方面的支持。
使用 AWS 提高性能
截至 2023 年 12 月,LegalMap 处理的数据集包含近 1.25 亿份文档,包括法律、财务和营销数据。在为生成式人工智能准备数据时,LegalMap 更改了名字、地址和其他敏感信息,以保持 GDPR 合规性。
2023 年,Daxte 与 AWS 合作伙伴 Data Reply France 合作,通过从 GPU 资源到 AWS Trainium(高性能机器学习训练加速器)和 AWS Inferentia(提供旨在以低成本为深度学习推理应用程序提供高性能的加速器)的迁移来优化训练成本。
La Bédoyère 说道:“借助于 AWS,我们可以获得尖端的技术专业知识和强大的资源。”“这使我们能够顺利、高效地迁移复杂的基础设施。”
利用生成式人工智能继续创新
Daxte 将于 2024 年 9 月推出 LegalMap,其首个称为“Watch”的服务用于为法国各地的律师事务所提供实时信息监测和警报。该公司估计,到 2026 年,LegalMap 将扫描 6 亿份文档。随着其数据库的发展,Daxte 将继续使用 AWS 来完善其生成式人工智能的能力。Arnaud de La Bédoyère 说道:“AWS 服务的完整性改变了我们的游戏规则。”“使用 AWS,我们可以有效地为客户提供服务并可靠地运行我们的解决方案。”
欧洲领先的云创新者
了解欧洲各行各业的领先组织如何信任 AWS 来推动其业务各个层面的创新。
更多软件和互联网客户案例
行动起来
无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。