Amazon SageMaker JumpStart 现提供 Paraphrase-multilingual-MiniLM-L12-v2、Table Transformer Detection 和 Bielik-11B-v3.0-Instruct

发布于: 2026年4月29日

今天,AWS 宣布在 Amazon SageMaker JumpStart 中提供 paraphrase-multilingual-MiniLM-L12-v2、Microsoft Table Transformer Detection 以及 Bielik-11B-v3.0-Instruct。

Sentence Transformers 推出的 Paraphrase-multilingual-MiniLM-L12-v2 是一款轻量级的语义相似度模型,它能够将句子和段落映射到一个 384 维的稠密向量空间中,支持 50 多种语言。它非常适合在同一语言内及跨语言查找语义相似的内容,因此非常适合用于跨语言语义搜索、多语言文档聚类以及句子相似度评分,且无需进行特定语言的配置。

Microsoft Table Transformer Detection 是一款基于 DETR 的物体检测模型,它使用 PubTables-1M 数据集进行了训练,专为在 PDF 和扫描图像等非结构化文档中检测表格而设计。它非常适合文档数字化管道和自动数据提取工作流,这些场景需要在研究论文、财务报告及其他文档类型中,大规模且可靠地定位表格内容。

Bielik-11B-v3.0-Instruct 是由 SpeakLeash 和 ACK Cyfronet AGH 联合开发的一款拥有 110 亿参数的生成式语言模型,该模型基于涵盖 32 种欧洲语言的多语言语料库进行训练,其中波兰语占据了重要比重。它在波兰语及欧洲语言对话、STEM 和数学推理、逻辑与工具使用任务,以及需要对欧洲多种语言进行深度语言理解的企业应用方面表现尤为出色。

借助 SageMaker JumpStart,客户只需点击几下即可部署这些模型中的任何一个,以解决其特定的人工智能使用案例。要开始使用这些模型,请导航到 SageMaker Studio 的“模型”部分,或使用 SageMaker Python SDK 将模型部署到您的 AWS 账户。有关在 SageMaker JumpStart 中部署和使用基础模型的更多信息,请参阅 Amazon SageMaker JumpStart 文档。