Amazon SageMaker JumpStart 現已提供 Paraphrase-multilingual-MiniLM-L12-v2、Table Transformer Detection 和 Bielik-11B-v3.0-Instruct
AWS 今日宣佈在 Amazon SageMaker JumpStart 中正式推出 paraphrase-multilingual-MiniLM-L12-v2、Microsoft Table Transformer Detection 和 Bielik-11B-v3.0-Instruct。
Sentence Transformers 的 Paraphrase-multilingual-MiniLM-L12-v2 是一種輕量化的語義相似性模型,可將 50 多種語言的句子和段落對應至 384 維的密集向量空間。該模型非常適合在語言內部和跨語言尋找語義相似的內容,因此十分適合用於跨語言語義搜尋、多語言文件叢集處理和句子相似性評分,而無需特定語言組態。
Microsoft Table Transformer Detection 偵測是在 PubTables-1M 資料集上訓練的 DETR 型物件偵測模型,專門用於偵測非結構化文件中的資料表,例如 PDF 和經過掃描的影像。該模型非常適合文件數位化管道和自動化資料擷取工作流程,這些工作流程需要在研究論文、財務報告和其他文件類型中可靠地大規模定位表格內容。
Bielik-11B-v3.0-Instruct 是由 SpeakLeash 和 ACK Cyfronet AGH 開發的一種 110 億參數的生成式語言模型,針對 32 種歐洲語言的多語言語料庫進行訓練,並特別著重於波蘭語。該模型在波蘭語和歐洲語言對話、STEM 和數學推理、邏輯和工具使用任務,以及需要跨歐洲語言進行深入語言理解的企業應用方面表現出色。
透過 SageMaker JumpStart,客戶只需點擊幾下,即可部署任何一種模型來滿足其特定 AI 使用案例。若要著手使用這些模型,請瀏覽至 SageMaker Studio 的「模型」區段,或使用 SageMaker Python SDK 將模型部署至您的 AWS 帳戶。如需在 SageMaker JumpStart 中部署與使用基礎模型的詳細資訊,請參閱 Amazon SageMaker JumpStart 文件。