Paraphrase-multilingual-MiniLM-L12-v2, Phát hiện bộ chuyển đổi bảng và Bielik-11B-v3.0-Instruct hiện được cung cấp trong Amazon SageMaker JumpStart
Hôm nay, AWS đã công bố cung cấp paraphrase-multilingual-MiniLM-L12-v2, Phát hiện bộ chuyển đổi bảng của Microsoft và Bielik-11B-v3.0-Instruct trong Amazon SageMaker JumpStart.
Paraphrase-multilingual-MiniLM-L12-v2 của Sentence Transformers là một mô hình độ tương đồng ngữ nghĩa nhẹ, so khớp các câu và đoạn văn với không gian véc-tơ dày đặc 384 chiều trên hơn 50 ngôn ngữ. Đây là lựa chọn rất phù hợp để tìm kiếm nội dung tương tự về mặt ngữ nghĩa trong và giữa các ngôn ngữ, lý tưởng cho nhu cầu tìm kiếm theo ngữ nghĩa giữa các ngôn ngữ, phân cụm tài liệu đa ngôn ngữ và chấm điểm độ tương đồng câu mà không yêu cầu cấu hình riêng theo ngôn ngữ.
Phát hiện bộ chuyển đổi bảng của Microsoft là một mô hình phát hiện đối tượng dựa trên DETR, được đào tạo trên tập dữ liệu PubTables-1M, được xây dựng nhằm phát hiện bảng trong các tài liệu phi cấu trúc như PDF và hình ảnh quét. Mô hình này rất phù hợp cho các quy trình số hóa tài liệu và quy trình trích xuất dữ liệu tự động đòi hỏi khả năng định vị đáng tin cậy nội dung dạng bảng trên quy mô lớn trong nhiều bài viết nghiên cứu, báo cáo tài chính và các loại tài liệu khác.
Bielik-11B-v3.0-Instruct là một mô hình ngôn ngữ tạo sinh có 11 tỷ thông số, do SpeakLeash và ACK Cyfronet AGH phát triển, được đào tạo về các tập thể nội dung đa ngôn ngữ cho 32 ngôn ngữ châu Âu, với trọng tâm nổi bật là tiếng Ba Lan. Mô hình này nổi trội trong các cuộc đối thoại bằng tiếng Ba Lan và ngôn ngữ châu Âu, suy luận STEM và toán học, logic và các tác vụ sử dụng công cụ, cũng như các ứng dụng doanh nghiệp đòi hỏi sự hiểu biết ngôn ngữ sâu sắc đối với các ngôn ngữ ở châu Âu.
Với SageMaker JumpStart, khách hàng có thể triển khai bất kỳ mô hình nào trong số này chỉ với một vài cú nhấp chuột để giải quyết các trường hợp sử dụng AI cụ thể của họ. Để bắt đầu với các mô hình này, bạn hãy điều hướng đến phần Mô hình của Studio SageMaker hoặc sử dụng SageMaker Python SDK để triển khai mô hình vào tài khoản AWS của bạn. Để biết thêm thông tin về việc triển khai và sử dụng mô hình nền tảng trong SageMaker JumpStart, hãy xem tài liệu về Amazon SageMaker JumpStart.