Amazon Bedrock bổ sung hỗ trợ cho sáu mô hình trọng số mở được quản lý toàn phần
Amazon Bedrock hiện hỗ trợ sáu mô hình mới bao gồm suy luận tiên phong và viết mã tác tử: DeepSeek V3.2, MiniMax M2.1, GLM 4.7, GLM 4.7 Flash, Kimi K2.5 và Qwen3 Coder Next. Sáu mô hình này mang đến cho khách hàng quyền truy cập vào các mô hình trọng số mở có khả năng nhất hiện nay, mang lại hiệu năng tiên phong tiên tiến với chi phí suy luận thấp hơn đáng kể. Chúng bao gồm toàn bộ khối lượng công việc AI cho doanh nghiệp: DeepSeek V3.2 và Kimi K2.5 thúc đẩy tiên phong về suy luận và trí thông minh tác tử, GLM 4.7 và Minimax 2.1 đặt ra các tiêu chuẩn mới cho tác vụ viết mã độc lập với cửa sổ đầu ra lớn, và Qwen3 Coder Next và GLM 4.7 Flash cung cấp các lựa chọn thay thế gọn nhẹ, tiết kiệm chi phí được xây dựng để triển khai sản xuất.
Các mô hình này trên Amazon Bedrock hoạt động trên nền Project Mantle, công cụ suy luận phân tán mới dành cho mô hình máy học quy mô lớn phục vụ trên Amazon Bedrock. Project Mantle giúp đơn giản hóa và xúc tiến việc đưa các mô hình mới vào Amazon Bedrock, cung cấp tính năng suy luận phi máy chủ hiệu năng cao và đáng tin cậy với nhiều biện pháp kiểm soát chất lượng dịch vụ tinh vi, mở khóa hạn mức khách hàng mặc định cao hơn với khả năng quản lý công suất tự động và nhóm hợp nhất, đồng thời, cung cấp khả năng tương thích theo mặc định với các thông số kỹ thuật của API OpenAI.
Để tìm hiểu thêm và bắt đầu sử dụng, hãy truy cập bảng điều khiển Amazon Bedrock hoặc tài liệu dịch vụ tại đây. Để bắt đầu sử dụng điểm cuối dịch vụ tương thích với API OpenAI của Amazon Bedrock, hãy truy cập tài liệu tại đây.