Amazon SageMaker AI hiện hỗ trợ tinh chỉnh tăng cường phi máy chủ cho thêm 12 mô hình

Ngày đăng: 25 Th03 2026

Amazon SageMaker AI hiện hỗ trợ tùy chỉnh mô hình phi máy chủ và tinh chỉnh tăng cường cho thêm 12 mô hình có trọng số mở, cho phép bạn tinh chỉnh và đánh giá các mô hình mà không cần cung cấp hoặc quản lý cơ sở hạ tầng. Các mô hình mới được hỗ trợ bao gồm: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B và DeepSeek-R1-Distill-Qwen-1.5B. Với bản mở rộng này, bạn có thể tùy chỉnh các mô hình này bằng cách sử dụng các kỹ thuật tinh chỉnh có giám sát (SFT), tối ưu hóa ưu tiên trực tiếp (DPO) và tinh chỉnh tăng cường (RFT) bao gồm RLVR và RLAIF, đồng thời bạn chỉ cần thanh toán theo mức sử dụng.

Kỹ thuật tinh chỉnh tăng cường cho phép bạn điều chỉnh mô hình cho phù hợp với các nhiệm vụ suy luận phức tạp theo lĩnh vực cụ thể mà chỉ riêng các kỹ thuật truyền thống như SFT không thể đáp ứng. Với RLVR, bạn có thể cải thiện độ chính xác của mô hình trên các tác vụ có thể xác minh như tạo mã, toán học và trích xuất có cấu trúc bằng cách cung cấp các tín hiệu thưởng dựa trên độ chuẩn xác. RLAIF sử dụng phản hồi do AI tạo ra để định hướng hành vi của mô hình theo ưu tiên của bạn về chất lượng và độ an toàn. Các kỹ thuật này được cung cấp trên các mô hình được hỗ trợ trước đó và mô hình mới được bổ sung, mà không cần thiết lập cụm, lên kế hoạch công suất hay có chuyên môn về đào tạo phân tán.

Các mô hình và kỹ thuật tinh chỉnh này được cung cấp ở Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon), Châu Á Thái Bình Dương (Tokyo) và EU (Ireland). Để bắt đầu, hãy xem trang sản phẩm tùy chỉnh mô hình Amazon SageMaker AI và truy cập trang định giá Amazon SageMaker AI (tab Tùy chỉnh mô hình) để xem danh sách đầy đủ các mô hình, kỹ thuật và mức giá.