Các mô hình Gemma 4 hiện đã có sẵn trên Amazon Bedrock

Ngày đăng: 10 Th06 2026

Hôm nay, AWS công bố rằng dòng mô hình trọng số mở Gemma 4 của Google DeepMind hiện đã có sẵn trên Amazon Bedrock. Với Gemma 4, bạn có thể xây dựng các ứng dụng AI tạo sinh bao gồm suy luận, hiểu đa phương thức, tác tử và các quy trình làm việc về kỹ thuật phần mềm.

Dòng Gemma 4 trên Amazon Bedrock bao gồm ba biến thể – Gemma 4 31B, Gemma 4 26B-A4B và Gemma 4 E2B – bao trùm cả kiến trúc dày đặc lẫn kết hợp chuyên gia (MoE) với khả năng suy luận tích hợp sẵn, gọi hàm gốc, hỗ trợ trên 35 ngôn ngữ và đầu vào đa phương thức gồm văn bản, hình ảnh, video và âm thanh. Gemma 4 31B phù hợp cho khối lượng công việc nặng về suy luận và lập trình với cửa sổ ngữ cảnh 256 nghìn token, Gemma 4 26B-A4B nhắm đến khối lượng công việc nhạy cảm về mặt chi phí và độ trễ, còn Gemma 4 E2B là biến thể nhỏ nhất, được thiết kế cho các trường hợp sử dụng tương tác có độ trễ thấp. Gemma 4 chạy trên một cải tiến mới trong Bedrock được thiết kế nhằm tối ưu hóa hiệu năng trên chi phí, đồng thời cải thiện khả năng hỗ trợ gọi công cụ, đầu ra có cấu trúc, suy luận và truyền phát phản hồi, giúp khách hàng có thể xây dựng các ứng dụng AI tạo sinh đáng tin cậy dựa trên các mô hình mã nguồn mở.

Các mô hình Gemma 4 hiện có sẵn tại các Khu vực AWS sau: Miền Đông Hoa Kỳ (Bắc Virginia), Miền Đông Hoa Kỳ (Ohio), Miền Tây Hoa Kỳ (Oregon) và Châu Âu (Frankfurt). Để bắt đầu sử dụng, hãy truy cập các trang chi tiết mô hình Gemma 4 trong tài liệu của chúng tôi.