Giới thiệu Amazon Nova 2 Omni ở chế độ xem trước

Ngày đăng: 2 Th12 2025

Chúng tôi rất hân hạnh thông báo ra mắt Amazon Nova 2 Omni, mô hình toàn diện chuyên về lập luận đa phương thức và tạo hình ảnh. Đây là mô hình lập luận đầu tiên trong ngành hỗ trợ đầu vào là văn bản, hình ảnh, video và giọng nói và tạo ra đầu ra bằng cả văn bản lẫn hình ảnh. Mô hình này mở ra khả năng hiểu đa phương thức, tạo và chỉnh sửa hình ảnh bằng ngôn ngữ tự nhiên và ghi lại giọng nói.

Khác với các phương pháp tiếp cận truyền thống thường buộc các tổ chức chắp nối nhiều mô hình chuyên dụng khác nhau lại với nhau, mỗi mô hình lại hỗ trợ các loại đầu vào và đầu ra khác nhau, Nova 2 Omni loại bỏ sự phức tạp của việc quản lý nhiều mô hình AI cùng lúc. Điều này giúp đẩy nhanh quá trình phát triển ứng dụng, đồng thời giảm độ phức tạp và chi phí, cho phép các nhà phát triển giải quyết các tác vụ đa dạng, từ tạo nội dung tiếp thị và chép lời cuộc gọi hỗ trợ khách hàng đến phân tích video và lập tài liệu bằng các tính năng hỗ trợ trực quan.

Mô hình này hỗ trợ cửa sổ ngữ cảnh 1 triệu token, trên 200 ngôn ngữ trong xử lý văn bản và 10 ngôn ngữ cho đầu vào là giọng nói. Mô hình này có khả năng tạo và chỉnh sửa hình ảnh chất lượng cao bằng ngôn ngữ tự nhiên, cho phép duy trì sự nhất quán của nhân vật, hiển thị văn bản trong hình ảnh cũng như sửa đổi đối tượng và nền. Nova 2 Omni đem đến khả năng hiểu giọng nói vượt trội với khả năng lập luận gốc để chép lời, dịch và tóm tắt các cuộc đàm thoại có nhiều người nói. Và, với các biện pháp kiểm soát lập luận linh hoạt đáp ứng nhu cầu về chiều sâu và ngân sách, các nhà phát triển có thể đảm bảo hiệu năng, độ chính xác và khả năng quản lý chi phí tối ưu trong nhiều trường hợp sử dụng khác nhau.

Nova 2 Omni hiện đang ở chế độ xem trước với quyền truy cập sớm dành cho tất cả khách hàng của Nova Forge. Vui lòng liên hệ với đội ngũ phụ trách tài khoản AWS của bạn để nhận quyền truy cập. Để tìm hiểu thêm về Amazon Nova 2 Omni, hãy đọc hướng dẫn sử dụng