Câu hỏi thường gặp về quản trị dữ liệu và AI của Amazon SageMaker

Quản trị Dữ liệu và AI

Thế hệ tiếp theo của Amazon SageMaker đơn giản hóa việc khám phá, quản trị và cộng tác dữ liệu và AI trên hồ, mô hình AI và ứng dụng của bạn. Với Amazon SageMaker Catalog, được xây dựng trên Amazon DataZone, người dùng có thể khám phá và truy cập dữ liệu và mô hình đã được phê duyệt một cách an toàn bằng cách sử dụng tìm kiếm ngữ nghĩa với siêu dữ liệu do AI tạo ra hoặc bạn có thể chỉ cần yêu cầu Q Developer bằng ngôn ngữ tự nhiên để tìm dữ liệu của bạn. Người dùng có thể xác định và thực thi các chính sách truy cập một cách nhất quán bằng cách sử dụng một mô hình quyền hạn đơn với các kiểm soát truy cập chi tiết tập trung trong Studio Hợp nhất SageMaker (xem trước). Chia sẻ và cộng tác liền mạch trên tài sản AI và dữ liệu thông qua quy trình công việc đăng ký và xuất bản dễ dàng. Với Amazon SageMaker, bạn có thể bảo vệ các mô hình AI của mình bằng cách sử dụng quy tắc bảo vệ Amazon Bedrock và thực hiện các chính sách AI có trách nhiệm. Xây dựng niềm tin trong toàn tổ chức của bạn với chức năng giám sát và tự động hóa chất lượng dữ liệu, phát hiện dữ liệu nhạy cảm và nguồn gốc ML và dữ liệu.

Bạn có thể truy cập SageMaker Catalog thông qua Studio Hợp nhất Amazon SageMaker (xem trước), là một môi trường duy nhất để phát triển dữ liệu và AI. Để thiết lập, cấu hình hoặc tích hợp với các quy trình hiện có bằng phương thức lập trình, SageMaker Catalog đã phát hành các API kèm theo hướng dẫn về cách sử dụng API Amazon DataZone.

  • Khó khăn trong việc tìm kiếm và chia sẻ dữ liệu giữa các nhóm: Các nhà sản xuất dữ liệu và người tiêu dùng thường phải đối mặt với những thách thức trong việc nhanh chóng xác định vị trí và chia sẻ các bộ dữ liệu có liên quan trong toàn tổ chức. Sự kém hiệu quả này dẫn đến lãng phí thời gian tìm kiếm dữ liệu và hạn chế sự hợp tác.
  • Thiếu tin tưởng vào chất lượng dữ liệu và đầu ra của mô hình AI: Các tổ chức phải vật lộn để tin tưởng vào chất lượng dữ liệu của họ và độ chính xác của đầu ra của mô hình AI do thiếu cái nhìn về nguồn gốc dữ liệu, chất lượng và các mẫu truy cập.
  • Truy cập dữ liệu không nhất quán và vi phạm quyền riêng tư: Các tổ chức gặp khó khăn trong việc thực thi các chính sách truy cập dữ liệu nhất quán, dẫn đến khả năng truy cập trái phép vào thông tin nhạy cảm.
  • Khó khăn trong việc duy trì tuân thủ các quy định và chính sách nội bộ: Các tổ chức cảm thấy khó khăn trong việc duy trì tuân thủ quy định và tuân thủ các chính sách nội bộ do thiếu các công cụ kiểm toán và giám sát toàn diện.

Quản trị dữ liệu và AI Amazon trong Amazon SageMaker giúp các nhóm dữ liệu:

  • Phát hiện và cộng tác dữ liệu nhanh hơn: Người dùng có thể nhanh chóng tìm và chia sẻ dữ liệu có liên quan trong toàn tổ chức, giảm thời gian tìm kiếm thông tin và thúc đẩy tinh thần đồng đội.
  • Cải thiện niềm tin thông qua nguồn gốc và chất lượng: Theo dõi nguồn gốc dữ liệu và cải thiện chất lượng dữ liệu để tăng sự tin tưởng vào các quyết định dựa trên dữ liệu và đầu ra của mô hình AI.
  • Bảo mật dữ liệu và mô hình AI nâng cao: Bảo mật dữ liệu và Mô hình chỉ có thể truy cập thông qua các dự án, nó đảm bảo chỉ những người được ủy quyền xem tài sản trong dự án mới có thể truy cập nó, duy trì các tiêu chuẩn bảo mật và quyền riêng tư.
  • Giảm rủi ro kinh doanh và tuân thủ quy định tốt hơn: Các hoạt động ghi nhật ký giúp các tổ chức phù hợp với các quy định của ngành và chính sách nội bộ, giúp giảm thiểu rủi ro của tổ chức.
  • Mở khóa năng suất kinh doanh với chức năng tìm kiếm và khám phá tài sản: Tìm kiếm và khám phá dữ liệu và tài sản AI để tiếp thêm sức mạnh cho các nhóm, giảm thời gian tìm kiếm các tài sản quan trọng và thúc đẩy quá trình ra quyết định dựa trên dữ liệu nhanh hơn.
  • Quản lý chính sách truy cập dữ liệu tập trung: Xác định và quản lý các quy tắc truy cập dữ liệu từ một điểm duy nhất, dẫn đến ứng dụng nhất quán trên các dịch vụ AWS khác nhau và môi trường của bên thứ ba.
  • Làm giàu dữ liệu với bối cảnh kinh doanh và phân loại: Thêm siêu dữ liệu và phân loại vào tập dữ liệu, giúp người dùng dễ dàng hiểu được mức độ liên quan và khả năng áp dụng dữ liệu cho các nhu cầu kinh doanh cụ thể.
  • Nhật ký hoạt động cho người dùng và hệ thống: Giám sát và ghi lại các tương tác với hệ thống dữ liệu và AI, cung cấp cái nhìn về các mô hình sử dụng và các vấn đề bảo mật tiềm ẩn.
  • Triển khai quản trị dữ liệu AI/ML: Mở rộng các nguyên tắc quản trị dữ liệu cho các quy trình AI và máy học, đảm bảo rằng chỉ dữ liệu được phê duyệt mới được sử dụng trong đào tạo mô hình và các hệ thống AI tuân thủ các quyền đã xác định và các quy tắc đạo đức.

Amazon SageMaker Catalog được xây dựng trên Amazon DataZone, cung cấp các khả năng quản trị tương tự trong trải nghiệm người dùng hợp nhất. Trải nghiệm Amazon DataZone tiếp tục duy trì như hiện tại để cho phép khách hàng Amazon DataZone hiện tại tiếp tục sử dụng giao diện quen thuộc nếu họ muốn.

Chi tiết định giá có thể được tìm thấy tại đây: https://aws.amazon.com/datazone/pricing/.