Amazon SageMaker Ground Truth giúp bạn xây dựng bộ dữ liệu đào tạo cho machine learning. Ground Truth sẽ gắn nhãn nội dung của bạn (hình ảnh, âm thanh, văn bản, v.v.) bằng cách hướng dẫn từng bước cho người gắn nhãn trong tiến trình gọi là luồng công việc. Ba nhóm người có thể cung cấp nhãn bằng cách sử dụng luồng công việc này gồm nhân viên Amazon Mechanical Turk, nhân viên của bạn hoặc nhà cung cấp bên thứ ba. Ground Truth cũng có thể tự động học từ các nhãn và đối tượng gắn nhãn này.  

Bạn chỉ trả tiền cho từng đối tượng được gắn nhãn (có thể là hình ảnh, bản ghi âm, một phần văn bản, v.v.) cho dù các đối tượng này được gắn nhãn tự động bởi Ground Truth hay bởi người gắn nhãn. Nếu bạn sử dụng nhà cung cấp hoặc Mechanical Turk để gắn nhãn, bạn phải trả thêm phụ phí cho mỗi đối tượng được gắn nhãn. Nếu bạn dùng nhân viên của mình để gắn nhãn thì sẽ không tốn thêm phụ phí cho mỗi đối tượng được gắn nhãn. 

Thông tin chi tiết về giá

Bạn phải trả phí cho số lượng đối tượng tập dữ liệu được gắn nhãn. Đối tượng tập dữ liệu được định nghĩa là một đơn vị dữ liệu nguyên tử và có thể bao gồm hình ảnh, khung hình video, tài liệu văn bản, tệp âm thanh, v.v.

Đám mây điểm 3D

Giá của Amazon Mechanical Turk cho luồng công việc gắn nhãn tích hợp

Nếu bạn sử dụng nhà cung cấp, chi phí cho mỗi nhãn sẽ do nhà cung cấp thiết lập. Bạn có thể xem thông tin chi tiết về giá của từng nhà cung cấp trong AWS Marketplace. Nếu bạn sử dụng Amazon Mechanical Turk để gắn nhãn, bạn phải trả phí cho mỗi đối tượng trên mỗi người gắn nhãn. Chúng tôi khuyến nghị bạn sử dụng nhiều người gắn nhãn cho mỗi đối tượng để cải thiện độ chính xác của nhãn. 

Bậc miễn phí

Khi tham gia Bậc miễn phí của AWS, bạn có thể bắt đầu sử dụng miễn phí Amazon SageMaker Ground Truth. Trong hai tháng đầu kể từ khi sử dụng Amazon SageMaker, 500 đối tượng đầu tiên được gắn nhãn mỗi tháng sẽ được miễn phí (không bao gồm bất kỳ chi phí nào phát sinh khi sử dụng nhà cung cấp gắn nhãn hoặc Amazon Mechanical Turk).

Ví dụ về giá

Sử dụng nhân viên nội bộ để gắn nhãn bởi con người

Một công ty sản xuất sử dụng machine learning để phân loại hình ảnh sản phẩm của mình. Để đào tạo mô hình, họ gắn nhãn 40.000 hình ảnh với tên sản phẩm. Sử dụng luồng công việc tích hợp để phân loại hình ảnh, nhân viên của công ty này đã gắn nhãn tất cả 40.000 hình ảnh.

Vì công ty đã sử dụng nhân viên nội bộ, mức giá của 40.000 hình ảnh do con người gắn nhãn là 0.08 USD cho mỗi hình ảnh.

Tổng chi phí = 40.000 hình ảnh do con người gắn nhãn x 0.08 USD mỗi hình ảnh = 3,200 USD

Sử dụng Mechanical Turk để gắn nhãn bởi con người với luồng công việc tùy chỉnh

Một công ty quảng cáo sử dụng machine learning để xác định cảm xúc lẫn nội dung của các bài đăng trên mạng xã hội. Để đào tạo mô hình, họ quyết định gắn nhãn 85.000 bài đăng. Công ty này đã xây dựng và tải lên luồng công việc tùy chỉnh và thiết lập khoản tiền thanh toán là 0,036 USD mỗi bài đăng. Họ cũng quyết định mỗi bài đăng phải được gắn nhãn 3 lần để cải thiện độ chính xác của nhãn. Sử dụng nhân lực của SageMaker Ground Truth để gắn nhãn 85.000 bài đăng.

Vì công ty sử dụng Mechanical Turk, chi phí bao gồm khoản phụ phí 0,036 USD trên mỗi bài đăng do con người gắn nhãn để trả cho người gắn nhãn.

Tổng chi phí = (50.000 x 0,08 USD mỗi bài viết) + (35.000 bài đăng x 0,04 USD mỗi bài đăng) + (85.000 bài đăng do con người gắn nhãn x 0,036 USD mỗi bài đăng x 3 người gắn nhãn mỗi đối tượng) = 14.580 USD

Sử dụng Mechanical Turk để gắn nhãn bởi con người với luồng công việc tích hợp

Một công ty xuất bản sử dụng machine learning để xây dựng một ứng dụng xử lý ngôn ngữ tự nhiên để phân loại các bài báo. Để đào tạo mô hình, họ gắn nhãn 200.000 bài viết. Họ chọn luồng công việc phân loại văn bản tích hợp và quyết định mỗi bài viết phải được gắn nhãn 3 lần để cải thiện độ chính xác của nhãn. Sử dụng nhân viên của SageMaker Ground Truth để gắn nhãn 40.000 bài viết và tự động gắn nhãn 160.000 bài viết còn lại.

Vì công ty sử dụng Mechanical Turk, luồng công việc phân loại văn bản này đã bao gồm khoản phụ phí 0.012 USD trên mỗi bài viết do con người gắn nhãn để trả cho người gắn nhãn.

Tổng chi phí = (50.000 x 0.08 USD mỗi bài viết) + (150.000 bài viết x 0.04 USD mỗi bài viết) + (40.000 bài viết do con người gắn nhãn x 0.012 USD mỗi bài viết x 3 người gắn nhãn mỗi đối tượng) + chi phí suy luận & đào tạo Amazon SageMaker** = 11,440 USD + chi phí suy luận & đào tạo Amazon SageMaker**

**Các chi phí này phụ thuộc vào nhiều yếu tố, bao gồm loại bộ dữ liệu được sử dụng, loại tác vụ gắn nhãn và độ phân giải của hình ảnh trong bộ dữ liệu của bạn.

Tài nguyên định giá khác

Công cụ tính giá AWS

Dễ dàng tính phí hàng tháng của bạn với AWS

Trung tâm tài nguyên kinh tế

Tài nguyên bổ sung cho việc chuyển đổi sang AWS

Product-Page_Standard-Icons_01_Product-Features_SqInk
Tìm hiểu thêm trong tài liệu Amazon SageMaker Ground Truth

Tìm hiểu cách mà Amazon SageMaker Ground Truth có thể giúp bạn xây dựng bộ dữ liệu đào tạo chất lượng cao với độ chính xác cao nhất và giảm tới 70% chi phí gắn nhãn dữ liệu.

Đọc tài liệu 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Đăng ký tài khoản miễn phí

Nhận quyền sử dụng ngay lập tức Bậc miễn phí của AWS. 

Đăng ký 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng với Amazon SageMaker Ground Truth trong Bảng điều khiển quản lý AWS.

Đăng nhập