Lưu trữ đối tượng là gì?

Kho lưu trữ đối tượng là công nghệ lưu trữ và quản lý dữ liệu ở định dạng phi cấu trúc, gọi là đối tượng. Các tổ chức hiện đại tạo và phân tích lượng lớn dữ liệu phi cấu trúc như ảnh, video, email, trang web, dữ liệu cảm biến và tệp âm thanh. Kho lưu trữ đối tượng trên đám mây phân phối dữ liệu này trên nhiều thiết bị vật lý nhưng cho phép người dùng truy cập nội dung một cách hiệu quả từ một kho lưu trữ ảo duy nhất. Giải pháp lưu trữ đối tượng là lựa chọn lý tưởng để xây dựng các ứng dụng hoạt động trên đám mây đòi hỏi khả năng điều chỉnh quy mô và tính linh hoạt, đồng thời cũng có thể được sử dụng để nhập kho dữ liệu hiện có để phân tích, sao lưu hoặc lưu trữ.

Siêu dữ liệu đóng vai trò quan trọng đối với công nghệ lưu trữ đối tượng. Với kho lưu trữ đối tượng, các đối tượng được lưu giữ trong một vùng lưu trữ duy nhất và không phải là tệp nằm trong thư mục. Thay vào đó, kho lưu trữ đối tượng kết hợp các phần dữ liệu tạo thành tệp, thêm tất cả các siêu dữ liệu do người dùng tạo vào tệp đó và đính kèm mã định danh tùy chỉnh. Do đó, cấu trúc được tạo ra là cấu trúc phẳng, gọi là vùng lưu trữ, trái ngược với kho lưu trữ phân cấp hoặc phân bậc. Việc này giúp bạn truy xuất và phân tích bất kỳ đối tượng nào ở vùng lưu trữ, bất kể đó là loại tệp nào, dựa trên chức năng và đặc điểm của đối tượng.

Kho lưu trữ đối tượng là kho lưu trữ lý tưởng cho hồ dữ liệu vì nó cung cấp kiến trúc dành cho lượng lớn dữ liệu, trong đó mỗi một phần dữ liệu được lưu trữ dưới dạng đối tượng, đồng thời, siêu dữ liệu đối tượng cung cấp một mã định danh duy nhất để truy cập dễ dàng hơn. Kiến trúc này loại bỏ các hạn chế về điều chỉnh quy mô của kho lưu trữ truyền thống và là lý do để kho lưu trữ đối tượng là kho lưu trữ của đám mây.

Các lợi ích chính của kho lưu trữ đối tượng là khả năng điều chỉnh quy mô gần như không giới hạn và chi phí thấp để lưu trữ lượng lớn dữ liệu cho các trường hợp sử dụng, chẳng hạn như hồ dữ liệu, ứng dụng hoạt động trên đám mây, phân tích, tệp bản ghi và máy học (ML). Kho lưu trữ đối tượng cũng mang lại độ bền bỉ và khả năng phục hồi tuyệt vời hơn cho dữ liệu nhờ khả năng lưu trữ đối tượng trên nhiều thiết bị, trên nhiều hệ thống và thậm chí trên nhiều trung tâm dữ liệu cũng như khu vực. Việc này cho phép điều chỉnh quy mô gần như không giới hạn và cũng cải thiện khả năng phục hồi và mức độ sẵn sàng của dữ liệu.

Tại sao kho lưu trữ đối tượng lại quan trọng?

Khi doanh nghiệp phát triển, kho lưu trữ quản lý các nhóm dữ liệu nhanh chóng mở rộng nhưng riêng biệt từ nhiều nguồn được ứng dụng và quy trình doanh nghiệp cũng như người dùng cuối bất kỳ sử dụng. Hiện nay, phần lớn dữ liệu này không có cấu trúc với đầu ra ở nhiều định dạng và phương tiện lưu trữ khác nhau và không dễ dàng phù hợp với kho trung tâm. Việc này khiến hoạt động đổi mới thêm phần phức tạp và bị chậm lại vì không thể truy cập dữ liệu để phục vụ phân tích, máy học (ML) hoặc những ứng dụng mới hoạt động trên đám mây. Kho lưu trữ đối tượng giúp bạn chia nhỏ các silo này bằng cách cung cấp kho lưu trữ có quy mô cực kỳ linh hoạt, hiệu quả về chi phí để lưu trữ bất kỳ loại dữ liệu nào ở định dạng gốc. Kho lưu trữ đối tượng giúp xóa bỏ sự phức tạp, hạn chế dung lượng và rào cản chi phí như ở các hệ thống lưu trữ truyền thống vì kho lưu trữ đối tượng mang lại khả năng điều chỉnh quy mô không giới hạn với mức giá thấp tính theo mỗi gigabyte.

Bạn có thể quản lý dữ liệu phi cấu trúc ở cùng một nơi với giao diện ứng dụng thân thiện với người dùng. Bạn có thể sử dụng các chính sách để tối ưu hóa chi phí kho lưu trữ dữ liệu và tự động chuyển đổi bậc lưu trữ của mình khi cần thiết. Kho lưu trữ đối tượng trên đám mây giúp việc thực hiện phân tích và thu được thông tin chuyên sâu dễ dàng hơn, cho phép đưa ra quyết định nhanh hơn.

Mặc dù có thể lưu trữ đối tượng tại chỗ, kho lưu trữ đối tượng được xây dựng cho đám mây và mang lại khả năng điều chỉnh quy mô gần như không giới hạn, độ bền bỉ cao và hiệu quả về chi phí. Với kho lưu trữ đối tượng trên đám mây, dữ liệu luôn sẵn sàng để được truy cập từ bất cứ đâu.

Kho lưu trữ đối tượng có những trường hợp sử dụng nào?

Khách hàng sử dụng kho lưu trữ đối tượng cho nhiều giải pháp khác nhau. Sau đây là những trường hợp sử dụng phổ biến.

Phân tích

Bạn có thể thu thập và lưu trữ gần như không giới hạn bất kỳ loại hình dữ liệu nào trong kho lưu trữ đối tượng trên đám mây và thực hiện phân tích dữ liệu lớn để thu được thông tin chuyên sâu có giá trị về các hoạt động, khách hàng và thị trường mà bạn cung cấp dịch vụ.

Kho dữ liệu

Hồ dữ liệu sử dụng kho lưu trữ đối tượng trên đám mây làm nền tảng nhờ sở hữu khả năng điều chỉnh quy mô gần như không giới hạn và độ bền bỉ cao. Bạn có thể tăng dung lượng lưu trữ nội dung từ hàng gigabyte lên tới hàng petabyte một cách liền mạch và không gián đoạn và theo đó, bạn chỉ cần thanh toán cho những gì mà bạn sử dụng. Hồ dữ liệu có hiệu năng linh hoạt, tính năng dễ sử dụng, mã hóa gốc và khả năng kiểm soát truy cập.

Dữ liệu ứng dụng hoạt động trên đám mây

Các ứng dụng hoạt động trên đám mây sử dụng các công nghệ như container hóa và phi máy chủ để đáp ứng kỳ vọng của khách hàng một cách linh hoạt và nhanh chóng. Các ứng dụng này thường được tạo thành từ các thành phần nhỏ, độc lập và gắn kết lỏng lẻo, được gọi là vi dịch vụ để giao tiếp nội bộ bằng cách chia sẻ dữ liệu hoặc trạng thái. Dịch vụ lưu trữ đám mây cung cấp khả năng quản lý dữ liệu cho các ứng dụng đó và cung cấp giải pháp cho những thách thức liên tục về kho lưu trữ dữ liệu trong môi trường đám mây. Kho lưu trữ đối tượng cho phép bạn thêm lượng nội dung bất kỳ và truy cập từ bất kỳ đâu, nhờ đó có thể triển khai các ứng dụng nhanh hơn và tiếp cận được nhiều khách hàng hơn.

Lưu trữ dữ liệu

Kho lưu trữ đối tượng trên đám mây là phương án tuyệt vời để lưu giữ dữ liệu lâu dài. Bạn có thể sử dụng nó để thay thế cơ sở hạ tầng lưu trữ băng từ và ổ đĩa tại chỗ bằng các giải pháp cung cấp độ bền dữ liệu nâng cao, thời gian truy xuất ngay lập tức, bảo mật và tuân thủ tốt hơn cũng như khả năng truy cập dữ liệu cao hơn cho các phân tích nâng cao và nghiệp vụ thông minh. Bạn cũng có thể lưu trữ một lượng lớn nội dung truyền thông đa phương tiện sao cho hiệu quả về chi phí và giữ lại dữ liệu quy định, bắt buộc trong thời gian dài.

Truyền thông đa phương tiện

Tăng tốc ứng dụng và giảm chi phí lưu trữ tệp truyền thông đa phương tiện như video, hình ảnh kỹ thuật số và âm nhạc. Với kho lưu trữ đối tượng, bạn có thể tạo ra kiến trúc được sao chép trên toàn cầu, hiệu quả về chi phí để phân phối nội dung truyền thông đến người dùng phân tán bằng cách sử dụng các lớp lưu trữ và tính năng sao chép.

Sao lưu và phục hồi

Bạn có thể cấu hình các hệ thống lưu trữ đối tượng để sao chép nội dung để nếu một thiết bị vật lý bị lỗi, các thiết bị lưu trữ đối tượng trùng lặp sẽ sẵn sàng hoạt động. Việc này đảm bảo hệ thống và ứng dụng của bạn tiếp tục chạy mà không bị gián đoạn. Bạn cũng có thể sao chép dữ liệu trên nhiều trung tâm dữ liệu và khu vực địa lý.

ML

Trong máy học (ML), bạn “dạy” máy tính đưa ra các dự đoán hoặc suy luận. Bạn sử dụng thuật toán để đào tạo các mô hình rồi sau đó tích hợp mô hình đó vào ứng dụng của mình để tạo ra suy luận theo thời gian thực và trên quy mô lớn. Do quy mô và hiệu quả về chi phí của mình, kho lưu trữ đối tượng là yếu tố mà công nghệ máy học cần có vì một mô hình sản xuất thường học hỏi từ hàng triệu tới hàng tỷ mục dữ liệu mẫu và tạo ra các suy luận chỉ trong vòng 20 mili giây.

Kho lưu trữ đối tượng trên đám mây có gì khác biệt so với các loại kho lưu trữ khác?

Có ba loại kho lưu trữ trên đám mây: đối tượng, tệp và khối. Mỗi loại kho lưu trữ đều là lựa chọn lý tưởng cho những trường hợp sử dụng và yêu cầu lưu trữ cụ thể.

Kho lưu trữ tệp

Nhiều ứng dụng cần quyền truy cập tệp được chia sẻ. Thông thường, việc này sẽ được các dịch vụ thiết bị lưu trữ gắn vào mạng (NAS) hỗ trợ. Những giao thức cấp độ tệp phổ biến gồm Khối thông điệp máy chủ (SMB) được sử dụng với các máy chủ Windows và Hệ thống tệp mạng (NFS) có trong các phiên bản Linux. Kho lưu trữ tệp phù hợp với dữ liệu phi cấu trúc, kho nội dung lớn, kho lưu trữ nội dung phương tiện truyền thông, danh mục gốc và dữ liệu dựa trên tệp khác.

So sánh kho lưu trữ đối tượng và kho lưu trữ tệp

Khác biệt chính giữa kho lưu trữ đối tượng và kho lưu trữ tệp là cấu trúc của dữ liệu và khả năng điều chỉnh quy mô. Kho lưu trữ tệp được sắp xếp phân cấp với các danh mục và thư mục. Kho lưu trữ tệp cũng tuân thủ các giao thức tệp nghiêm ngặt, chẳng hạn như SMB, NFS hoặc Lustre. Kho lưu trữ đối tượng sử dụng cấu trúc phẳng với siêu dữ liệu và mã định danh duy nhất cho từng đối tượng, qua đó có thể dễ dàng tìm một đối tượng hơn trong khoảng hàng tỷ đối tượng khác.

Với những khác biệt về cấu trúc này, kho lưu trữ tệp và kho lưu trữ đối tượng có khả năng điều chỉnh quy mô khác nhau. Kho lưu trữ đối tượng cung cấp khả năng điều chỉnh quy mô gần như vô hạn, tới hàng petabyte và hàng tỷ đối tượng. Do hệ thống phân cấp và định đường dẫn vốn có, kho lưu trữ tệp gặp phải những hạn chế về điều chỉnh quy mô.

Lưu trữ khối dữ liệu

Các ứng dụng doanh nghiệp như cơ sở dữ liệu hoặc ERP thường yêu cầu kho lưu trữ chuyên dụng, có độ trễ thấp cho mỗi máy chủ. Điều này tương tự với thiết bị lưu trữ gắn trực tiếp (DAS) hoặc mạng khu vực lưu trữ (SAN). Các giải pháp lưu trữ trên đám mây dựa trên khối được cung cấp kèm theo mỗi máy chủ ảo và mang đến độ trễ siêu thấp cần thiết cho khối lượng công việc hiệu năng cao.

So sánh kho lưu trữ đối tượng và kho lưu trữ khối

Trường hợp sử dụng lý tưởng nhất của kho lưu trữ đối tượng là với lượng lớn dữ liệu không có cấu trúc, đặc biệt khi độ bền, dung lượng lưu trữ không giới hạn, khả năng điều chỉnh quy mô và quản lý siêu dữ liệu phức tạp là những yếu tố liên quan tới hiệu năng tổng thể.

Kho lưu trữ khối cung cấp các giá trị có độ trễ thấp và hiệu năng cao trong nhiều trường hợp sử dụng khác nhau. Các tính năng của kho lưu trữ khối chủ yếu hữu ích đối với kho lưu trữ cơ sở dữ liệu có cấu trúc, ổ đĩa hệ thống tệp VM và dung lượng tải đọc và ghi lớn.

AWS có thể trợ giúp như thế nào với nhu cầu lưu trữ đối tượng trên đám mây của bạn?

Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) là một dịch vụ lưu trữ đối tượng cung cấp khả năng điều chỉnh quy mô, tính khả dụng của dữ liệu, độ bảo mật và hiệu năng hàng đầu trong ngành. Khách hàng thuộc mọi quy mô và ngành nghề đều có thể dùng Amazon S3 để lưu trữ và bảo vệ bất kỳ lượng dữ liệu nào cho nhiều trường hợp sử dụng như hồ dữ liệu, trang web, ứng dụng di động, sao lưu và khôi phục, lưu trữ, ứng dụng doanh nghiệp, thiết bị IoT và phân tích dữ liệu lớn. Amazon S3 cung cấp các tính năng quản lý mà bạn có thể tối ưu hóa, sắp xếp và cấu hình quyền truy cập dữ liệu của bạn nhằm đáp ứng yêu cầu cụ thể của doanh nghiệp, tổ chức và yêu cầu về tuân thủ. Sau đây là một số ví dụ về lợi ích của Amazon S3.

Độ bền bỉ, mức độ sẵn sàng và khả năng điều chỉnh quy mô

Amazon S3 được xây dựng từ đầu để mang lại độ bền bỉ của dữ liệu đạt 99,999999999% (11 chữ số 9). Với Amazon S3, đối tượng của bạn được lưu trữ dự phòng trên nhiều thiết bị ở tối thiểu ba Vùng sẵn sàng (AZ) tại Khu vực Amazon S3. Amazon S3 được thiết kế để chịu được sự cố thiết bị xảy ra đồng thời bằng cách nhanh chóng phát hiện và sửa chữa phần dự phòng bị mất bất kỳ, đồng thời cũng thường xuyên xác minh tính toàn vẹn của dữ liệu của bạn bằng các giá trị tổng kiểm.

Bảo mật và tuân thủ

Amazon S3 bảo vệ dữ liệu của bạn với khả năng bảo mật, tuân thủ và kiểm tra. Theo mặc định, Amazon S3 được đảm bảo an toàn. Sau khi tạo, chỉ bạn mới có quyền truy cập vào vùng lưu trữ Amazon S3 do bạn tạo và bạn có toàn quyền kiểm soát những ai truy cập vào dữ liệu của bạn. Amazon S3 hỗ trợ xác thực người dùng để kiểm soát truy cập vào dữ liệu. Bạn có thể dùng các cơ chế kiểm soát truy cập như chính sách vùng lưu trữ để cấp quyền một cách có chọn lọc cho người dùng và nhóm người dùng. Bên cạnh đó, S3 duy trì các chương trình tuân thủ, chẳng hạn như PCI DSS, HIPAA/HITECH, FedRAMP, Quy tắc 17 a-4 của SEC, Chỉ thị bảo vệ dữ liệu của Liên minh châu Âu (EU) và FISMA, qua đó giúp bạn đáp ứng các yêu cầu về quy định. AWS cũng hỗ trợ nhiều khả năng kiểm tra để giám sát các yêu cầu truy cập vào tài nguyên Amazon S3 của bạn.

Quản lý linh hoạt

AWS cung cấp bộ năng lực quản lý và quản trị lưu trữ linh hoạt nhất. Quản trị viên lưu trữ có thể phân loại, báo cáo và trực quan hóa xu hướng sử dụng dữ liệu để giảm chi phí và tăng cường mức độ dịch vụ. Đối tượng có thể được gắn thẻ bằng siêu dữ liệu duy nhất và có thể tùy chỉnh để bạn có thể thấy và kiểm soát lượng sử dụng dung lượng lưu trữ, chi phí và bảo mật riêng biệt cho từng khối lượng công việc. Công cụ S3 Inventory có khả năng cung cấp báo cáo theo lịch về đối tượng và siêu dữ liệu của đối tượng để phục vụ các hoạt động bảo trì, tuân thủ hoặc phân tích. Amazon S3 cũng có thể phân tích mẫu truy cập đối tượng để xây dựng các chính sách vòng đời nhằm tự động hóa việc phân bậc, xóa và lưu giữ. Cuối cùng, do Amazon S3 có liên kết với AWS Lambda, khách hàng có thể ghi nhật ký hoạt động, định nghĩa cảnh báo và gọi quy trình làm việc mà không phải quản lý thêm bất kỳ cơ sở hạ tầng nào khác.

Lớp lưu trữ tiết kiệm chi phí

Amazon S3 cung cấp một loạt các lớp lưu trữ mà bạn có thể lựa chọn dựa trên các yêu cầu về quyền truy cập dữ liệu, khả năng phục hồi và chi phí tương ứng với khối lượng công việc của bạn. Các lớp lưu trữ của Amazon S3 được xây dựng nhằm mục đích cung cấp khả năng lưu trữ với chi phí thấp nhất cho các kiểu truy cập khác nhau. Bạn chỉ phải trả tiền cho những gì bạn sử dụng. Mức giá tính cho bạn tùy thuộc vào kích cỡ các đối tượng của bạn, thời gian bạn lưu trữ các đối tượng trong tháng và lớp lưu trữ bạn đã chọn. Hãy tìm lớp lưu trữ của Amazon S3 phù hợp nhất với khối lượng công việc của bạn.

Phân tích hiệu quả

Amazon S3 là nền tảng lưu trữ đám mây duy nhất cho phép khách hàng chạy các phân tích phức tạp đối với dữ liệu của họ mà không yêu cầu họ trích xuất và di chuyển dữ liệu đến cơ sở dữ liệu phân tích riêng biệt. Khách hàng có kiến thức về SQL có thể sử dụng Amazon Athena để phân tích khối lượng khổng lồ dữ liệu phi cấu trúc trong Amazon S3 theo nhu cầu. Với Amazon Redshift Spectrum, khách hàng có thể chạy các phân tích phức tạp đối với dữ liệu lên đến exabyte trong Amazon S3 và chạy các truy vấn trải dài trên cả dữ liệu bạn có trong Amazon S3 và trong kho dữ liệu Amazon Redshift của bạn.

Cộng đồng khách hàng và đối tác lớn nhất

AWS có hàng triệu khách hàng hoạt động và hàng chục nghìn đối tác toàn cầu. Khách hàng trên hầu hết các ngành công nghiệp thuộc mọi quy mô, bao gồm công ty khởi nghiệp, doanh nghiệp và tổ chức công, đang chạy mọi trường hợp sử dụng có thể diễn ra trên AWS. Mạng lưới đối tác AWS (APN) bao gồm hàng nghìn đơn vị tích hợp hệ thống chuyên về dịch vụ AWS và hàng chục nghìn nhà cung cấp phần mềm độc lập (ISV) điều chỉnh công nghệ của mình để hoạt động trên AWS.

Bắt đầu với lưu trữ đối tượng bằng cách tạo tài khoản AWS ngay hôm nay.

Các bước tiếp theo để sử dụng Kho lưu trữ đối tượng trên AWS

Tham khảo các tài nguyên bổ sung liên quan đến sản phẩm
Xem các ưu đãi miễn phí cho các dịch vụ Lưu trữ trên đám mây 
Đăng ký tài khoản miễn phí

Nhận ngay quyền sử dụng bậc miễn phí của AWS. 

Đăng ký 
Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng trong AWS Management Console.

Đăng nhập