Kho lưu trữ khối là gì?
Kho lưu trữ khối là công nghệ kiểm soát các thiết bị lưu trữ và kho lưu trữ dữ liệu. Công nghệ này lấy bất kỳ dữ liệu nào, ví dụ như tệp hoặc mục nhập cơ sở dữ liệu, rồi chia dữ liệu đó thành các khối có kích thước bằng nhau. Sau đó, hệ thống lưu trữ khối sẽ lưu trữ khối dữ liệu trên kho lưu trữ vật lý cơ sở theo hướng tối ưu hóa để truy cập và truy xuất nhanh chóng. Nhà phát triển ưu tiên sử dụng kho lưu trữ khối cho các ứng dụng yêu cầu quyền truy cập dữ liệu nhanh chóng, hiệu quả và đáng tin cậy. Hãy coi lưu trữ khối như một quy trình trực tiếp hơn dẫn đến dữ liệu. Trái lại, kho lưu trữ tệp có thêm một lớp bao gồm hệ thống tệp (NFS, SMB) cần xử lý trước khi truy cập dữ liệu.
Kho lưu trữ khối mang lại lợi ích gì?
Các tổ chức sử dụng lưu trữ cấp khối vì những ưu điểm sau đây.
Hiệu năng cao
Siêu dữ liệu là dữ liệu bổ sung, mô tả dữ liệu chính được chứa trong hệ thống lưu trữ. Kho lưu trữ khối sử dụng siêu dữ liệu bị giới hạn nhưng dựa vào mã định danh duy nhất được chỉ định cho từng khối để thực hiện các thao tác đọc/ghi. Việc này giúp giảm tổng chi phí truyền dữ liệu và cho phép máy chủ truy cập cũng như truy xuất dữ liệu trong kho lưu trữ khối một cách hiệu quả.
Vì siêu dữ liệu trong kho lưu trữ khối bị giới hạn, kho lưu trữ khối mang lại độ trễ cực thấp, cần thiết cho các khối lượng công việc có hiệu năng cao. Đây là yếu tố cần thiết đối với các ứng dụng đòi hỏi cao về độ trễ như cơ sở dữ liệu. Ví dụ: Viasat sử dụng Kho lưu trữ khối linh hoạt của Amazon (Amazon EBS) để thu thập dữ liệu có thông lượng cao (có tính chất giao dịch cao) và tối ưu hóa chi phí lưu trữ. Các tổ chức sử dụng Amazon EBS để tối ưu hóa hiệu năng và chi phí, điều chỉnh quy mô và vận hành linh hoạt cũng như để bảo vệ dữ liệu bằng Ảnh chụp nhanh Amazon EBS.
Kiến trúc lưu trữ khối cung cấp nhiều đường dẫn đến dữ liệu, trong khi đó, lưu trữ tệp chỉ cung cấp một đường dẫn, đây là lý do tại sao kho lưu trữ khối được ưu tiên sử dụng cho các ứng dụng có hiệu năng cao.
Sử dụng linh hoạt, dễ điều chỉnh quy mô
Thiết bị lưu trữ khối không bị giới hạn trong môi trường mạng cụ thể. Các khối riêng lẻ có thể được cấu hình cho những hệ điều hành khác nhau, chẳng hạn như Windows hoặc Linux. Các nhà phát triển có thể chia sẻ dữ liệu trên nhiều môi trường để đảm bảo mức độ sẵn sàng cao. Kiến trúc lưu trữ khối cũng có quy mô cực kỳ linh hoạt. Các nhà phát triển có thể thêm khối mới cho khối hiện tại nhằm đáp ứng nhu cầu công suất ngày càng tăng.
Sửa đổi thường xuyên
Kho lưu trữ khối hỗ trợ ghi dữ liệu thường xuyên mà không làm giảm hiệu năng. Thay vì ghi lại toàn bộ tệp, hệ thống sẽ xác định khối cụ thể cần được sửa đổi. Sau đó, khối đã chọn sẽ được ghi lại bằng dữ liệu mới. Việc này giúp kho lưu trữ khối mang lại hiệu quả rất cao trong công tác quản lý các tệp lớn, đòi hỏi cập nhật thường xuyên.
Kiểm soát chi tiết
Các nhà phát triển đạt được mức độ kiểm soát cao đối với việc lưu trữ dữ liệu trên kho lưu trữ khối. Ví dụ: họ có thể tối ưu hóa hiệu năng bằng cách nhóm dữ liệu thay đổi nhanh trên các khối cụ thể và lưu trữ các tệp tĩnh trên những khối khác. Điều này giúp cải thiện hiệu năng của hệ thống vì hoạt động cập nhật liên tục chỉ ảnh hưởng tới một lượng nhỏ khối dữ liệu thay vì toàn bộ tệp. Ví dụ: lưu trữ khối dữ liệu cho phép bạn phân bậc dữ liệu thay đổi nhanh trên ổ cứng thể rắn (SSD) hiệu suất cao, đồng thời lưu trữ dữ liệu ấm hoặc dữ liệu nguội trên các ổ cứng (HDD) có chi phí thấp hơn.
Lưu trữ khối được sử dụng trong những trường hợp nào?
Nhờ những đặc tính độc đáo của mình, kho lưu trữ khối trở thành phương án được ưu tiên sử dụng cho các ứng dụng giao dịch, tối quan trọng và nặng về I/O. Kho lưu trữ khối được sử dụng cho nhiều ứng dụng khác nhau, bao gồm cơ sở dữ liệu quan hệ hoặc giao dịch, cơ sở dữ liệu chuỗi thời gian, bộ chứa, đĩa khởi động và các hệ thống tệp của phần mềm giám sát.
Mạng khu vực lưu trữ
Các nhà phát triển thường triển khai lưu trữ khối dưới dạng mạng khu vực lưu trữ (SAN). SAN là công nghệ mạng phức tạp, đưa kho lưu trữ khối vào nhiều hệ thống được kết nối mạng như thể những khối đó là các thiết bị được gắn cục bộ. SAN thường sử dụng liên kết kênh cáp quang. Ngược lại, thiết bị lưu trữ gắn vào mạng (NAS) là thiết bị cung cấp tệp qua Ethernet.
Kiến trúc SAN bao gồm ba lớp:
- Lớp máy chủ bao gồm các máy chủ quản lý truy cập lưu trữ
- Lớp lưu trữ bao gồm các thiết bị lưu trữ khối vật lý như băng từ, ổ đĩa hoặc phương tiện quang học
- Lớp kết cấu liên kết các máy chủ SAN và kho lưu trữ SAN với những thiết bị như bộ chuyển mạch SAN, cầu giao thức, bộ định tuyến, cáp và các thiết bị cổng
Lưu ý quan trọng: SAN sử dụng phần dự phòng bằng cách sao chép đồng bộ hoặc không đồng bộ trên những quãng hành trình dài. Việc này giúp giảm thiểu thời gian ngừng hoạt động trong trường hợp không thể tiếp cận một vị trí địa lý.
Kiến trúc SAN có thể kết hợp với một số loại hình lưu trữ trong một môi trường thống nhất, bao gồm kho lưu trữ khối. Kho lưu trữ khối cung cấp lựa chọn thay thế hiệu quả cao cho lưu trữ tệp trên SAN.
Containers
Các nhà phát triển sử dụng kho lưu trữ khối để lưu trữ ứng dụng nằm trong bộ chứa trên đám mây. Bộ chứa là các gói phần mềm chứa ứng dụng và các tệp tài nguyên của ứng dụng để triển khai trong bất kỳ môi trường điện toán nào. Giống như bộ chứa, kho lưu trữ khối cũng linh hoạt, có quy mô tùy chỉnh và hiệu quả không kém. Với kho lưu trữ khối, các nhà phát triển có thể di chuyển bộ chứa một cách liền mạch giữa các máy chủ, vị trí và môi trường hoạt động.
Khối lượng công việc giao dịch
Khối lượng công việc giao dịch là chuỗi dữ liệu được tạo ra tại các điểm cụ thể của quy trình kinh doanh. Ví dụ: hồ sơ bán hàng, bản ghi hoạt động và cảnh báo đăng nhập là những khối lượng công việc giao dịch. Đối với các tổ chức xử lý những giao dịch gấp gáp về thời gian và tối quan trọng, họ lưu trữ khối lượng công việc đó vào một cơ sở dữ liệu có độ trễ thấp, công suất cao và có khả năng chịu lỗi.
Kho lưu trữ khối cho phép các nhà phát triển thiết lập cơ sở dữ liệu giao dịch mạnh mẽ, có quy mô linh hoạt và hiệu quả cao. Vì mỗi khối là một đơn vị độc lập, cơ sở dữ liệu hoạt động một cách tối ưu, ngay cả khi dữ liệu được lưu trữ tăng lên. Hơn nữa, những khối lưu trữ riêng lẻ có thể được lưu trữ tại các máy chủ khác nhau, qua đó ngăn chặn tình trạng tắc nghẽn truy cập.
Trong các ứng dụng tối quan trọng, kho lưu trữ khối được một hệ thống đĩa dự phòng (RAID) bảo vệ nhằm đảm bảo dự phòng dữ liệu. Hệ thống RAID sao lưu các tệp dữ liệu trong kho lưu trữ thứ cấp và phục hồi bản sao nếu ổ đĩa chính bị lỗi. Việc này giúp đảm bảo ứng dụng không hề bị gián đoạn khi lưu trữ và truy xuất các khối lượng công việc giao dịch trên kho lưu trữ khối.
Phân tích và kho dữ liệu
Kho lưu trữ khối được sử dụng với kiến trúc HDFS (Hệ thống tệp phân tán Hadoop) của Hadoop để lưu trữ dữ liệu dưới dạng các đơn vị phân phối độc lập, cho phép các ứng dụng phân tích của Hadoop và Kafka hoạt động hiệu quả.
Máy ảo
Máy ảo (VM) là công nghệ cho phép máy tính chạy một môi trường hoạt động riêng với các tài nguyên điện toán do phần mềm xác định. Ví dụ: bạn có thể chạy hệ điều hành Linux trên một máy tính để bàn Windows bằng VM. Phần mềm giám sát là lớp trừu tượng, chịu trách nhiệm phân bổ bộ nhớ, ổ đĩa và các dịch vụ điện toán theo yêu cầu để chạy môi trường hoạt động thứ cấp.
Kho lưu trữ khối hỗ trợ các phần mềm giám sát VM phổ biến. Người dùng có thể cài đặt hệ điều hành, hệ thống tệp và những tài nguyên điện toán khác trên ổ đĩa lưu trữ khối. Họ thực hiện những tác vụ này bằng cách định dạng ổ đĩa lưu trữ khối và biến nó thành một hệ thống tệp VM. Qua đó, người dùng có thể dễ dàng tăng hoặc giảm kích cỡ ổ đĩa ảo và truyền kho lưu trữ được ảo hóa từ máy chủ này sang máy chủ khác.
Lưu trữ khối hoạt động như thế nào?
Trong hệ thống lưu trữ khối, bạn có thể chia dữ liệu thành các khối hoặc phần độc lập có kích cỡ cố định. Mỗi khối là một phần riêng lẻ của kho lưu trữ dữ liệu. Một phần thông tin hoàn chỉnh, chẳng hạn như tệp dữ liệu được lưu trữ trong nhiều khối không tuần tự.
Hệ thống lưu trữ khối không duy trì siêu dữ liệu bậc cao như loại tệp, quyền sở hữu và dấu thời gian. Các nhà phát triển phải thiết kế một bảng tra cứu dữ liệu trong hệ thống ứng dụng để quản lý lưu trữ dữ liệu chia thành các khối tương ứng. Ứng dụng có thể lưu trữ dữ liệu trong những môi trường hoạt động khác nhau để tăng hiệu quả đọc/ghi.
Ghi dữ liệu
Trong một chuỗi ghi, ứng dụng chia dữ liệu thành một số phần có kích cỡ khối. Dữ liệu được ghi thành nhiều khối và ghi lại mã định danh của khối trong bảng tra cứu dữ liệu. Bảng tra cứu cho phép máy chủ tính toán địa chỉ tương đối của dữ liệu được lưu trong khối.
Đọc dữ liệu
Khi người dùng yêu cầu một tệp cụ thể từ hệ thống lưu trữ khối, máy chủ sử dụng bảng tra cứu dữ liệu để xác định vị trí lưu trữ các phần dữ liệu. Sau đó, ứng dụng sẽ truy xuất dữ liệu từ nhiều khối rồi hợp nhất chúng lại theo trình tự ban đầu.
Hiện có những loại kho lưu trữ nào khác?
Ngoài kho lưu trữ khối, còn có phương án lưu trữ đối tượng và lưu trữ tệp. Mỗi loại lưu trữ có những ưu điểm độc đáo riêng.
Lưu trữ đối tượng
Lưu trữ đối tượng là công nghệ lưu trữ và quản lý dữ liệu ở định dạng không có cấu trúc, gọi là đối tượng. Mỗi đối tượng được gắn thẻ với mã định danh duy nhất và chứa siêu dữ liệu mô tả nội dung cơ sở. Ví dụ: kho lưu trữ đối tượng ảnh chứa siêu dữ liệu liên quan đến nhiếp ảnh gia, độ phân giải, định dạng và thời gian tạo. Các nhà phát triển sử dụng kho lưu trữ đối tượng để lưu trữ dữ liệu không có cấu trúc, chẳng hạn như văn bản, video và hình ảnh.
Kho lưu trữ khối so với kho lưu trữ đối tượng
Cả hai giải pháp lưu trữ đều hữu ích, tùy thuộc vào trường hợp sử dụng. Kho lưu trữ khối cung cấp các giá trị có độ trễ thấp và hiệu năng cao trong nhiều trường hợp sử dụng khác nhau. Các tính năng của kho lưu trữ khối chủ yếu hữu ích đối với kho lưu trữ cơ sở dữ liệu có cấu trúc, ổ đĩa hệ thống tệp VM và dung lượng tải đọc và ghi lớn. Trường hợp sử dụng lý tưởng nhất của kho lưu trữ đối tượng là với lượng lớn dữ liệu không có cấu trúc, đặc biệt khi độ bền, dung lượng lưu trữ không giới hạn, khả năng điều chỉnh quy mô và quản lý siêu dữ liệu phức tạp là những yếu tố liên quan tới hiệu năng tổng thể.
Kho lưu trữ tệp
Kho lưu trữ tệp lưu trữ dữ liệu trong một cấu trúc phân cấp của tệp và thư mục. Trong các môi trường mạng, kho lưu trữ dựa trên tệp thường sử dụng công nghệ thiết bị lưu trữ gắn vào mạng (NAS). NAS cho phép người dùng truy cập dữ liệu trong kho lưu trữ mạng theo cách tương tự như ổ cứng cục bộ. Kho lưu trữ tệp thân thiện với người dùng và cho phép người dùng quản lý quyền kiểm soát chia sẻ tệp.
Kho lưu trữ khối so với kho lưu trữ tệp
Hệ thống lưu trữ tệp lưu trữ dữ liệu trong một môi trường cụ thể, trong khi đó, các hệ thống lưu trữ khối có thể được tích hợp với những hệ điều hành khác nhau. Kho lưu trữ tệp cung cấp giao diện trực quan cho điện toán người dùng cuối. Trong khi đó, bạn có thể thêm khối dữ liệu mới vào hệ thống lưu trữ khối mà không tăng độ trễ hoạt động.
Kho lưu trữ phiên bản
Kho phiên bản cung cấp kho lưu trữ cấp khối tạm thời cho phiên bản của bạn. Kho lưu trữ này nằm trên ổ đĩa được thực gắn vào máy chủ. Kho phiên bản rất phù hợp để lưu trữ tạm thời thông tin thường xuyên thay đổi, chẳng hạn như vùng đệm, bộ nhớ đệm, dữ liệu trung gian và những nội dung tạm thời khác hoặc dành cho dữ liệu được sao chép trên một nhóm phiên bản như vùng máy chủ web được cân bằng tải.
Một kho phiên bản chứa một hoặc nhiều ổ đĩa kho phiên bản hiển thị dưới dạng thiết bị khối. Kích cỡ của kho phiên bản cũng như số lượng thiết bị khả dụng có sự khác nhau tùy theo loại phiên bản
AWS có thể hỗ trợ nhu cầu lưu trữ khối của bạn như thế nào?
Amazon EBS là giải pháp lưu trữ khối dễ sử dụng dành cho các khối lượng công việc đám mây. Các nhà phát triển sử dụng Amazon EBS để cung cấp dịch vụ lưu trữ liên tục cho các khối lượng công việc của Đám mây điện toán linh hoạt của Amazon (Amazon EC2).
- Amazon EBS cung cấp giải pháp lưu trữ có quy mô cực kỳ linh hoạt cho những ứng dụng tối quan trọng và nặng về I/O.
- Amazon EBS Snapshots cung cấp một phương thức bảo mật và dễ dùng để bảo vệ dữ liệu trong kho lưu trữ khối.
- Các nhà phát triển có thể cài đặt nhiều loại cơ sở dữ liệu khác nhau trên Amazon EBS, bao gồm SAP HANA, Oracle, Microsoft SQL Server, MySQL, Cassandra và MongoDB.
Bắt đầu sử dụng lưu trữ khối bằng cách tạo tài khoản AWS miễn phí ngay hôm nay.