Sao chép Amazon Simple Storage Service (S3) là một tính năng linh hoạt, được quản lý đầy đủ, chi phí thấp, có khả năng sao chép các đối tượng giữa các vùng lưu trữ. Tính năng Sao chép S3 mang đến khả năng linh hoạt và chức năng tốt nhất trong hoạt động lưu trữ đám mây, cung cấp cho bạn quyền kiểm soát cần thiết để đáp ứng chủ quyền về dữ liệu và các nhu cầu kinh doanh khác.
Với tính năng Sao chép Amazon S3, bạn có thể định cấu hình Amazon S3 để tự động sao chép các đối tượng S3 trên các Khu vực AWS khác nhau bằng cách sử dụng Sao chép liên khu vực S3 (CRR) hoặc giữa các vùng lưu trữ trong cùng Khu vực AWS bằng cách sử dụng Sao chép cùng khu vực S3 (SRR). Sao chép S3 đem lại sự linh hoạt trong việc sao chép sang nhiều vùng lưu trữ đích trong cùng hoặc khác Khu vực AWS. Sao chép S3 hỗ trợ sao chép hai chiều giữa hai hoặc nhiều vùng lưu trữ trong cùng hoặc khác Khu vực AWS. Mặc dù sao chép trực tiếp như CRR và SRR sẽ tự động sao chép các đối tượng mới được tải lên khi chúng được ghi vào vùng lưu trữ của bạn, S3 Batch Replication cho phép bạn sao chép các đối tượng hiện có. Bạn có thể sử dụng S3 Batch Replication để lấp đầy một vùng lưu trữ mới được tạo bằng các đối tượng hiện có, thử lại các đối tượng mà trước đây không sao chép được, di chuyển dữ liệu giữa các tài khoản hoặc thêm vùng lưu trữ mới vào kho dữ liệu của bạn. Các khách hàng muốn biết thời gian sao chép có thể dự đoán do Thỏa thuận mức dịch vụ (SLA) hỗ trợ có thể sử dụng tính năng Kiểm soát thời gian sao chép (RTC) để sao chép đối tượng trong chưa đến 15 phút.
Sao chép trên Amazon S3 cũng cung cấp chỉ số và thông báo chi tiết để giám sát trạng thái sao chép đối tượng giữa các vùng lưu trữ. Bạn có thể giám sát tiến độ sao chép bằng cách theo dõi số byte đang chờ, hoạt động đang chờ, độ trễ sao chép và sao chép hoạt động không thành công bằng bảng điều khiển S3 hoặc Amazon CloudWatch. Bạn cũng có thể thiết lập Thông báo sự kiện S3 để nhận thông báo lỗi sao chép và nhanh chóng chẩn đoán, cũng như khắc phục các sự cố cấu hình. Các chỉ số và thông báo Sao chép S3 sẽ giúp bạn giám sát chặt chẽ tiến độ sao chép. Để tìm hiểu thêm, hãy truy cập mục Giám sát tiến độ bằng các chỉ số sao chép và thông báo sự kiện Amazon S3.
Khi nào nên sử dụng Sao chép trên S3
Dự phòng dữ liệu – Nếu bạn cần duy trì nhiều bản sao dữ liệu của mình trong cùng Khu vực AWS hoặc các Khu vực AWS khác nhau, với các loại mã hóa khác nhau hoặc trên các tài khoản khác nhau. Sao chép trên S3 sẽ hỗ trợ nhu cầu phân phối nội dung toàn cầu, nhu cầu lưu trữ tuân thủ và chia sẻ dữ liệu giữa các tài khoản.
Sao chép các đối tượng trong khi giữ lại siêu dữ liệu — Nếu cần đảm bảo các bản sao chép của mình giống hệt với dữ liệu nguồn, bạn có thể sử dụng Sao chép S3 để tạo các bản sao của các đối tượng giữ lại tất cả siêu dữ liệu, như thời gian tạo đối tượng ban đầu, danh sách kiểm soát truy cập (ACL) đối tượng và ID phiên bản.
Sao chép các đối tượng vào các lớp lưu trữ hiệu quả về chi phí hơn — Bạn có thể sử dụng Sao chép S3 để đặt các đối tượng vào S3 Glacier, S3 Glacier Deep Archive hoặc một lớp lưu trữ khác trong vùng lưu trữ đích. Bạn cũng có thể sao chép dữ liệu của mình vào cùng một lớp lưu trữ, sau đó sử dụng các chính sách S3 Lifecyle để di chuyển các đối tượng của bạn sang một bộ lưu trữ hiệu quả về mặt chi phí hơn.
Duy trì các bản sao đối tượng trong một tài khoản khác — Bất kể ai sở hữu đối tượng nguồn, bạn có thể yêu cầu Amazon S3 thay đổi quyền sở hữu bản sao sang tài khoản AWS đang sở hữu vùng lưu trữ đích để hạn chế quyền truy cập vào bản sao đối tượng.
Sao chép các đối tượng của bạn trong vòng 15 phút — Bạn có thể sử dụng Kiểm soát thời gian sao chép Amazon S3 (S3 RTC) để sao chép dữ liệu của mình trong khung thời gian dự đoán. S3 RTC sẽ sao chép 99,99% số đối tượng mới được lưu trữ trong Amazon S3 trong vòng 15 phút từ khi tải lên và được hỗ trợ bởi Thỏa thuận mức dịch vụ (SLA).
Cách thức hoạt động của Sao chép S3
Tổng quan về tính năng bảo vệ dữ liệu của Amazon S3 - Lập phiên bản, khóa đối tượng và sao chép
Sao chép liên khu vực (CRR) của Amazon S3
Với Sao chép liên khu vực S3 (CRR), bạn có thể sao chép các đối tượng (cùng với siêu dữ liệu và thẻ đối tượng tương ứng của các đối tượng) vào Khu vực AWS khác để giảm độ trễ, đảm bảo tính tuân thủ, bảo mật, khôi phục sau thảm họa và phục vụ các trường hợp sử dụng khác. Tính năng S3 CRR có thể được định cấu hình từ vùng lưu trữ S3 nguồn duy nhất để sao chép đối tượng vào một hoặc nhiều vùng lưu trữ đích trong Khu vực AWS khác.
Amazon S3 CRR tự động sao chép dữ liệu giữa các vùng lưu trữ trên các Khu vực AWS khác nhau. Với CRR, bạn có thể thiết lập sao chép ở mức vùng lưu trữ, mức tiếp đầu ngữ chung hoặc mức đối tượng bằng cách sử dụng thẻ đối tượng S3. Bạn có thể sử dụng CRR để cung cấp quyền truy cập dữ liệu có độ trễ thấp ở các vùng địa lý khác nhau. CRR cũng có thể giúp ích nếu bạn phải tuân thủ yêu cầu lưu trữ các bản sao dữ liệu ở cách xa nhau hàng trăm dặm. Bạn có thể sử dụng CRR để thay đổi quyền sở hữu tài khoản cho các đối tượng được sao chép để ngăn vô tình xóa dữ liệu. Để tìm hiểu thêm về CRR, vui lòng truy cập tài liệu Sao chép S3.
Trường hợp sử dụng
Tuân thủ — Amazon S3 lưu trữ dữ liệu của bạn trên nhiều Vùng sẵn sàng ở xa về mặt địa lý theo mặc định, nhưng các yêu cầu tuân thủ có thể chỉ ra rằng bạn lưu trữ dữ liệu ở khoảng cách xa hơn. CRR cho phép bạn sao chép dữ liệu giữa các Khu vực AWS ở xa để đáp ứng các yêu cầu này.
Hiệu năng độ trễ — Nếu khách hàng hoặc người dùng cuối của bạn phân tán ở một hoặc nhiều vị trí địa lý, bạn có thể giảm thiểu độ trễ truy cập dữ liệu bằng cách duy trì nhiều bản sao đối tượng trong các Khu vực AWS gần hơn về mặt địa lý với khách hàng của bạn.
Hiệu quả khu vực — Nếu bạn có các cụm điện toán trong hai Khu vực AWS trở lên phân tích cùng một bộ đối tượng, bạn có thể chọn duy trì các bản sao đối tượng trong tất cả các Khu vực AWS đó.
Sao chép cùng khu vực (SRR) của Amazon S3
Amazon S3 SRR là một tính năng S3 tự động sao chép dữ liệu giữa các vùng lưu trữ trong cùng Khu vực AWS. Với SRR, bạn có thể thiết lập sao chép ở mức vùng lưu trữ, mức tiếp đầu ngữ chung hoặc mức đối tượng bằng cách sử dụng thẻ đối tượng S3. Bạn có thể sử dụng SRR để tạo một hoặc nhiều bản sao cho dữ liệu của bạn trong cùng một Khu vực AWS. SRR giúp bạn đáp ứng các yêu cầu về chủ quyền dữ liệu và tuân thủ bằng cách giữ một bản sao dữ liệu của bạn trong một tài khoản AWS riêng biệt ở cùng một khu vực với bản gốc. Bạn có thể sử dụng SRR để thay đổi quyền sở hữu tài khoản cho các đối tượng được sao chép để ngăn vô tình xóa dữ liệu. Bạn cũng có thể sử dụng SRR để dễ dàng tổng hợp nhật ký từ các vùng lưu trữ S3 khác nhau để tiến hành xử lý trong khu vực hoặc để cấu hình sao chép trực tiếp giữa môi trường thử nghiệm và môi trường phát triển.
Trường hợp sử dụng
Tổng hợp nhật ký vào một vùng lưu trữ duy nhất — Nếu lưu trữ nhật ký trong nhiều vùng lưu trữ hoặc trên nhiều tài khoản, bạn có thể dễ dàng sao chép nhật ký vào một vùng lưu trữ duy nhất trong khu vực. Điều này cho phép xử lý nhật ký đơn giản hơn ở một vị trí.
Sao chép giữa các tài khoản nhà phát triển và kiểm thử — Nếu bạn hoặc khách hàng của bạn có tài khoản nhà phát triển và kiểm thử sử dụng cùng một dữ liệu, bạn có thể sao chép các đối tượng giữa nhiều tài khoản đó trong khi duy trì siêu dữ liệu đối tượng bằng cách thực hiện quy tắc SRR.
Tuân thủ luật chủ quyền dữ liệu — Thông thường, khách hàng được yêu cầu lưu trữ dữ liệu trong các tài khoản AWS riêng biệt trong khi không cho phép đưa dữ liệu ra khỏi một khu vực nhất định. Sao chép cùng khu vực có thể giúp bạn sao lưu dữ liệu quan trọng khi các quy định tuân thủ không cho phép dữ liệu rời khỏi quốc gia của bạn.
Sao chép Amazon S3 Batch
Mặc dù sao chép trực tiếp như CRR và SRR sẽ tự động sao chép các đối tượng mới được tải lên khi chúng được ghi vào vùng lưu trữ của bạn, S3 Batch Replication cho phép bạn sao chép các đối tượng hiện có. Bạn có thể sử dụng S3 Batch Replication để lấp đầy một vùng lưu trữ mới được tạo bằng các đối tượng hiện có, thử lại các đối tượng mà trước đây không sao chép được, di chuyển dữ liệu giữa các tài khoản hoặc thêm vùng lưu trữ mới vào kho dữ liệu của bạn. S3 Batch Replication hoạt động trên bất kỳ lượng dữ liệu nào, mang đến cho bạn một cách được quản lý hoàn toàn để đáp ứng nhu cầu tuân thủ và chủ quyền dữ liệu, khôi phục sau thảm họa và tối ưu hóa hiệu suất. Bạn có thể bắt đầu với Sao chép S3 Batch qua một vài nhấp chuột trong bảng điều khiển S3 hoặc một yêu cầu API.
S3 Batch Replication bổ sung cho tính năng Sao chép trong cùng một khu vực (SRR) và Sao chép trong khu vực khác (CRR). S3 Batch Replication sao chép các đối tượng hiện có, trong có SRR và CRR giám sát nội dung tải lên của đối tượng mới và sao chép các đối tượng đó giữa các vùng lưu trữ.
Trường hợp sử dụng
Lấp đầy các vùng lưu trữ mới tạo — Nếu bạn có sáng kiến mới về lưu trữ trong nhiều khu vực cần bạn phải thiết lập các vùng lưu trữ mới và lấp đầy các vùng lưu trữ đó bằng các đối tượng hiện có từ vùng lưu trữ khác, bạn có thể dùng Batch Replication để sao chép các đối tượng này.
Thử sao chép lại — Nếu bạn cần thử sao chép lại vì nhiều lý do - bao gồm cả khi các đối tượng không thể sao chép vào lúc đầu, khi các đối tượng trước đây đã được sao chép thành công đến một điểm đích nhưng bây giờ cần được sao chép sang một điểm đích khác hoặc khi sao chép các đối tượng sao chép từ một nguồn khác - bạn có thể sử dụng Batch Replication để thử sao chép lại.
Di chuyển — Nếu bạn cần di chuyển các đối tượng hiện có trên các vùng lưu trữ, cho dù chúng ở trong một Khu vực khác hoặc một tài khoản khác, bạn có thể sử dụng Sao chép hàng loạt để di chuyển nhằm bảo toàn siêu dữ liệu và ID phiên bản.
Kiểm soát thời gian sao chép trên Amazon S3
Tính năng Kiểm soát thời gian sao chép trên Amazon S3 giúp bạn đáp ứng các yêu cầu tuân thủ "hoặc yêu cầu kinh doanh" để sao chép dữ liệu và cung cấp khả năng hiển thị cho hoạt động sao chép trên Amazon S3. Tính năng Kiểm soát thời gian sao chép này sao chép hầu hết các đối tượng "mà bạn tải lên" Amazon S3 sau vài giây và 99,99% số đối tượng đó trong vòng 15 phút. Theo mặc định, tính năng Kiểm soát thời gian sao chép của S3 bao gồm chỉ số Sao chép trên S3 và Thông báo sự kiện S3, nhờ đó bạn có thể giám sát tổng số hoạt động API S3 đang chờ sao chép, tổng kích thước của các đối tượng đang chờ sao chép và thời gian sao chép tối đa.
Tính năng Kiểm soát thời gian sao chép của S3 được hỗ trợ bởi Thỏa thuận mức dịch vụ (SLA) về khả năng sao chép 99,9% đối tượng trong vòng 15 phút trong bất kỳ tháng thanh toán nào.
Để tìm hiểu thêm về tính năng Kiểm soát thời gian sao chép S3, hãy truy cập trang tài liệu Sao chép S3 hoặc Câu hỏi thường gặp về Sao chép S3.
Cách thức hoạt động của tính năng Kiểm soát thời gian sao chép S3
Bắt đầu với Sao chép S3
Sao chép Amazon S3 (CRR, SRR) và Kiểm soát thời gian sao chép S3 có thể được định cấu hình ở cấp độ vùng lưu trữ S3, mức tiếp đầu ngữ chung hoặc mức đối tượng sử dụng thẻ đối tượng S3. Ngoài ra, Kiểm soát thời gian sao chép S3 có thể được bật cho một hoặc nhiều cặp khu vực.
Để bắt đầu với Sao chép S3, truy cập hướng dẫn Sao chép S3, truy cập hướng dẫn Sao chép Lô S3, và xem FAQ về Sao chép S3 và tài liệu Sao chép S3. Để tìm hiểu về cách định giá Sao chép S3, hãy tham khảo trang định giá S3.