Chuyển đến nội dung chính

Di chuyển cơ sở dữ liệu là gì?

Di chuyển cơ sở dữ liệu là một quá trình chuyển cơ sở dữ liệu từ môi trường này sang môi trường khác. Khi các doanh nghiệp tìm cách hiện đại hóa các ứng dụng của họ, họ di chuyển cơ sở dữ liệu liên quan từ các máy chủ tại chỗ lên đám mây. 

Di chuyển cơ sở dữ liệu lên đám mây cho phép các công ty tăng độ tin cậy, khả năng điều chỉnh quy mô và hiệu suất của dịch vụ. Ngoài ra, di chuyển dữ liệu lên đám mây còn giúp giảm chi phí cơ sở hạ tầng để duy trì các trung tâm dữ liệu tại chỗ.

Di chuyển khối lượng dữ liệu lên đám mây là yếu tố quan trọng để đảm bảo tính toàn vẹn, tuân thủ và tính liên tục cho kinh doanh của dữ liệu. Hãy xem xét những yếu tố sau.

Ngân sách

Di chuyển dữ liệu bao gồm các tác vụ như kiểm tra dữ liệu, ánh xạ, thử nghiệm và giám sát sau khi di chuyển. Đôi khi, ứng dụng truy cập cơ sở dữ liệu sẽ có yêu cầu sửa đổi trước khi nó có thể đọc dữ liệu từ cơ sở dữ liệu đã di chuyển. Các doanh nghiệp phải lập ngân sách cho thời gian, chi phí và nguồn lực cần thiết cho các tác vụ đó. 

Thời gian ngừng hoạt động

Khi di chuyển cơ sở dữ liệu, hãy lên kế hoạch cho thời gian ngừng hoạt động khi bạn chuyển đổi giữa mục tiêu nguồn và đích. Mặc dù thời gian ngừng hoạt động không thể bằng không, bạn có thể giảm thiểu sự gián đoạn trong hoạt động kinh doanh bằng cách lập kế hoạch di chuyển và sử dụng các công cụ di chuyển cơ sở dữ liệu thích hợp. Ví dụ: bạn có thể kiểm tra cơ sở dữ liệu đám mây trước khi chuyển đổi để đảm bảo độ tin cậy của ứng dụng và độ chính xác của dữ liệu. 

Hệ thống nguồn và đích 

Truyền đồng nhất di chuyển dữ liệu từ hệ thống nguồn sang hệ thống đích với các công cụ cơ sở dữ liệu tương đương. Ngược lại, việc di chuyển dữ liệu đến một nền tảng mục tiêu khác được gọi là truyền không đồng nhất. Ví dụ: việc di chuyển cơ sở dữ liệu MySQL sang cơ sở dữ liệu MySQL là đồng nhất, trong khi truyền Postgres SQL sang Amazon Aurora là không đồng nhất. Truyền đồng nhất đơn giản hơn vì cơ sở dữ liệu có thể được chuyển đến mục tiêu đích mà không cần thao tác bổ sung. Tuy nhiên, nếu muốn thực hiện di chuyển không đồng nhất, các kiến trúc sư cơ sở dữ liệu sẽ phải dọn dẹp và chuyển đổi dữ liệu trước khi truyền. 

Loại di chuyển 

Quá trình di chuyển cơ sở dữ liệu có thể thuộc các loại sau.

  • Di chuyển một phần chỉ di chuyển một phần của toàn bộ tập dữ liệu từ cơ sở dữ liệu gốc lên đám mây. 
  • Di chuyển cơ sở dữ liệu hoàn chỉnh sẽ truyền tất cả dữ liệu từ nền tảng nguồn sang nền tảng đích.

Sau khi truyền, cơ sở dữ liệu nguồn sẽ bị ngắt kết nối khỏi ứng dụng. Một loại di chuyển khác là di chuyển liên tục hoặc sao chép dữ liệu. Quá trình này sao chép dữ liệu từ nguồn đến cơ sở dữ liệu đích trong vô thời hạn. 

Có những kiểu di chuyển cơ sở dữ liệu nào?

Trước khi di chuyển, hãy xem xét loại di chuyển nào phù hợp nhất với trường hợp sử dụng của bạn.

Di chuyển ngoại tuyến

Di chuyển ngoại tuyến là phương thức phù hợp để chuyển các cơ sở dữ liệu không quan trọng có thể ngừng hoạt động trong một thời gian dài. Khi thực hiện di chuyển ngoại tuyến, bạn phải dừng cho phép các ứng dụng ghi vào cơ sở dữ liệu trong một khoảng thời gian nhất định. Khoảng thời gian này cho phép các kiến trúc sư cơ sở dữ liệu bảo toàn và di chuyển cơ sở dữ liệu sang đám mây và sửa đổi ứng dụng. Thông thường, các doanh nghiệp chọn di chuyển ngoại tuyến trong trường hợp cần hiện đại hóa các hệ thống cũ không được hỗ trợ bởi các công cụ di chuyển lên đám mây. Tương tự như vậy, di chuyển cơ sở dữ liệu ngoại tuyến là phương thức lý tưởng cho các dự án thử nghiệm và phát triển mà ở đó việc cập nhật dữ liệu kịp thời không phải là yếu tố quan trọng.
Hãy lấy ví dụ về việc di chuyển cơ sở dữ liệu Oracle tại chỗ sang Amazon RDS dành cho Oracle. Mặc dù được lưu trữ trên các cơ sở hạ tầng khác nhau, cả hai cơ sở dữ liệu đều chia sẻ các công cụ giống nhau. Do đó, quá trình di chuyển dữ liệu rất đơn giản, như chúng tôi mô tả dưới đây. 

Bước 1 - Thiết lập kết nối mạng

Kết nối cơ sở dữ liệu tại chỗ với đám mây AWS bằng mạng an toàn. Bạn có thể thiết lập mạng riêng ảo hoặc sử dụng AWS Direct Connect để kích hoạt kết nối tại chỗ với đám mây. Với AWS Direct Connect, bạn có thể kết nối trực tiếp cơ sở dữ liệu mà không cần truyền chúng qua internet công cộng. 

Bước 2 - Dừng viết ứng dụng

Để ngăn chặn những thay đổi bất ngờ đối với cơ sở dữ liệu đích, hãy dừng các ứng dụng ghi vào cơ sở dữ liệu nguồn. 

Bước 3 - Chuyển dữ liệu tại chỗ sang đám mây

Tiếp theo, triển khai các công cụ truyền dữ liệu gốc trên máy chủ đám mây. Để giảm chi phí, chúng tôi khuyên bạn nên thiết lập các công cụ trên Amazon EC2. Bằng cách này, bạn chỉ phải trả phí cho các tài nguyên đã sử dụng để chạy các công cụ cơ sở dữ liệu gốc. Sau đó, các công cụ được sử dụng để trích xuất dữ liệu từ cơ sở dữ liệu nguồn và khôi phục chúng vào cơ sở dữ liệu đám mây. 

Bước 4 - Thực hiện chuyển đổi cơ sở dữ liệu

Sau khi chuyển toàn bộ cơ sở dữ liệu sang đám mây, hãy xác thực cơ sở dữ liệu để đảm bảo tính nhất quán của dữ liệu. Sau đó, chuyển hướng tất cả các truy vấn dữ liệu từ ứng dụng sang cơ sở dữ liệu mới.

Di chuyển khối lượng công việc sản xuất

Di chuyển khối lượng công việc sản xuất đòi hỏi một cách tiếp cận khác so với việc chuyển đổi cơ sở dữ liệu không quan trọng. Khối lượng công việc sản xuất và nguồn dữ liệu của chúng không thể được chuyển ngoại tuyến. Người dùng phải có khả năng truy cập các dịch vụ như bình thường, ngay cả khi việc truyền dữ liệu đang diễn ra. Do đó, cần có kế hoạch và phối hợp cật lực để thực hiện việc di chuyển mà không cần tắt ứng dụng.

Các kiến trúc sư sử dụng các tập lệnh tự phát triển hoặc các công cụ sao chép dữ liệu của bên thứ ba để di chuyển cơ sở dữ liệu cho khối lượng công việc sản xuất. Các tập lệnh hoặc công cụ sao chép dữ liệu từ cơ sở dữ liệu tại chỗ vào cơ sở dữ liệu đám mây. Trong khi quá trình sao chép dữ liệu diễn ra, cơ sở dữ liệu tại chỗ vẫn hoạt động. 

Thách thức phát sinh khi các nhà phát triển phần mềm sửa đổi tập lệnh để đáp ứng các yêu cầu dữ liệu mới và liên tục. Ngoài ra, các công cụ cơ sở dữ liệu của bên thứ ba mà họ sử dụng có thể yêu cầu cập nhật để di chuyển cơ sở dữ liệu thành công. 

Sao chép cơ sở dữ liệu trực tuyến

Sao chép cơ sở dữ liệu liên quan đến việc viết các tập lệnh thiết lập lược đồ cơ sở dữ liệu trong các công cụ cơ sở dữ liệu mới và sau đó chuyển dữ liệu từ nguồn sang cơ sở dữ liệu đích. Lược đồ chứa các định nghĩa để lưu trữ và sắp xếp dữ liệu trong cơ sở dữ liệu có thể liên quan. Các kỹ sư có thể sử dụng các công cụ sao chép dữ liệu của bên thứ ba để tạo và duy trì nhiều bản sao dữ liệu trên các máy chủ khác nhau. Cả hai cách tiếp cận đều khó khăn như nhau vì chúng đòi hỏi sự can thiệp thủ công đáng kể, dễ xảy ra lỗi, và có thể kém hiệu quả.
Nếu bạn muốn sao chép cơ sở dữ liệu trực tuyến hiệu quả và an toàn hơn, hãy xem xét AWS Database Migration Service (DMS).  Đây là một dịch vụ đám mây giúp tự động hóa việc di chuyển cơ sở dữ liệu trên các công cụ cơ sở dữ liệu khác nhau. Thay vì lập kịch bản truyền dữ liệu theo cách thủ công, bạn có thể yêu cầu DMS tự động quét lược đồ của cơ sở dữ liệu gốc và tạo lược đồ mới cho cơ sở dữ liệu mục tiêu. Điều này cho phép các nhà phát triển tập trung vào việc đổi mới các ứng dụng thay vì phải quản lý cơ sở dữ liệu tốn nhiều công sức.
Dưới đây, chúng tôi chia sẻ cách sao chép cơ sở dữ liệu tại chỗ của bạn lên đám mây. 

Bước 1 - Kiểm kê dữ liệu hiện có

Phân tích cơ sở dữ liệu hiện được lưu trữ tại chỗ. Để đẩy nhanh quá trình, hãy sử dụng AWS DMS Fleet Advisor. Công cụ này phân tích cơ sở dữ liệu hiện có và nhóm máy chủ phân tích, sau đó xác định các đường dẫn di chuyển tiềm năng. Công cụ cũng biên soạn hiệu suất, lược đồ, mô hình sử dụng và các số liệu khác. 

Bước 2 - Chuyển cơ sở dữ liệu sang đám mây

Sử dụng AWS DMS để di chuyển toàn bộ cơ sở dữ liệu từ trung tâm dữ liệu tại chỗ sang đám mây. Ngoài ra, bạn có thể bật chế độ ghi nhận dữ liệu thay đổi (CDC) của DMS để cho phép sao chép gần thời gian thực. Với CDC, DMS nắm bắt các thay đổi về dữ liệu ở cơ sở dữ liệu gốc và áp dụng các thay đổi đó cho tất cả các cơ sở dữ liệu được sao chép. 

Tái cấu trúc cơ sở dữ liệu

Trong một số trường hợp, chiến lược di chuyển cơ sở dữ liệu bao gồm việc tái cấu trúc hoặc chuyển không đồng nhất. Các doanh nghiệp tái cấu trúc cơ sở dữ liệu khi hiện đại hóa ứng dụng vì một số lý do, bao gồm giảm chi phí cấp phép, truy cập khả năng đám mây và cải thiện chất lượng dữ liệu.  Trong quá trình di chuyển không đồng nhất, thông tin được lưu trữ trong cơ sở dữ liệu nguồn không thể được dịch chuyển mà vẫn giữ nguyên. Dữ liệu phải được làm sạch, chuyển đổi và cấu trúc theo lược đồ mới phù hợp với yêu cầu của cơ sở dữ liệu mục tiêu. 

Dưới đây là các bước giúp bạn tái cấu trúc cơ sở dữ liệu. 

Bước 1 - Kiểm tra cơ sở dữ liệu

Phân tích cơ sở dữ liệu tại chỗ và xác định các lược đồ được sử dụng để lưu trữ dữ liệu. Lập kế hoạch cho phương thức lưu trữ dữ liệu hiện tại trong cơ sở dữ liệu mới. Đôi khi, việc tái cấu trúc cơ sở dữ liệu bao gồm việc hợp nhất nhiều cơ sở dữ liệu thành một, hoặc phân tán dữ liệu từ một cơ sở dữ liệu duy nhất sang nhiều cơ sở dữ liệu khác nhau. 

Bước 2 - Chuyển đổi lược đồ cơ sở dữ liệu

Chuyển đổi lược đồ đã được tổng hợp từ cơ sở dữ liệu nguồn sang các định dạng cần thiết cho cơ sở dữ liệu đích. Bạn có thể sử dụng Chuyển đổi lược đồ AWS DMS để hợp lý hóa quy trình. 

Lưu ý: Các kỹ sư cơ sở dữ liệu có thể cần tạo hoặc sửa đổi các lược đồ mới theo cách thủ công, đặc biệt là đối với các tập dữ liệu rất phức tạp. 

Bước 3 - Bắt đầu di chuyển cơ sở dữ liệu

Di chuyển dữ liệu từ cơ sở dữ liệu tại chỗ sang cơ sở dữ liệu đám mây với AWS DMS. Để đảm bảo cơ sở dữ liệu đám mây nắm bắt tất cả các thay đổi trong quá trình di chuyển, hãy bật chế độ CDC. Sau khi chuyển tất cả dữ liệu, chuyển hướng các dịch vụ ứng dụng đến cơ sở dữ liệu đám mây. 

AWS có thể hỗ trợ nhu cầu di chuyển cơ sở dữ liệu của bạn như thế nào?

Các doanh nghiệp di chuyển cơ sở dữ liệu sang đám mây để giảm chi phí cơ sở hạ tầng, cải thiện độ tin cậy của dịch vụ và tận dụng các khả năng đám mây khác. Di chuyển cơ sở dữ liệu có thể đơn giản như chuyển toàn bộ cơ sở dữ liệu hoặc xây dựng lại toàn bộ lược đồ để đáp ứng các yêu cầu dữ liệu mới. Bất kể sự phức tạp của việc di chuyển như thế nào, việc đảm bảo dữ liệu được chuyển an toàn, chính xác và đúng thời hạn là điều cần thiết. Khám phá Dịch vụ di chuyển cơ sở dữ liệu AWS để biết các công cụ được quản lý cho phép chuyển đổi gần thời gian thực, phân tích cơ sở dữ liệu, truyền dữ liệu tự động và hơn thế nữa.