Chuyển đến nội dung chính

Amazon Neptune

Hiệu năng cao và khả năng điều chỉnh quy mô linh hoạt

Mở tất cả

Với một vài bước trong Bảng điều khiển quản lý AWS, bạn có thể mở rộng quy mô tài nguyên tính toán và bộ nhớ cung cấp năng lượng cho cụm sản xuất của mình lên hoặc giảm. Với Cơ sở dữ liệu Neptune, bạn có thể điều chỉnh quy mô bằng cách tạo các phiên bản sao mới có kích thước mong muốn hoặc bằng cách xóa các phiên bản. Các thao tác điều chỉnh quy mô điện toán thường hoàn tất trong vòng vài phút.

Cơ sở dữ liệu Neptune sử dụng kiến trúc lưu trữ phân tán và được chia sẻ, sẽ tự động phát triển khi nhu cầu lưu trữ cơ sở dữ liệu tăng lên. Dữ liệu Neptune được lưu trữ trong một khối cụm có độ sẵn sàng cao gồm nhiều vùng sẵn sàng. Khi được tạo, cụm cơ sở dữ liệu (DB) Neptune được phân bổ một phân đoạn 10 GiB duy nhất. Khi khối lượng dữ liệu tăng lên và vượt quá dung lượng lưu trữ hiện được phân bổ, Neptune sẽ tự động mở rộng ổ đĩa cụm bằng cách thêm các phân đoạn mới. Ổ đĩa cụm Neptune có thể tăng kích thước tối đa lên 128 TiB tại các Khu vực AWS được hỗ trợ, ngoại trừ Trung Quốc và GovCloud. Bạn không cần cung cấp dung lượng lưu trữ dư thừa cho cơ sở dữ liệu để phát triển về sau.

Với Cơ sở dữ liệu Neptune, bạn có thể tăng thông lượng đọc để hỗ trợ yêu cầu ứng dụng dung lượng cao bằng cách tạo tối đa 15 bản sao cơ sở dữ liệu chỉ có quyền đọc. Bản sao Neptune có cùng bộ lưu trữ cơ bản với phiên bản nguồn, giúp giảm chi phí và loại bỏ nhu cầu thực hiện thao tác ghi tại các nút bản sao. Điều này nâng cao năng lực xử lý để phục vụ yêu cầu đọc và giảm thời gian trễ của bản sao, thường xuống chỉ còn vài mili giây. Neptune cũng cung cấp một điểm cuối cho truy vấn đọc, vì vậy, ứng dụng có thể kết nối mà không phải theo dõi khi thêm và xóa bản sao.

Amazon Neptune là cơ sở dữ liệu đồ thị hiệu năng cao, được xây dựng cho mục đích nhất định. Neptune lưu trữ và điều chỉnh dữ liệu đồ thị một cách hiệu quả, đồng thời sử dụng kiến trúc được tối ưu hóa trong bộ nhớ sẽ tăng quy mô theo tài nguyên để cho phép đánh giá truy vấn nhanh trên các đồ thị lớn. Với Cơ sở dữ liệu Neptune, bạn có thể sử dụng Gremlin, openCypher hoặc SPARQL để chạy các truy vấn mạnh mẽ dễ ghi và hoạt động tốt. Với công cụ Phân tích trên Neptune, bạn có thể sử dụng openCypher.

Độ sẵn sàng và bền vững cao

Mở tất cả

sở dữ liệu toàn cầu Amazon Neptune được thiết kế cho các ứng dụng phân tán toàn cầu, cho phép một cơ sở dữ liệu Neptune duy nhất trải dài nhiều Khu vực. Cơ sở dữ liệu này sao chép dữ liệu đồ thị mà gần như không ảnh hưởng đến hiệu năng của cơ sở dữ liệu, cho phép đọc cục bộ nhanh chóng với độ trễ thấp trong mỗi Khu vực, đồng thời đem lại khả năng phục hồi sau thảm họa trong trường hợp xảy ra sự cố ngừng hoạt động trên toàn Khu vực.

Trong trường hợp lỗi phiên bản, Neptune tự động chuyển đổi dự phòng lên 15 trong tối đa 15 bản sao Neptune mà bạn đã tạo trong bất kỳ một trong ba Vùng sẵn sàng. Nếu không có bản sao Neptune nào được cung cấp thì trong trường hợp thất bại, Neptune sẽ cố gắng tự động tạo một phiên bản cơ sở dữ liệu mới cho bạn.

Tình trạng của cơ sở dữ liệu Neptune và phiên bản Amazon EC2 cơ bản của cơ sở dữ liệu đó được theo dõi liên tục. Nếu phiên bản hỗ trợ cơ sở dữ liệu của bạn gặp sự cố, cơ sở dữ liệu và các quy trình được liên kết sẽ tự động được khởi động lại. Tính năng khôi phục của Neptune không yêu cầu phát lại nhật ký hoàn tác cơ sở dữ liệu có khả năng tốn thời gian, nên thời gian khởi động lại phiên bản thường chỉ từ 30 giây trở xuống. Tính năng này còn cách ly bộ nhớ đệm cơ sở dữ liệu khỏi quy trình cơ sở dữ liệu, cho phép bộ nhớ đệm vẫn còn kể cả khi khởi động lại cơ sở dữ liệu.

Đối với Cơ sở dữ liệu Neptune, mỗi gói 10 GiB trong khối cơ sở dữ liệu của bạn có tính bền vững cao trên ba Vùng sẵn sàng. Cơ sở dữ liệu Neptune sử dụng kho lưu trữ có khả năng chịu lỗi, xử lý tình huống mất đến tối đa hai bản sao dữ liệu một cách minh bạch mà không ảnh hưởng đến khả năng ghi cơ sở dữ liệu và đến tối đa ba bản sao không ảnh hưởng đến khả năng đọc cơ sở dữ liệu. Kho lưu trữ Cơ sở dữ liệu Neptune còn có khả năng tự khôi phục; khối dữ liệu và ổ đĩa được quét liên tục để phát hiện lỗi và thay thế ngay lập tức.

Khả năng sao lưu trong Cơ sở dữ liệu Neptune cho phép phục hồi về thời điểm trước đó cho phiên bản của bạn. Việc này cho phép bạn khôi phục cơ sở dữ liệu của bạn về bất kỳ thời điểm nào trong khoảng thời gian lưu giữ của bạn, trong tối đa 5 phút vừa qua. Có thể đặt cấu hình khoảng thời gian lưu giữ sao lưu tự động lên tới 35 ngày. Các bản sao lưu tự động được lưu trữ trong Amazon S3, được thiết kế cho độ bền 99,999999999%. Sao lưu Neptune là quá trình tự động, gia tăng và liên tục, đồng thời không ảnh hưởng đến hiệu năng của cơ sở dữ liệu.

Bản kết xuất nhanh cơ sở dữ liệu là các bản sao lưu do người dùng khởi tạo từ phiên bản được lưu trữ trên Amazon S3 và sẽ được lưu giữ đến khi bạn chủ động xóa đi. Các bản kết xuất cụm gia tăng tự động được sử dụng để giảm thời gian và dung lượng lưu trữ cần thiết. Bạn có thể tạo một phiên bản mới từ ảnh chụp nhanh cơ sở dữ liệu bất kể khi nào bạn muốn.

Bảo mật cao

Mở tất cả

Cơ sở dữ liệu Neptune chạy trong Amazon Virtual Private Cloud (Amazon VPC), cho phép bạn cách ly cơ sở dữ liệu của mình trong mạng ảo của riêng bạn và kết nối với cơ sở hạ tầng CNTT tại chỗ bằng cách sử dụng các VPN IPsec được mã hóa theo tiêu chuẩn công nghiệp. Ngoài ra, khi sử dụng cấu hình Neptune VPC, bạn có thể định cấu hình cài đặt tường lửa và kiểm soát quyền truy cập mạng đến các phiên bản cơ sở dữ liệu của mình.

Neptune được tích hợp với AWS Identity and Access Management (IAM) và cung cấp cho bạn khả năng kiểm soát các hành động mà người dùng và nhóm IAM của bạn có thể thực hiện đối với các tài nguyên Neptune cụ thể bao gồm phiên bản cơ sở dữ liệu, ảnh chụp nhanh cơ sở dữ liệu, nhóm tham số cơ sở dữ liệu, đăng ký sự kiện cơ sở dữ liệu và nhóm tùy chọn cơ sở dữ liệu. Ngoài ra, bạn có thể gắn thẻ các tài nguyên Neptune và kiểm soát những hành động mà nhóm và người dùng IAM có thể thực hiện đối với các nhóm tài nguyên có cùng thẻ (và giá trị thẻ). Ví dụ: bạn có thể định cấu hình quy tắc IAM để đảm bảo nhà phát triển có thể chỉnh sửa phiên bản cơ sở dữ liệu "Phát triển" nhưng chỉ quản trị viên cơ sở dữ liệu mới có thể sửa đổi và xóa các phiên bản cơ sở dữ liệu "Sản xuất".

Neptune cung cấp quyền truy cập mức độ chi tiết cho người dùng truy xuất API mặt phẳng dữ liệu Neptune bằng IAM để thực hiện các hành động đối với dữ liệu đồ thị, chẳng hạn như đọc, ghi và xóa dữ liệu khỏi đồ thị, cũng như các hành động đối với dữ liệu không có đồ thị, chẳng hạn như bắt đầu và giám sát các hoạt động của Neptune ML và kiểm tra trạng thái của các hoạt động mặt phẳng dữ liệu đang diễn ra. Ví dụ: tạo một chính sách với quyền truy cập chỉ đọc cho các nhà phân tích dữ liệu không cần thao tác với dữ liệu đồ thị, một chính sách có quyền truy cập đọc và ghi để các nhà phát triển sử dụng đồ thị cho các ứng dụng của họ và một chính sách cho các nhà khoa học dữ liệu cần truy cập các lệnh Neptune ML.

Neptune hỗ trợ mã hóa trong quá trình chuyển tiếp bằng TLS phiên bản 1.2. Neptune cho phép bạn mã hóa cơ sở dữ liệu bằng cách sử dụng các khóa bạn tạo và kiểm soát thông qua Dịch vụ quản lý khóa AWS (AWS KMS). Trên một phiên bản cơ sở dữ liệu đang chạy với mã hóa Neptune, dữ liệu đang được lưu trữ trên bộ lưu trữ cơ bản được mã hóa, giống như các bản sao lưu, bản kết xuất nhanh và bản sao tự động trong cùng cụm.

Neptune cho phép bạn ghi nhật ký các sự kiện cơ sở dữ liệu với tác động tối thiểu đến hiệu năng của cơ sở dữ liệu. Sau đó, các bản ghi có thể được phân tích cho mục đích quản lý cơ sở dữ liệu, bảo mật, quản trị, tuân thủ quy định và các mục đích khác. Bạn cũng có thể theo dõi hoạt động bằng cách gửi nhật ký kiểm tra đến Amazon CloudWatch.

Neptune nằm trong phạm vi áp dụng của hơn 20 tiêu chuẩn tuân thủ quốc tế, từ FedRAMP (Trung bình và cao) đến SOC (1, 2, 3), đồng thời đáp ứng đủ điều kiện của HIPAA. Danh sách đầy đủ các tiêu chuẩn mà Neptune tuân thủ có thể được tìm thấy trong danh sách Dịch vụ AWS trong Phạm vi theo Chương trình Tuân thủ.

Tiết kiệm chi phí

Mở tất cả

Không cần cam kết trả trước với Neptune; bạn chỉ trả phí theo giờ cho mỗi phiên bản bạn khởi chạy hoặc tài nguyên cơ sở dữ liệu bạn tiêu thụ cho dịch vụ phi máy chủ. Khi sử dụng xong một phiên bản cơ sở dữ liệu Neptune, bạn có thể xóa phiên bản đó. Bạn không cần phải chuẩn bị quá nhiều dung lượng lưu trữ để dự phòng an toàn và bạn chỉ trả tiền cho dung lượng lưu trữ mà bạn sử dụng trên thực tế. Để xem thêm chi tiết, hãy truy cập trang Định giá Neptune.

Được quản lý toàn phần

Mở tất cả

Bạn có thể bắt đầu với Neptune bằng cách khởi chạy phiên bản cơ sở dữ liệu Neptune mới hoặc biểu đồ Neptune Analytics bằng Bảng điều khiển quản lý AWS. Phiên bản cơ sở dữ liệu Neptune được định cấu hình sẵn với các thông số và cài đặt phù hợp cho lớp phiên bản cơ sở dữ liệu bạn đã chọn. Bạn chỉ cần khởi chạy một phiên bản cơ sở dữ liệu và kết nối ứng dụng của bạn trong vòng vài phút mà không cần cấu hình thêm. Nhóm thông số cơ sở dữ liệu cho phép kiểm soát mức độ chi tiết và tinh chỉnh cơ sở dữ liệu của bạn.

Neptune cung cấp số liệu CloudWatch cho các phiên bản cơ sở dữ liệu của bạn. Bạn có thể dùng bảng điều khiển để xem hơn 20 số liệu hoạt động chính cho các phiên bản cơ sở dữ liệu của mình, bao gồm tài nguyên điện toán, bộ nhớ, dung lượng lưu trữ, thông lượng truy vấn và kết nối đang hoạt động.

Neptune sẽ đảm bảo cơ sở dữ liệu của bạn được cập nhật với các bản vá mới nhất. Bạn có thể kiểm soát phiên bản của bạn có được vá hay không và khi nào thông qua quản lý phiên bản công cụ cơ sở dữ liệu.

Neptune có thể thông báo cho bạn qua email hoặc SMS về các sự kiện cơ sở dữ liệu quan trọng như chuyển đổi dự phòng tự động. Bạn có thể sử dụng bảng điều khiển để đăng ký các sự kiện cơ sở dữ liệu khác nhau được liên kết với cơ sở dữ liệu Neptune của mình.

Neptune hỗ trợ các hoạt động nhân bản nhanh chóng và hiệu quả, trong đó toàn bộ cụm cơ sở dữ liệu nhiều terabyte có thể được nhân bản trong vài phút. Nhân bản là hoạt động rất hữu ích cho một số mục đích, trong đó có phát triển ứng dụng, kiểm thử, cập nhật cơ sở dữ liệu và chạy các truy vấn phân tích. Độ sẵn sàng tức thì của dữ liệu có thể tăng tốc đáng kể quá trình phát triển phần mềm và nâng cấp dự án, đồng thời giúp các phân tích chính xác hơn.

Bạn có thể nhân bản cơ sở dữ liệu Neptune chỉ với một vài bước trong bảng điều khiển mà không ảnh hưởng đến môi trường sản xuất. Bản sao được phân phối và sao chép trên ba Vùng sẵn sàng.

AI tạo sinh và ML

Mở tất cả

Công cụ Phân tích trên Neptune hỗ trợ các thuật toán để tìm đường dẫn, phát hiện cộng đồng (phân cụm), xác định dữ liệu quan trọng (tính trung tâm) và định lượng độ tương đồng. Các thuật toán tìm đường dẫn xác định hiệu quả tuyến đường ngắn nhất hoặc tối ưu giữa hai nút. Các thuật toán tìm đường dẫn cho phép bạn mô hình hóa các tình huống trong thế giới thực, chẳng hạn như mạng lưới đường sá hoặc mạng xã hội, dưới dạng các nút và biên được kết nối với nhau. Tìm đường dẫn ngắn nhất hoặc tối ưu giữa nhiều điểm khác nhau là việc rất quan trọng trong các ứng dụng như lập kế hoạch tuyến đường cho hệ thống GPS, tối ưu hóa kho vận và thậm chí trong việc giải quyết các vấn đề phức tạp trong những lĩnh vực như sinh học hoặc kỹ thuật.

Các thuật toán phát hiện cộng đồng tính toán các nhóm hoặc cụm nút có ý nghĩa trong mạng, cho thấy các mẫu và cấu trúc ẩn có thể cung cấp thông tin chi tiết về tổ chức và động lực của các hệ thống phức tạp. Điều này có giá trị trong các lĩnh vực như phân tích mạng xã hội, sinh học (để xác định các mô-đun chức năng trong mạng tương tác protein-protein) và thậm chí trong việc hiểu luồng thông tin và sự lan truyền ảnh hưởng trong nhiều lĩnh vực khác nhau.

Các thuật toán tính trung tâm giúp xác định các nút có ảnh hưởng nhất hoặc quan trọng nhất trong mạng, cung cấp thông tin chi tiết về những tác nhân chính hoặc các điểm tương tác quan trọng. Điều này có giá trị trong các lĩnh vực như phân tích mạng xã hội khi giúp xác định chính xác các cá nhân có ảnh hưởng hoặc trong các mạng lưới giao thông khi hỗ trợ xác định các trung tâm quan trọng để định tuyến và phân bổ nguồn lực một cách hiệu quả.

Các thuật toán về độ tương đồng đồ thị cho phép bạn so sánh và phân tích những điểm tương đồng hoặc khác biệt về cấu trúc giữa các cấu trúc đồ thị khác nhau, giúp chúng ta hiểu sâu sắc về các mối quan hệ, mẫu và điểm chung trên các tập dữ liệu đa dạng. Điều này vô cùng có giá trị trong nhiều lĩnh vực khác nhau như sinh học (để so sánh cấu trúc phân tử), mạng xã hội (để xác định các cộng đồng tương tự) và hệ thống khuyến nghị (để đề xuất các mục tương tự dựa trên tùy chọn của người dùng).

Neptune ML được cung cấp bởi SageMaker, sử dụng GNNs, một kỹ thuật ML được xây dựng theo mục đích cho đồ thị, để đưa ra dự đoán nhanh chóng và chính xác hơn bằng cách sử dụng dữ liệu đồ thị. Với Neptune ML, bạn có thể cải thiện độ chính xác của hầu hết các dự đoán cho đồ thị thêm hơn 50% khi so sánh với việc đưa ra dự đoán bằng cách sử dụng các phương pháp không dùng đồ thị.

Việc đưa ra dự đoán chính xác trên các biểu đồ với hàng tỷ mối quan hệ có thể khó khăn và tốn thời gian. Các phương pháp tiếp cận máy học hiện có như XGBoost không thể hoạt động hiệu quả trên đồ thị vì được thiết kế cho dữ liệu dạng bảng. Do đó, việc sử dụng các phương pháp này trên đồ thị có thể mất thời gian, yêu cầu các kỹ năng chuyên sâu từ các nhà phát triển và đưa ra các dự đoán không tối ưu.

Năng suất của nhà phát triển

Mở tất cả

Đồ thị thuộc tính được sử dụng phổ biến vì là lựa chọn quen thuộc với các nhà phát triển đã quen với các mô hình quan hệ. Ngôn ngữ duyệt Gremlin là một cách duyệt nhanh Đồ thị thuộc tính. Neptune hỗ trợ mô hình Đồ thị thuộc tính sử dụng ngôn ngữ duyệt Apache TinkerPop Gremlin mã nguồn mở và cung cấp một máy chủ Gremlin Websockets hỗ trợ TinkerPop phiên bản 3.3. Với Neptune, bạn có thể nhanh chóng xây dựng các giao diện Gremlin nhanh trên đồ thị thuộc tính. Các ứng dụng Gremlin hiện tại có thể dễ dàng sử dụng Neptune khi thay đổi cấu hình dịch vụ Gremlin để chỉ đến một phiên bản Neptune.

Khung mô tả tài nguyên (RDF) phổ biến vì nó cung cấp tính linh hoạt cho việc mô hình hóa các miền thông tin phức tạp. Có một số bộ dữ liệu miễn phí hoặc công khai hiện có sẵn trong RDF bao gồm Wikidata PubChem, một cơ sở dữ liệu về các phân tử hóa học. Neptune hỗ trợ các tiêu chuẩn Web ngữ nghĩa của W3C của RDF 1.1 và SPARQL 1.1 (Truy vấn và Cập nhật), và cung cấp một điểm cuối REST HTTP triển khai Giao thức SPARQL 1.1. Với Neptune, bạn có thể dễ dàng sử dụng điểm cuối SPARQL cho cả ứng dụng đồ thị mới và hiện có.

Neptune hỗ trợ xây dựng các ứng dụng đồ thị bằng openCypher, hiện là một trong những ngôn ngữ truy vấn phổ biến nhất đối với các nhà phát triển sử dụng cơ sở dữ liệu đồ thị. Các nhà phát triển, nhà phân tích kinh doanh và nhà khoa học dữ liệu thích cú pháp lấy cảm hứng từ SQL của openCypher vì cú pháp này cung cấp cấu trúc quen thuộc để soạn các truy vấn cho các ứng dụng đồ thị. Đối với Cơ sở dữ liệu Neptune, có thể sử dụng kết hợp các ngôn ngữ truy vấn openCypher và Gremlin trên cùng một dữ liệu đồ thị thuộc tính. Hỗ trợ cho openCypher tương thích với giao thức Bolt để tiếp tục chạy các ứng dụng sử dụng giao thức Bolt kết nối với Neptune.

Neptune hỗ trợ nạp nhanh, song song khối lượng lớn dữ liệu đồ thị thuộc tính được lưu trữ trong Amazon S3. Bạn có thể sử dụng giao diện REST để chỉ định vị trí Amazon S3 cho dữ liệu. Giao diện này sử dụng định dạng phân cách CSV để nạp dữ liệu vào các nút và biên. Xem tài liệu tải hàng loạt biểu đồ thuộc tính Neptune để biết thêm chi tiết.

Cơ sở dữ liệu Neptune hỗ trợ nạp nhanh, song song khối lượng lớn dữ liệu RDF được lưu trữ trong Amazon S3. Bạn có thể sử dụng giao diện REST để chỉ định vị trí Amazon S3 cho dữ liệu. Các chuỗi hóa N-Triples (NT), N-Quads (NQ), RDF/XML và Turtle RDF 1.1 đều được hỗ trợ. Xem tài liệu tải hàng loạt Neptune RDF để biết thêm chi tiết.