Amazon Neptune là một cơ sở dữ liệu phân tích đồ thị và phi máy chủ, giúp bạn dễ dàng tạo và quản lý các ứng dụng đồ thị tương tác ở mọi quy mô.
Cơ sở dữ liệu Amazon Neptune là cơ sở dữ liệu đồ thị được quản lý toàn phần mà bạn có thể sử dụng để tìm kiếm và truy vấn trong vài mili giây hàng tỷ mối quan hệ giữa hàng nghìn truy vấn đồng thời. Cơ sở dữ liệu này cung cấp các cấu hình có độ sẵn sàng cao, khả năng điều chỉnh quy mô linh hoạt với hỗ trợ phi máy chủ trong nhiều Khu vực để tăng khả năng phục hồi và tích hợp với các dịch vụ AWS khác như Amazon SageMaker và Dịch vụ OpenSearch của Amazon.
Neptune tự động điều chỉnh quy mô lưu trữ, tăng dung lượng lưu trữ và cân bằng lại các hoạt động I/O để đem lại hiệu năng nhất quán mà không cần cung cấp vượt mức. Kho lưu trữ của Neptune có khả năng chịu lỗi và tự phục hồi, đồng thời các lỗi ổ đĩa được khắc phục dưới nền mà không làm gián đoạn độ sẵn sàng của dữ liệu. Neptune được thiết kế để tự động phát hiện các hư hỏng trên cơ sở dữ liệu và khởi động lại mà không cần khôi phục hư hỏng hay xây dựng lại bộ nhớ đệm cơ sở dữ liệu. Nếu toàn bộ phiên bản bị lỗi, Neptune sẽ tự động chuyển đổi dự phòng sang 1 trong lên tới 15 bản sao chỉ có quyền đọc.
Các truy vấn SQL đối với dữ liệu có mức độ kết nối cao rất phức tạp và khó điều chỉnh để đảm bảo hiệu năng. Thay vào đó, Amazon Neptune cho phép bạn sử dụng các ngôn ngữ truy vấn đồ thị phổ biến như Apache TinkerPop Gremlin và SPARQL của W3C và openCypher để chạy các truy vấn mạnh mẽ dễ ghi và hoạt động tốt trên dữ liệu được kết nối. Điều này làm giảm đáng kể độ phức tạp của mã và cho phép bạn nhanh chóng tạo các ứng dụng xử lý các mối quan hệ. Bạn có thể nhanh chóng khởi chạy phiên bản cơ sở dữ liệu Neptune với một vài bước trong bảng điều khiển Neptune.
Phân tích Amazon Neptune MỚI là một công cụ cơ sở dữ liệu phân tích có khả năng hỗ trợ phân tích đồ thị, thuật toán đồ thị và tìm kiếm véc-tơ dữ liệu đồ thị được lưu trữ trong các vùng lưu trữ của Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) hoặc cơ sở dữ liệu Neptune. Bạn có thể phân tích hàng chục tỷ mối quan hệ trong vài giây. Với công cụ Phân tích trên Neptune, bạn có thể tải dữ liệu từ cơ sở dữ liệu Neptune hiện có hoặc Amazon S3 bằng một vài lệnh gọi API đơn giản và đáp ứng khối lượng công việc phân tích đồ thị đòi hỏi khắt khe nhất. Bạn có thể chọn cơ sở dữ liệu Neptune hiện có làm nguồn dữ liệu. Cơ sở dữ liệu này sẽ tự động được nạp vào công cụ Phân tích trên Neptune. Bạn cũng có thể sắp xếp để công cụ Phân tích Neptune tải dữ liệu đồ thị trực tiếp từ Amazon S3 bằng cách sử dụng các tệp CSV ở các định dạng xuất đồ thị phổ biến.
Amazon Neptune ML là sự tích hợp giữa cơ sở dữ liệu Neptune và SageMaker. Neptune ML đào tạo các mạng nơ-ron đồ thị (GNN), một kỹ thuật máy học (ML) được xây dựng chuyên dụng cho đồ thị, để đưa ra các dự đoán nhanh chóng và chính xác hơn bằng cách sử dụng dữ liệu đồ thị của bạn. Neptune ML hỗ trợ dự đoán theo thời gian thực về các nút, biên và thuộc tính (thực thể) đã được thêm vào đồ thị sau quá trình đào tạo mô hình ML, từ đó cung cấp cho bạn các dự đoán về dữ liệu mới mà không cần đào tạo lại các mô hình ML mỗi lần.
Hiệu năng cao và khả năng điều chỉnh quy mô linh hoạt
Tùy chọn phi máy chủ
Cơ sở dữ liệu Amazon Neptune phi máy chủ là một tùy chọn triển khai theo yêu cầu có khả năng tự động điều chỉnh dung lượng cơ sở dữ liệu dựa trên nhu cầu của ứng dụng. Cơ sở dữ liệu Neptune phi máy chủ có thể điều chỉnh quy mô ngay lập tức các khối lượng công việc cơ sở dữ liệu đồ thị lên đến hàng trăm nghìn truy vấn. Neptune phi máy chủ điều chỉnh dung lượng để cung cấp vừa đủ tài nguyên cơ sở dữ liệu mà ứng dụng cần và bạn chỉ trả tiền cho dung lượng đã tiêu thụ, từ đó tiết kiệm tới 90% chi phí cơ sở dữ liệu so với dung lượng cao điểm.
Thông lượng cao và độ trễ thấp cho các truy vấn đồ thị
Amazon Neptune là cơ sở dữ liệu đồ thị hiệu năng cao, được xây dựng cho mục đích nhất định. Neptune lưu trữ và điều chỉnh dữ liệu đồ thị một cách hiệu quả, đồng thời sử dụng kiến trúc được tối ưu hóa trong bộ nhớ sẽ tăng quy mô theo tài nguyên để cho phép đánh giá truy vấn nhanh trên các đồ thị lớn. Với Cơ sở dữ liệu Neptune, bạn có thể sử dụng Gremlin, openCypher hoặc SPARQL để chạy các truy vấn mạnh mẽ dễ ghi và hoạt động tốt. Với công cụ Phân tích trên Neptune, bạn có thể sử dụng openCypher.
Dễ dàng điều chỉnh quy mô tài nguyên điện toán cơ sở dữ liệu
Chỉ với một vài bước trong Bảng điều khiển quản lý AWS, bạn có thể điều chỉnh tăng hoặc giảm quy mô tài nguyên điện toán và bộ nhớ hiện đang hỗ trợ cụm sản xuất của mình. Với Cơ sở dữ liệu Neptune, bạn có thể điều chỉnh quy mô bằng cách tạo các phiên bản sao mới có kích thước mong muốn hoặc bằng cách xóa các phiên bản. Các thao tác điều chỉnh quy mô điện toán thường hoàn tất trong vòng vài phút.
Kho lưu trữ tự động điều chỉnh quy mô
Cơ sở dữ liệu Neptune sử dụng kiến trúc lưu trữ phân tán và được chia sẻ, sẽ tự động phát triển khi nhu cầu lưu trữ cơ sở dữ liệu tăng lên. Dữ liệu Neptune được lưu trữ trong một khối cụm có độ sẵn sàng cao gồm nhiều vùng sẵn sàng. Khi được tạo, cụm cơ sở dữ liệu (DB) Neptune được phân bổ một phân đoạn 10 GiB duy nhất. Khi khối lượng dữ liệu tăng lên và vượt quá dung lượng lưu trữ hiện được phân bổ, Neptune sẽ tự động mở rộng ổ đĩa cụm bằng cách thêm các phân đoạn mới. Ổ đĩa cụm Neptune có thể tăng kích thước tối đa lên 128 TiB tại các Khu vực AWS được hỗ trợ, ngoại trừ Trung Quốc và GovCloud. Bạn không cần cung cấp dung lượng lưu trữ dư thừa cho cơ sở dữ liệu để phát triển về sau.
Bản sao chỉ có quyền đọc có độ trễ thấp
Với Cơ sở dữ liệu Neptune, bạn có thể tăng thông lượng đọc để hỗ trợ yêu cầu ứng dụng dung lượng cao bằng cách tạo tối đa 15 bản sao cơ sở dữ liệu chỉ có quyền đọc. Bản sao Neptune có cùng bộ lưu trữ cơ bản với phiên bản nguồn, giúp giảm chi phí và loại bỏ nhu cầu thực hiện thao tác ghi tại các nút bản sao. Điều này nâng cao năng lực xử lý để phục vụ yêu cầu đọc và giảm thời gian trễ của bản sao, thường xuống chỉ còn vài mili giây. Neptune cũng cung cấp một điểm cuối cho truy vấn đọc, vì vậy, ứng dụng có thể kết nối mà không phải theo dõi khi thêm và xóa bản sao.
Độ sẵn sàng và bền vững cao
Giám sát và sửa chữa phiên bản
Tình trạng của cơ sở dữ liệu Neptune và phiên bản EC2 cơ bản của cơ sở dữ liệu đó được theo dõi liên tục. Nếu phiên bản hỗ trợ cơ sở dữ liệu của bạn gặp sự cố, cơ sở dữ liệu và các quy trình được liên kết sẽ tự động được khởi động lại. Tính năng khôi phục của Neptune không yêu cầu phát lại nhật ký hoàn tác cơ sở dữ liệu có khả năng tốn thời gian, nên thời gian khởi động lại phiên bản thường chỉ từ 30 giây trở xuống. Tính năng này còn cách ly bộ nhớ đệm cơ sở dữ liệu khỏi quy trình cơ sở dữ liệu, cho phép bộ nhớ đệm vẫn còn kể cả khi khởi động lại cơ sở dữ liệu.
Triển khai nhiều vùng sẵn sàng bằng bản sao chỉ có quyền đọc
Trong trường hợp lỗi phiên bản, Neptune tự động chuyển đổi dự phòng lên 1 trong tối đa 15 bản sao Neptune mà bạn đã tạo trong bất kỳ một trong ba Vùng sẵn sàng. Nếu không có bản sao Neptune nào được cung cấp thì trong trường hợp thất bại, Neptune sẽ cố gắng tự động tạo một phiên bản cơ sở dữ liệu mới cho bạn.
Kho lưu trữ có khả năng chịu lỗi và tự khôi phục
Đối với Cơ sở dữ liệu Neptune, mỗi gói 10 GiB trong khối cơ sở dữ liệu của bạn có tính bền vững cao trên ba Vùng sẵn sàng. Cơ sở dữ liệu Neptune sử dụng kho lưu trữ có khả năng chịu lỗi, xử lý tình huống mất đến tối đa hai bản sao dữ liệu một cách minh bạch mà không ảnh hưởng đến khả năng ghi cơ sở dữ liệu và đến tối đa ba bản sao không ảnh hưởng đến khả năng đọc cơ sở dữ liệu. Kho lưu trữ Cơ sở dữ liệu Neptune còn có khả năng tự khôi phục; khối dữ liệu và ổ đĩa được quét liên tục để phát hiện lỗi và thay thế ngay lập tức.
Khôi phục về thời điểm trước đó và sao lưu tự động, liên tục, gia tăng
Khả năng sao lưu trong Cơ sở dữ liệu Neptune cho phép phục hồi về thời điểm trước đó cho phiên bản của bạn. Việc này cho phép bạn khôi phục cơ sở dữ liệu của bạn về bất kỳ thời điểm nào trong khoảng thời gian lưu giữ của bạn, trong tối đa 5 phút vừa qua. Có thể đặt cấu hình khoảng thời gian lưu giữ sao lưu tự động lên tới 35 ngày. Bản sao lưu tự động được lưu trữ trong Amazon S3, được thiết kế với tính bền vững là 99,999999999%. Sao lưu Neptune là quá trình tự động, gia tăng và liên tục, đồng thời không ảnh hưởng đến hiệu năng của cơ sở dữ liệu.
Bản kết xuất nhanh cơ sở dữ liệu
Bản kết xuất nhanh cơ sở dữ liệu là các bản sao lưu do người dùng khởi tạo từ phiên bản được lưu trữ trên Amazon S3 và sẽ được lưu giữ đến khi bạn chủ động xóa đi. Các bản kết xuất cụm gia tăng tự động được sử dụng để giảm thời gian và dung lượng lưu trữ cần thiết. Bạn có thể tạo một phiên bản mới từ bản kết xuất nhanh cơ sở dữ liệu bất kể khi nào bạn muốn.
Cơ sở dữ liệu toàn cầu
Cơ sở dữ liệu toàn cầu Amazon Neptune được thiết kế cho các ứng dụng phân tán toàn cầu, cho phép một cơ sở dữ liệu Neptune duy nhất trải rộng ra nhiều Khu vực. Cơ sở dữ liệu này sao chép dữ liệu đồ thị mà gần như không ảnh hưởng đến hiệu năng của cơ sở dữ liệu, cho phép đọc cục bộ nhanh chóng với độ trễ thấp trong mỗi Khu vực, đồng thời đem lại khả năng phục hồi sau thảm họa trong trường hợp xảy ra sự cố ngừng hoạt động trên toàn Khu vực.
Bảo mật cao
Cách ly mạng
Cơ sở dữ liệu Neptune chạy trên Đám mây riêng ảo của Amazon (Amazon VPC), cho phép bạn cách ly cơ sở dữ liệu trên mạng ảo riêng và kết nối với cơ sở hạ tầng CNTT tại chỗ của bạn bằng cách sử dụng các IPsec VPN được mã hóa theo tiêu chuẩn ngành. Ngoài ra, khi sử dụng cấu hình Neptune VPC, bạn có thể định cấu hình cài đặt tường lửa và kiểm soát quyền truy cập mạng đến các phiên bản cơ sở dữ liệu của mình.
Quyền ở cấp độ tài nguyên
Amazon Neptune được tích hợp với Quản lý danh tính và truy cập trong AWS (IAM) và cho phép bạn có thể kiểm soát các hành động mà nhóm và người dùng IAM của bạn có thể thực hiện đối với các tài nguyên Neptune cụ thể, bao gồm Phiên bản cơ sở dữ liệu, Bản kết xuất nhanh cơ sở dữ liệu, Nhóm tham số cơ sở dữ liệu, Đăng ký sự kiện cơ sở dữ liệu và Nhóm tùy chọn cơ sở dữ liệu. Ngoài ra, bạn có thể gắn thẻ các tài nguyên Neptune và kiểm soát những hành động mà nhóm và người dùng IAM có thể thực hiện đối với các nhóm tài nguyên có cùng thẻ (và giá trị thẻ). Ví dụ: bạn có thể định cấu hình quy tắc IAM để đảm bảo nhà phát triển có thể chỉnh sửa phiên bản cơ sở dữ liệu "Phát triển" nhưng chỉ quản trị viên cơ sở dữ liệu mới có thể sửa đổi và xóa các phiên bản cơ sở dữ liệu "Sản xuất".
Kiểm soát quyền truy cập mức độ chi tiết
Neptune cung cấp quyền truy cập mức độ chi tiết cho người dùng truy xuất API mặt phẳng dữ liệu Neptune bằng IAM để thực hiện các hành động đối với dữ liệu đồ thị, chẳng hạn như đọc, ghi và xóa dữ liệu khỏi đồ thị, cũng như các hành động đối với dữ liệu không có đồ thị, chẳng hạn như bắt đầu và giám sát các hoạt động của Neptune ML và kiểm tra trạng thái của các hoạt động mặt phẳng dữ liệu đang diễn ra. Ví dụ: tạo một chính sách với quyền truy cập chỉ đọc cho các nhà phân tích dữ liệu không cần thao tác với dữ liệu đồ thị, một chính sách có quyền truy cập đọc và ghi để các nhà phát triển sử dụng đồ thị cho các ứng dụng của họ và một chính sách cho các nhà khoa học dữ liệu cần truy cập các lệnh Neptune ML.
Mã hóa
Neptune hỗ trợ mã hóa trong quá trình chuyển tiếp bằng TLS phiên bản 1.2. Neptune cho phép bạn mã hóa cơ sở dữ liệu bằng các khóa do bạn tạo và kiểm soát thông qua Dịch vụ quản lý khóa của AWS (AWS KMS). Trên một phiên bản cơ sở dữ liệu đang chạy với mã hóa Neptune, dữ liệu đang được lưu trữ trên bộ lưu trữ cơ bản được mã hóa, giống như các bản sao lưu, bản kết xuất nhanh và bản sao tự động trong cùng cụm.
Kiểm tra nâng cao
Amazon Neptune cho phép bạn ghi nhật ký các sự kiện cơ sở dữ liệu với tác động tối thiểu đến hiệu năng của cơ sở dữ liệu. Sau đó, các bản ghi có thể được phân tích cho mục đích quản lý cơ sở dữ liệu, bảo mật, quản trị, tuân thủ quy định và các mục đích khác. Bạn cũng có thể giám sát hoạt động bằng cách gửi nhật ký kiểm tra đến Amazon CloudWatch.
Được quản lý hoàn toàn
Dễ sử dụng hơn
Bạn có thể bắt đầu sử dụng Neptune bằng cách khởi chạy phiên bản cơ sở dữ liệu Neptune mới hoặc đồ thị Phân tích trên Neptune thông qua Bảng điều khiển quản lý AWS. Phiên bản cơ sở dữ liệu Neptune được định cấu hình sẵn với các thông số và cài đặt phù hợp cho lớp phiên bản cơ sở dữ liệu bạn đã chọn. Bạn chỉ cần khởi chạy một phiên bản cơ sở dữ liệu và kết nối ứng dụng của bạn trong vòng vài phút mà không cần cấu hình thêm. Nhóm thông số cơ sở dữ liệu cho phép kiểm soát mức độ chi tiết và tinh chỉnh cơ sở dữ liệu của bạn.
Dễ vận hành hơn
Neptune giúp vận hành cơ sở dữ liệu đồ thị hiệu năng cao dễ dàng hơn. Với Neptune, bạn không cần tạo các chỉ mục tùy chỉnh trên dữ liệu đồ thị của mình. Neptune có giới hạn thời gian chờ và sử dụng bộ nhớ để giảm tác động của các truy vấn tiêu thụ quá nhiều tài nguyên.
Giám sát và số liệu
Neptune cung cấp số liệu Amazon CloudWatch cho các phiên bản cơ sở dữ liệu của bạn. Bạn có thể dùng Bảng điều khiển quản lý AWS để xem hơn 20 số liệu hoạt động chính cho các phiên bản cơ sở dữ liệu của mình, bao gồm điện toán, bộ nhớ, dung lượng lưu trữ, thông lượng truy vấn và kết nối đang hoạt động.
Tự động vá lỗi phần mềm
Neptune sẽ đảm bảo cơ sở dữ liệu của bạn được cập nhật với các bản vá mới nhất. Bạn có thể kiểm soát phiên bản của bạn có được vá hay không và khi nào thông qua Quản lý phiên bản công cụ cơ sở dữ liệu.
Thông báo sự kiện cơ sở dữ liệu
Neptune có thể thông báo cho bạn qua email hoặc SMS về các sự kiện cơ sở dữ liệu quan trọng như chuyển đổi dự phòng tự động. Bạn có thể sử dụng Bảng điều khiển quản lý AWS để đăng ký các sự kiện cơ sở dữ liệu khác nhau được liên kết với cơ sở dữ liệu Neptune của mình.
Nhân bản nhanh cơ sở dữ liệu
Neptune hỗ trợ các hoạt động nhân bản nhanh chóng, hiệu quả, trong đó có thể nhân bản toàn bộ cụm cơ sở dữ liệu nhiều terabyte trong vài phút. Nhân bản là hoạt động rất hữu ích cho một số mục đích, trong đó có phát triển ứng dụng, kiểm thử, cập nhật cơ sở dữ liệu và chạy các truy vấn phân tích. Độ sẵn sàng tức thì của dữ liệu có thể tăng tốc đáng kể quá trình phát triển phần mềm và nâng cấp dự án, đồng thời giúp các phân tích chính xác hơn.
Bạn có thể nhân bản cơ sở dữ liệu Neptune chỉ với một vài bước trong Bảng điều khiển quản lý AWS mà không ảnh hưởng đến môi trường sản xuất. Bản sao được phân phối và sao chép trên ba Vùng sẵn sàng.
ML và AI tạo sinh
ML
Amazon Neptune ML được hỗ trợ bởi Amazon SageMaker sử dụng GNN, một kỹ thuật ML được xây dựng chuyên dụng cho đồ thị, để đưa ra dự đoán nhanh và chính xác hơn bằng cách sử dụng dữ liệu đồ thị. Với Neptune ML, bạn có thể cải thiện độ chính xác của hầu hết các dự đoán cho đồ thị thêm hơn 50% khi so sánh với việc đưa ra dự đoán bằng cách sử dụng các phương pháp không dùng đồ thị.
Việc đưa ra dự đoán chính xác trên các biểu đồ với hàng tỷ mối quan hệ có thể khó khăn và tốn thời gian. Các phương pháp tiếp cận máy học hiện có như XGBoost không thể hoạt động hiệu quả trên đồ thị vì được thiết kế cho dữ liệu dạng bảng. Do đó, việc sử dụng các phương pháp này trên đồ thị có thể mất thời gian, yêu cầu các kỹ năng chuyên sâu từ các nhà phát triển và đưa ra các dự đoán không tối ưu.
AI tạo sinh
Tìm kiếm véc-tơ giúp bạn dễ dàng xây dựng trải nghiệm tìm kiếm tăng cường ML và các ứng dụng trí tuệ nhân tạo tạo sinh (AI tạo sinh). Bạn nên sử dụng tìm kiếm véc-tơ nếu muốn xây dựng các ứng dụng AI tạo sinh tổng hợp dữ liệu trong miền ứng dụng và tìm kiếm độ tương đồng trên các phép nhúng véc-tơ. Tìm kiếm véc-tơ trên dữ liệu đồ thị giúp bạn giảm tổng chi phí sở hữu và đơn giản hóa chi phí quản lý vì bạn không cần quản lý các kho chứa dữ liệu riêng biệt, xây dựng quy trình hoặc lo lắng về việc đảm bảo đồng bộ hóa các kho chứa dữ liệu.
Khách hàng xây dựng các ứng dụng AI tạo sinh có thể sử dụng tìm kiếm véc-tơ để tăng cường các mô hình ngôn ngữ lớn (LLM) của họ bằng cách tích hợp các truy vấn đồ thị cho ngữ cảnh theo miền cụ thể với kết quả từ tìm kiếm độ tương đồng lân cận gần nhất có độ trễ thấp trên các phép nhúng được nhập từ các LLM được lưu trữ trong Amazon Bedrock, GNN trong GraphStorm hoặc các nguồn khác. Neptune được tích hợp với LangChain, một khung Python mã nguồn mở giúp phát triển các ứng dụng AI tạo sinh dễ dàng hơn thông qua LLM.
Năng suất của nhà phát triển
Apache TinkerPop Gremlin cho đồ thị thuộc tính được hỗ trợ
Đồ thị thuộc tính được sử dụng phổ biến vì là lựa chọn quen thuộc với các nhà phát triển đã quen với các mô hình quan hệ. Ngôn ngữ duyệt Gremlin là một cách duyệt nhanh Đồ thị thuộc tính. Amazon Neptune hỗ trợ mô hình Đồ thị thuộc tính sử dụng ngôn ngữ duyệt Apache TinkerPop Gremlin mã nguồn mở và cung cấp một máy chủ Gremlin Websockets hỗ trợ TinkerPop phiên bản 3.3. Với Neptune, bạn có thể nhanh chóng xây dựng các giao diện Gremlin nhanh trên đồ thị thuộc tính. Các ứng dụng Gremlin hiện tại có thể dễ dàng sử dụng Neptune khi thay đổi cấu hình dịch vụ Gremlin để chỉ đến một phiên bản Neptune.
RDF 1.1 và SPARQL 1.1 của W3C đều được hỗ trợ
Khung mô tả tài nguyên (RDF) được sử dụng phổ biến vì đem lại tính linh hoạt cho việc lập mô hình các miền thông tin phức tạp. Có một số tập dữ liệu miễn phí hoặc công khai hiện có sẵn trong RDF, trong đó có Wikidata và PubChem, một cơ sở dữ liệu về các phân tử hóa học. Amazon Neptune hỗ trợ các tiêu chuẩn Web ngữ nghĩa RDF 1.1 và SPARQL 1.1 của W3C (Truy vấn và cập nhật) và cung cấp điểm cuối HTTP REST triển khai Giao thức SPARQL 1.1. Với Neptune, bạn có thể dễ dàng sử dụng điểm cuối SPARQL cho cả ứng dụng đồ thị mới và hiện có.
OpenCypher phiên bản 9 cho đồ thị thuộc tính được hỗ trợ
Neptune hỗ trợ xây dựng các ứng dụng đồ thị bằng openCypher, hiện là một trong những ngôn ngữ truy vấn phổ biến nhất đối với các nhà phát triển sử dụng cơ sở dữ liệu đồ thị. Các nhà phát triển, nhà phân tích kinh doanh và nhà khoa học dữ liệu thích cú pháp lấy cảm hứng từ SQL của openCypher vì cú pháp này cung cấp cấu trúc quen thuộc để soạn các truy vấn cho các ứng dụng đồ thị. Đối với Cơ sở dữ liệu Neptune, có thể sử dụng kết hợp các ngôn ngữ truy vấn openCypher và Gremlin trên cùng một dữ liệu đồ thị thuộc tính. Hỗ trợ cho openCypher tương thích với giao thức Bolt để tiếp tục chạy các ứng dụng sử dụng giao thức Bolt kết nối với Neptune.
Nạp khối lượng lớn dữ liệu đồ thị thuộc tính
Neptune hỗ trợ nạp nhanh, song song khối lượng lớn dữ liệu đồ thị thuộc tính được lưu trữ trong S3. Bạn có thể sử dụng giao diện REST để chỉ định vị trí S3 cho dữ liệu. Giao diện này sử dụng định dạng phân cách CSV để nạp dữ liệu vào các nút và biên. Xem tài liệu về nạp khối lượng lớn dữ liệu đồ thị thuộc tính của Neptune để biết thêm chi tiết.
Nạp khối lượng lớn dữ liệu RDF
Cơ sở dữ liệu Neptune hỗ trợ nạp nhanh, song song khối lượng lớn dữ liệu RDF được lưu trữ trong S3. Bạn có thể sử dụng giao diện REST để chỉ định vị trí S3 cho dữ liệu. Các chuỗi hóa N-Triples (NT), N-Quads (NQ), RDF/XML và Turtle RDF 1.1 đều được hỗ trợ. Xem tài liệu về nạp khối lượng lớn dữ liệu RDF của Neptune để biết thêm chi tiết.
Thuật toán đồ thị cho công cụ Phân tích trên Neptune
Công cụ Phân tích trên Neptune hỗ trợ các thuật toán để tìm đường dẫn, phát hiện cộng đồng (phân cụm), xác định dữ liệu quan trọng (tính trung tâm) và định lượng độ tương đồng. Các thuật toán tìm đường dẫn xác định hiệu quả tuyến đường ngắn nhất hoặc tối ưu giữa hai nút. Các thuật toán tìm đường dẫn cho phép bạn mô hình hóa các tình huống trong thế giới thực, chẳng hạn như mạng lưới đường sá hoặc mạng xã hội, dưới dạng các nút và biên được kết nối với nhau. Tìm đường dẫn ngắn nhất hoặc tối ưu giữa nhiều điểm khác nhau là việc rất quan trọng trong các ứng dụng như lập kế hoạch tuyến đường cho hệ thống GPS, tối ưu hóa kho vận và thậm chí trong việc giải quyết các vấn đề phức tạp trong những lĩnh vực như sinh học hoặc kỹ thuật.
Các thuật toán phát hiện cộng đồng tính toán các nhóm hoặc cụm nút có ý nghĩa trong mạng, cho thấy các mẫu và cấu trúc ẩn có thể cung cấp thông tin chi tiết về tổ chức và động lực của các hệ thống phức tạp. Điều này có giá trị trong các lĩnh vực như phân tích mạng xã hội, sinh học (để xác định các mô-đun chức năng trong mạng tương tác protein-protein) và thậm chí trong việc hiểu luồng thông tin và sự lan truyền ảnh hưởng trong nhiều lĩnh vực khác nhau.
Các thuật toán tính trung tâm giúp xác định các nút có ảnh hưởng nhất hoặc quan trọng nhất trong mạng, cung cấp thông tin chi tiết về những tác nhân chính hoặc các điểm tương tác quan trọng. Điều này có giá trị trong các lĩnh vực như phân tích mạng xã hội khi giúp xác định chính xác các cá nhân có ảnh hưởng hoặc trong các mạng lưới giao thông khi hỗ trợ xác định các trung tâm quan trọng để định tuyến và phân bổ nguồn lực một cách hiệu quả.
Các thuật toán về độ tương đồng đồ thị cho phép bạn so sánh và phân tích những điểm tương đồng hoặc khác biệt về cấu trúc giữa các cấu trúc đồ thị khác nhau, giúp chúng ta hiểu sâu sắc về các mối quan hệ, mẫu và điểm chung trên các tập dữ liệu đa dạng. Điều này vô cùng có giá trị trong nhiều lĩnh vực khác nhau như sinh học (để so sánh cấu trúc phân tử), mạng xã hội (để xác định các cộng đồng tương tự) và hệ thống khuyến nghị (để đề xuất các mục tương tự dựa trên tùy chọn của người dùng).
Chương trình tuân thủ
Chương trình tuân thủ có độ bao phủ rộng
Neptune nằm trong phạm vi áp dụng của hơn 20 tiêu chuẩn tuân thủ quốc tế, từ FedRAMP (Trung bình và cao) đến SOC (1, 2, 3), đồng thời đáp ứng đủ điều kiện của HIPAA. Bạn có thể xem danh sách đầy đủ các tiêu chuẩn mà Neptune tuân thủ trong Dịch vụ AWS trong phạm vi theo Chương trình tuân thủ.
Mức chi phí hợp lý
Chỉ trả tiền cho những gì bạn sử dụng
Không cần cam kết trả trước với Neptune; bạn chỉ trả phí theo giờ cho mỗi phiên bản bạn khởi chạy hoặc tài nguyên cơ sở dữ liệu bạn tiêu thụ cho dịch vụ phi máy chủ. Khi sử dụng xong một phiên bản cơ sở dữ liệu Neptune, bạn có thể xóa phiên bản đó. Bạn không cần phải chuẩn bị quá nhiều dung lượng lưu trữ để dự phòng an toàn và bạn chỉ trả tiền cho dung lượng lưu trữ mà bạn sử dụng trên thực tế. Để tìm hiểu chi tiết hơn, hãy truy cập trang Định giá Neptune.
Bắt đầu xây dựng với Amazon Neptune trên Bảng điều khiển quản lý AWS.