跳至主要內容

Amazon Neptune

高效能與可擴展性

全部開啟

只需在 AWS 管理主控台中的幾個步驟,您就可以擴展或降低生產叢集供電的運算和記憶體資源。使用 Neptune Database,您可以透過建立所需大小的新複本執行個體或移除執行個體來進行擴展。運算擴展操作通常可在幾分鐘內完成。

Neptune 資料庫使用分散式和共用儲存架構,該架構會隨著您的資料庫儲存需求的增長而自動擴展。Neptune 資料儲存在具有多可用區域高可用性的叢集磁碟區中。建立 Neptune 資料庫叢集時,會為其配置一個 10GiB 的區段。隨著資料量的增加並超過目前配置的儲存空間,Amazon Neptune 會新增新的區段來自動擴展叢集磁碟區。在除中國和 GovCloud 之外的受支援 AWS 區域中,Amazon Neptune 叢集磁碟區的大小上限可增長至 128 TiB。您不需要為資料庫佈建過多的儲存容量來處理未來的增長。

藉助 Neptune 資料庫,您可利用建立多達 15 個資料庫僅供讀取複本的方式,增加讀取輸送量,以支援大量的應用程式請求。Amazon Neptune 複本與來源執行個體共享同一個基礎儲存,不僅能降低成本,也能消除在複本節點執行寫入的需求。這會釋放更多的處理能力來處理讀取請求並降低複本的延遲時間,通常可降低到幾毫秒。Neptune 還為讀取查詢提供單一端點,因此應用程式無須記錄每個新增和刪除的複本就可以連接。

Neptune 是專門打造的高效能圖形資料庫引擎。Neptune 能有效的存放和導覽圖形資料,並使用擴展的記憶體內最佳化結構,以便在大型圖形上進行快速查詢評估。透過 Neptune 資料庫,您可以使用 Gremlin、openCypher 或 SPARQL 執行功能強大、編寫容易和高效實用的查詢。藉助 Neptune Analytics,您可以使用 openCypher。

高可用性和耐用性

全部開啟

Amazon Neptune 全球資料庫專為全球分散式應用程式設計,允許單一海王星資料庫跨越多個區域。它可以複寫圖形資料且極少影響資料庫,支援每個區域的低延遲快速本機讀取,並在發生區域範圍內故障時提供災難復原。

當執行個體故障時,Neptune 會自動容錯移轉到您在任三個可用區域中建立的其中一個複本 (最多 15 個 Neptune 複本)。如果未佈建 Neptune 複本,當發生故障時,Neptune 將自動嘗試為您建立新的資料庫執行個體。

Neptune 資料庫及相關 Amazon EC2 執行個體的運作狀態會持續受到監控。如果驅動資料庫的執行個體故障,則資料庫和相關的程序將自動重新啟動。Neptune 恢復不需要重新執行冗長的資料庫重做日誌,因此您的執行個體重新啟動時間通常為 30 秒或更短。它還會將資料庫緩衝區快取與資料庫處理程序分隔開來,因此資料庫重新啟動時不會遺失快取。

對於 Neptune 資料庫,資料庫磁碟區的每個 10 GiB 區塊都會在三個可用區域中保持耐久性。Neptune 資料庫使用具有容錯能力的儲存,可完全透明化的處理最多兩個資料副本的損失,而不會影響資料庫寫入可用性;以及處理最多三個資料副本的損失,而不會影響資料庫讀取可用性。Neptune 資料庫儲存也可自我修復;系統會持續掃描資料區塊與磁碟是否有錯誤,並自動替換。

Neptune 資料庫的備份功能可用於對執行個體進行時間點復原。這讓您能夠將資料庫恢復到保留期內任何一秒鐘的狀態,最多可恢復到前 5 分鐘的狀態。自動備份保留期最長可設定為 35 天。自動化備份儲存在亞馬遜 S3 中,其設計具備 99.999999999% 的耐用性。Amazon Neptune 備份是自動、遞增且連續的,對資料庫效能沒有影響。

資料庫快照是使用者對存放在 Amazon S3 中的執行個體啟動的備份,會保留到您明確將它們刪除為止。它們使用自動化的遞增快照減少所需時間和儲存。您可以在需要時隨時從資料庫快照建立新執行個體。

高度安全

全部開啟

Neptune 資料庫在亞馬遜虛擬私有雲 (Amazon VPC) 中執行,可讓您在自己的虛擬網路中隔離資料庫,並使用業界標準的加密的 IPsec VPN 連線到內部部署 IT 基礎架構。此外,透過使用 Neptune 的 VPC 組態時,您可以設定各種防火牆設定值,並控制對資料庫執行個體的網路存取。

Neptune 與 AWS 身分與存取管理 (IAM) 整合,可讓您控制 IAM 使用者和群組可對特定 Neptune 資源執行的動作,包括資料庫執行個體、資料庫快照、資料庫參數群組、資料庫事件訂閱和資料庫選項群組。此外,您可以為 Neptune 資源加上標籤,並控制您的 IAM 使用者和群組可以對一組具有相同標籤 (和標籤值) 的資源採取的動作。例如,您可以設定 IAM 規則,以確保開發人員能夠修改「開發」資料庫執行個體,但只有資料庫管理員能修改和刪除「生產」資料庫執行個體。

Neptune 為使用 IAM 擷取 Neptune 資料平面 API 的使用者提供精細存取,以執行圖形資料動作,如讀取、寫入和刪除圖形資料,以及執行非圖形資料動作,如啟動和監控 Neptune ML 活動並檢查進行中資料平面活動的狀態。例如,為不需要操作圖形資料的資料分析師建立「唯讀」存取權政策,為將圖形用於其應用程式的開發人員建立「讀取和寫入」存取權政策,以及為需要存取 Amazon Neptune ML 命令的資料科學家建立政策。

Neptune 支援使用 TLS 1.2 版本的傳輸加密。Neptune 可讓您使用透過 AWS 金鑰管理服務 (AWS KMS) 建立和控制的金鑰來加密資料庫。在以 Neptune 加密執行的資料庫執行個體上,於基礎儲存體中存放的靜態資料,以及在同一個叢集中的自動備份、快照和複本都會加密。

Neptune 允許您記錄資料庫事件,並將對資料庫的影響降至最低。之後可分析日誌,用於資料庫管理、安全性、控管、法規合規性和其他用途。您也可以透過將稽核記錄傳送至 Amazon CloudWatch 來監控活動。

Neptune 已涵蓋在從 FedRAMP (中等和高) 到 SOC (1、2 和 3) 的 20 多種國際合規標準中,並且還符合 HIPAA 要求。Neptune 符合規範的完整標準清單可在「依合規計劃範圍內的 AWS 服務」清單中找到。

經濟高效

全部開啟

Neptune 沒有預先消費承諾;只需依據啟動的每個執行個體,或者為無伺服器取用的資料庫資源支付小時費用。當 Amazon Neptune 資料庫執行個體使用完畢後,可以將其刪除。您無須過量佈建儲存空間作為安全界線,而且只需按實際消耗的儲存量付費。若要查看更多詳細資訊,請造訪海王星定價頁面。

全受管

全部開啟

您可以使用 AWS 管理主控台啟動新的 Neptune 資料庫執行個體或 Neptune Analytics 圖形來開始使用 Neptune。Neptune 資料庫執行個體為您所選擇的資料庫執行個體類別預先設定了適當的參數和設定。您可在幾分鐘內啟動資料庫執行個體並連接到應用程式,無須其他組態。資料庫參數群組提供資料庫的精細控制和微調功能。

Neptune 為您的資料庫執行個體提供 CloudWatch 指標。您可以使用主控台查看有關資料庫執行個體的 20 多個關鍵操作指標,包括運算資源、記憶體、儲存、查詢輸送量以及作用中連線。

Neptune 將使用最新的修補程式,讓您的資料庫保持在最新狀態。您可以透過資料庫引擎版本管理,控制是否修補執行個體,以及何時進行修補。

Neptune 可透過電子郵件或 SMS 通知您重要的資料庫事件,像是自動容錯移轉。您可以使用主控台訂閱與 Neptune 資料庫相關的不同資料庫事件。

Neptune 支援快速、高效的複製操作,可以在幾分鐘內複製整個數 TB 的資料庫叢集。複製功能在許多方面都非常實用,包括應用程式開發、測試、資料庫更新和執行分析查詢。資料的即時可用性可大幅加速軟體開發和升級專案,並使分析更加準確。

只需在主控台執行幾步操作,即可複製 Neptune 資料庫,而不會影響生產環境。該克隆分佈在三個可用區域並進行複寫。

生成式 AI 與 ML

全部開啟

Neptune Analytics 支援各種演算法,用於尋找路徑、偵測社群 (叢集)、識別重要資料 (中心位置) 以及量化相似性。路徑尋找演算法有效地確定兩個節點之間的最短或最佳路由。路徑尋找演算法可讓您將真實情況 (例如道路網路或社交網路) 作為互連的節點和邊緣建模。在 GPS 系統的路線規劃、物流最佳化,甚至在解決生物學或工程等領域中的複雜問題時,於應用程式中找到各個點之間的最短或最最佳路徑至關重要。

社群偵測演算法會計算網路中有意義的群組或節點叢集,從而揭示隱藏的模式和結構,這些模式和結構可以提供對複雜系統的組織和動態的洞察。這在社交網路分析、生物學 (用於識別蛋白質-蛋白互動網路中的功能模組),甚至在了解資訊流和影響在各個領域中的傳播方面非常有價值。

中心位置演算法有助於識別網路中最具影響力或重要的節點,從而提供關鍵參與者或關鍵互動點的深入洞察。這在社交網路分析等領域中非常有價值,它有助於確定有影響力的個人;或者在運輸網路中,它有助於識別重要的樞紐以實現有效率的路由和資源分配。

圖形相似性演算法可讓您比較和分析不同圖形結構之間的結構相似性或不相似之處,從而實現對不同資料集之間的關係、模式和共同點的洞察。這在各個領域中非常有價值,例如生物學 (用於比較分子結構),社交網路 (用於識別類似社群) 和推薦系統 (根據使用者偏好建議類似項目)。

Neptune ML 由 SageMaker 提供支援,它使用 GNNs,這是一種專為圖形打造的 ML 技術,使用圖形資料進行快速且更準確的預測。相較於使用非圖形方法進行預測,使用 Neptune ML,您可以將大多數圖形預測的準確性提升 50% 以上。

對具有數十億關係的圖形進行準確預測可能既困難又耗時。現有的 ML 方法 (如 XGBoost) 無法在圖形上有效運作,因為這些方法專為表格資料設計。因此,在圖形上使用這些方法可能比較耗時,需要開發人員具備專業技能,並會產生不理想的預測。

開發人員生產力

全部開啟

屬性圖很熱門,因為習慣關聯模型的開發人員早就駕輕就熟。Gremlin 周遊語言提供一種快速周遊屬性圖的方法。Neptune 使用開放原始碼 Apache TinkerPop Gremlin 周遊語言支援屬性圖模型,並提供可支援 TinkerPop 版本 3.3 的 Gremlin Websockets 伺服器。使用 Neptune,您可以迅速建立屬性圖的快速 Gremlin 周遊。現有的 Gremlin 應用程式將 Gremlin 服務組態變更為指向 Neptune 執行個體,即可輕鬆使用 Neptune。

資源描述框架 (RDF) 很受歡迎,因為它提供了對複雜資訊領域建模的彈性。RDF 中有許多現有的免費或公共數據集可用,包括維基數據和 PubChem(化學分子數據庫)。海王星支援 W3C 的語義網路標準 RDF 1.1 和 SPARQL 1.1 (查詢和更新),並提供執行 SPARQL 通訊協定 1.1 的 HTTP REST 端點。使用 Neptune,您可以輕鬆將 SPARQL 端點用於現有和新的圖形應用程式。

Neptune 支援使用 openCypher 來建置圖形應用程式,這是目前開發人員處理圖形資料庫最常用的查詢語言之一。開發人員、業務分析師和資料科學家喜歡 openCypher 受 SQL 啟發的語法,因為它提供了熟悉的結構來編寫圖形應用程式的查詢。對於 Neptune 資料庫,openCypher 和 Gremlin 查詢語言可以在相同的屬性圖形資料上結合使用。對 openCypher 的支援與 Bolt 協定相容,以繼續執行使用 Bolt 協定連線至 Neptune 的應用程式。

Neptune 支援快速平行大批載入 Amazon S3 中存放的屬性圖資料。您可以使用 REST 界面指定資料的 Amazon S3 位置。它使用 CSV 分隔格式,將資料載入節點和邊緣。如需詳細資訊,請參閱 Neptune 屬性圖表大量載入文件。

Neptune 資料庫支援快速平行大批載入 Amazon S3 中存放的 RDF 資料。您可以使用 REST 界面指定資料的 Amazon S3 位置。支援 N-Triples (NT)、N-Quads (NQ)、RDF/XML 和 Turtle RDF 1.1 序列化。如需詳細資訊,請參閱 Neptune RDF 大量裝載文件。