메인 콘텐츠로 건너뛰기

Amazon Neptune

뛰어난 성능 및 확장성

모두 열기

AWS Management Console에서 몇 단계만 거치면 프로덕션 클러스터를 구동하는 컴퓨팅 및 메모리 리소스를 확장하거나 축소할 수 있습니다. Neptune Database를 사용하면 원하는 크기의 새 복제본 인스턴스를 만들거나 인스턴스를 제거하여 확장할 수 있습니다. 컴퓨팅 조정 작업은 일반적으로 몇 분이면 완료됩니다.

Neptune Database는 데이터베이스 스토리지 요구 사항이 증가함에 따라 자동으로 확장되는 분산 및 공유 스토리지 아키텍처를 사용합니다. Neptune 데이터는 다중 가용 영역(다중 AZ) 고가용성을 갖춘 클러스터 볼륨에 저장됩니다. Neptune DB 클러스터가 생성되면 10GiB 용량의 단일 세그먼트가 할당됩니다. 데이터 볼륨이 증가하여 현재 할당된 스토리지를 초과하면 Neptune이 새 세그먼트를 추가하여 클러스터 볼륨을 자동으로 확장합니다. Neptune 클러스터 볼륨은 중국 및 GovCloud를 제외한 지원되는 AWS 리전에서 최대 128테비바이트(TiB) 크기로 확장될 수 있습니다. 볼륨 증가를 처리하기 위해 데이터베이스에 추가 스토리지를 프로비저닝할 필요가 없습니다.

Neptune Database을 통해 최대 15개의 데이터베이스 읽기 전용 복제본을 생성하여 대량의 애플리케이션 요청을 지원할 수 있도록 읽기 처리량을 늘릴 수 있습니다. Neptune 복제본은 소스 인스턴스와 동일한 기본 스토리지를 공유하여 비용을 낮추며 복제본 노드에서 쓰기를 수행할 필요가 없습니다. 이에 따라 남는 처리 용량을 읽기 요청에 사용하고 복제본 지연 시간을 줄일 수 있습니다(대개 10밀리초 미만으로). 또한 Neptune은 읽기 쿼리를 위한 단일 엔드포인트를 제공하기 때문에 애플리케이션을 추가하고 제거할 때 복제본을 추적하지 않고도 애플리케이션을 연결할 수 있습니다.

Neptune은 특별히 구축된 고성능 그래프 데이터베이스입니다. Neptune은 그래프 데이터를 효율적으로 저장 및 탐색하며, 확장형의 인메모리 최적화 구조를 사용하여 대규모 그래프에 대해 빠른 쿼리 평가를 할 수 있게 해 줍니다. Neptune Database을 사용하면 Gremlin, openCypher 또는 SPARQL을 사용하여 쉽게 작성될 수 있고 처리 성능이 뛰어난 강력한 쿼리를 실행할 수 있습니다. Neptune Analytic를 통해 openCypher를 사용할 수 있습니다.

높은 가용성 및 내구성

모두 열기

Amazon Neptune 글로벌 데이터베이스는 전 세계에 분산된 애플리케이션을 위해 설계되었으므로 단일 Neptune 데이터베이스를 여러 지역에 걸쳐 사용할 수 있습니다. 데이터베이스 성능에 거의 영향을 주지 않고 그래프 데이터를 복제하고, 각 리전에서 짧은 지연 시간으로 빠른 로컬 읽기를 지원하며, 리전 전체에 가동 중지 발생 시 재해 복구를 제공합니다.

인스턴스에 장애가 발생하면 Neptune은 3개의 AZ 중 하나에서 생성한 최대 15개의 Neptune 복제본 중 하나로 장애 조치를 자동화합니다. Neptune 복제본이 프로비저닝되지 않은 경우 장애가 발생하면 Neptune이 자동으로 새 데이터베이스 인스턴스를 생성하려고 시도합니다.

Neptune 데이터베이스 및 기본 Amazon EC2 인스턴스의 상태는 지속적으로 모니터링됩니다. 데이터베이스 전원을 공급하는 인스턴스에 장애가 발생하면 데이터베이스와 관련 프로세스가 자동으로 재시작됩니다. Neptune 복구에서는 데이터베이스 다시 실행 로그를 오랫동안 재생하지 않아도 되므로 인스턴스 재시작 시간은 일반적으로 30초 이하입니다. 또한, 이 서비스에서는 데이터베이스 버퍼 캐시를 데이터베이스 프로세스와 분리하므로 데이터베이스를 다시 시작해도 캐시가 유지될 수 있습니다.

Neptune Database의 경우 데이터베이스 볼륨의 각 10GiB 청크는 3개의 AZ에서 내구성을 갖도록 만들어졌습니다. Neptune Database는 데이터베이스 쓰기 가용성에 영향을 주지 않고 최대 2개의 데이터 사본 손실을 처리하고 읽기 가용성에 영향을 주지 않고 최대 3개의 데이터 사본 손실을 투명하게 처리하는 내결함성 스토리지를 사용합니다. 또한 Neptune Database 스토리지는 자가 복구 기능을 갖추고 있어 데이터 블록과 디스크의 오류를 지속적으로 스캔하고 자동으로 교체합니다.

Neptune Database의 백업 기능을 사용하여 인스턴스를 특정 시점으로 복구할 수 있습니다. 이를 통해 데이터베이스를 보존 기간 중 어느 시점(초 단위)으로나 복원할 수 있습니다(최근 5분 전까지 가능). 자동 백업 보존 기간은 최대 35일로 구성할 수 있습니다. 자동 백업은 99.999999999% 내구성을 위해 설계된 Amazon S3에 저장됩니다. Neptune 백업은 지속적인 자동 증분 백업이며 데이터베이스 성능에 영향을 미치지 않습니다.

데이터베이스 스냅샷은 Amazon S3에 저장된 인스턴스에 대해 사용자가 시작하는 백업으로서 명시적으로 삭제할 때까지 보관됩니다. DB 스냅샷은 자동화된 증분 스냅샷을 사용하여 필요한 시간과 스토리지를 절감합니다. 원하는 경우 언제나 데이터베이스 스냅샷으로 인스턴스를 생성할 수 있습니다.

뛰어난 보안

모두 열기

Neptune 데이터베이스는 Amazon Virtual Private Cloud (Amazon VPC) 에서 실행됩니다. 이를 통해 사용자는 자체 가상 네트워크에서 데이터베이스를 격리하고 업계 표준의 암호화된 IPsec VPN을 사용하여 온프레미스 IT 인프라에 연결할 수 있습니다. 또한 Neptune VPC 구성을 사용해 방화벽 설정을 구성하고 DB 인스턴스에 대한 네트워크 액세스를 제어할 수 있습니다.

Neptune은 AWS Identity and Access Management (IAM) 와 통합되어 있으며 데이터베이스 인스턴스, 데이터베이스 스냅샷, 데이터베이스 파라미터 그룹, 데이터베이스 이벤트 구독, 데이터베이스 옵션 그룹을 비롯한 특정 Neptune 리소스에서 IAM 사용자 및 그룹이 수행할 수 있는 작업을 제어할 수 있는 기능을 제공합니다. 또한 Neptune 리소스를 태그 지정하고, 태그 및 태그 값이 동일한 리소스 그룹에서 IAM 사용자 및 그룹이 수행할 수 있는 작업을 제어할 수 있습니다. 예를 들어 '개발' 데이터베이스 인스턴스는 개발자가 수정할 수 있도록 구성하고 '프로덕션' 데이터베이스 인스턴스는 데이터베이스 관리자만 수정하고 삭제할 수 있도록 IAM 규칙을 구성할 수 있습니다.

Neptune은 그래프에서 데이터 읽기, 쓰기, 삭제와 같은 그래프 데이터 작업 및 Neptune ML 활동을 시작 및 모니터링하고 진행 중인 데이터 영역 활동의 상태를 확인하는 등의 비그래프 데이터 작업을 수행하기 위해 IAM를 사용하여 Neptune 데이터 영역 API를 검색하는 사용자에게 세분화된 액세스를 제공합니다. 예를 들어 그래프 데이터를 조작할 필요가 없는 데이터 분석가를 위한 '읽기 전용' 액세스 권한을 위한 정책, 애플리케이션에 대해 그래프를 사용하는 개발자를 위한 '읽기 및 쓰기' 액세스 권한을 포함한 정책, Neptune ML 명령에 액세스해야 하는 데이터 과학자를 위한 정책을 생성할 수 있습니다.

Neptune은 TLS 버전 1.2를 통한 전송 중 암호화를 지원합니다. Neptune을 사용하면 AWS KMS (키 관리 서비스) 를 통해 생성하고 제어하는 키를 사용하여 데이터베이스를 암호화할 수 있습니다. Neptune 암호화를 실행 중인 데이터베이스 인스턴스에서는 같은 클러스터에 있는 자동 백업, 스냅샷 및 복제본과 마찬가지로 기본 스토리지에 저장된 데이터가 암호화됩니다.

Neptune을 사용하면 데이터베이스 성능에 미치는 영향을 최소화하면서 데이터베이스 이벤트를 기록할 수 있습니다. 나중에 데이터베이스 관리, 보안, 거버넌스, 규정 준수 및 기타 목적으로 이러한 로그를 분석할 수 있습니다. 또한 Amazon CloudWatch에 감사 로그를 전송하여 활동을 모니터링할 수 있습니다.

Neptune은 FedRAMP(Moderate 및 High)부터 SOC(1, 2, 3)에 이르는 20개 이상의 국제 규정 준수 표준 범위에 포함되며 HIPAA 적격 제품입니다. Neptune이 준수하는 전체 표준 목록은 규정 준수 프로그램 제공 AWS 범위 내 서비스 목록에서 확인할 수 있습니다.

비용 효율성

모두 열기

Neptune에는 선불 약정이 없으며 시작한 각 인스턴스 또는 소비한 데이터베이스 리소스(서버리스의 경우)에 대해 시간당 요금을 지불하면 됩니다. Neptune 데이터베이스 인스턴스가 더 이상 필요하지 않을 때는 삭제할 수 있습니다. 안전상의 조치를 위해 스토리지를 과다 프로비저닝할 필요가 없으며, 실제로 사용한 스토리지에 대해서만 지불합니다. 자세한 내용은 Neptune 요금 페이지를 참조하십시오.

완전관리형

모두 열기

AWS Management 콘솔을 사용하여 새로운 Neptune 데이터베이스 인스턴스 또는 Neptune 애널리틱스 그래프를 시작하여 Neptune을 시작할 수 있습니다. Neptune 데이터베이스 인스턴스는 선택한 데이터베이스 인스턴스 및 클래스에 적합한 파라미터 및 설정 세트로 사전에 구성됩니다. 데이터베이스 인스턴스를 시작하고 애플리케이션을 연결하기만 하면 됩니다. 이 작업은 몇 분밖에 걸리지 않으며 추가 구성이 필요하지 않습니다. 데이터베이스 파라미터 그룹은 데이터베이스에 대한 세분화된 제어 및 미세 조정 기능을 제공합니다.

Neptune은 데이터베이스 인스턴스에 대한 CloudWatch 지표를 제공합니다. 콘솔을 사용하여 컴퓨팅 리소스, 메모리, 스토리지, 쿼리 처리량, 활성 연결을 비롯한 데이터베이스 인스턴스에 대한 20개 이상의 주요 운영 지표를 볼 수 있습니다.

Neptune은 최신 패치를 적용하여 데이터베이스를 최신 상태로 유지합니다. 데이터베이스 엔진 버전 관리를 통해 인스턴스의 패치 적용 여부와 시기를 제어할 수 있습니다.

Neptune은 자동화된 장애 조치 같은 중요한 데이터베이스 이벤트를 이메일이나 SMS를 통해 알릴 수 있습니다. 콘솔을 사용하여 Neptune 데이터베이스와 관련된 여러 데이터베이스 이벤트를 구독할 수 있습니다.

Neptune은 빠르고 효율적인 복제 작업을 지원하여 테라바이트 규모의 데이터베이스 클러스터 전체를 몇 분 만에 복제할 수 있습니다. 복제는 애플리케이션 개발, 테스트, 데이터베이스 업데이트 및 분석 쿼리 실행과 같은 다양한 목적에 유용합니다. 즉각적인 데이터 가용성으로 인해 소프트웨어 개발 및 프로젝트 업그레이드가 크게 가속화되고 분석이 더욱 정확해질 수 있습니다.

프로덕션 환경에 영향을 주지 않고 콘솔에서 몇 단계만 거치면 Neptune 데이터베이스를 복제할 수 있습니다. 복제본은 3개의 AZ에 분산되어 복제됩니다.

생성형 AI 및 ML

모두 열기

Neptune Analytics는 경로 찾기, 커뮤니티 탐지(클러스터링), 중요 데이터 식별(중심 집중성), 유사성 정량화를 위한 알고리즘을 지원합니다. 경로 찾기 알고리즘은 두 노드 간의 최단 경로 또는 최적 경로를 효율적으로 결정합니다. 경로 찾기 알고리즘을 사용하면 도로망이나 소셜 네트워크와 같은 실제 상황을 상호 연결된 노드 및 엣지로 모델링할 수 있습니다. 다양한 지점 간의 최단 경로 또는 최적의 경로를 찾는 것은 GPS 시스템의 경로 계획, 물류 최적화, 심지어 생물학이나 공학과 같은 분야의 복잡한 문제 해결 등의 응용 분야에서 매우 중요합니다.

커뮤니티 탐지 알고리즘은 네트워크 내의 의미 있는 노드 그룹 또는 클러스터를 계산하여 복잡한 시스템의 조직 및 역학에 대한 인사이트를 제공할 수 있는 숨겨진 패턴과 구조를 드러냅니다. 이는 소셜 네트워크 분석, 생물학(단백질-단백질 상호작용 네트워크의 기능 모듈 식별)과 같은 분야 뿐만 아니라 다양한 영역에서의 정보 흐름 및 영향 전파에 대한 이해에도 유용합니다.

중앙 집중식 알고리즘은 네트워크 내에서 가장 영향력 있거나 중요한 노드를 식별하여 주요 플레이어 또는 중요한 상호 작용 지점에 대한 인사이트를 제공합니다. 이는 영향력 있는 개인을 정확히 찾아내는 데 도움이 되는 소셜 네트워크 분석이나 효율적인 라우팅 및 리소스 할당을 위한 중요한 허브를 식별하는 데 도움이 되는 교통 네트워크와 같은 분야에서 유용합니다.

그래프 유사성 알고리즘을 사용하면 서로 다른 그래프 구조 간의 구조적 유사성 또는 비유사성을 비교 및 분석하여 다양한 데이터 세트의 관계, 패턴 및 공통점을 파악할 수 있습니다. 이는 생물학(분자 구조 비교용), 소셜 네트워크(유사 커뮤니티 식별용), 추천 시스템(사용자 선호도에 따른 유사 항목 제안) 등 다양한 분야에서 매우 유용합니다.

Neptune ML은 SageMaker에 의해 구동됩니다. SageMaker는 그래프용으로 특별히 설계된 ML 기술인 GNN을 사용하여 그래프 데이터를 사용하여 빠르고 정확한 예측을 수행합니다. Neptune ML은 비그래프 방식을 사용한 예측에 비해 대부분의 그래프 예측 정확도를 50% 이상 개선할 수 있습니다.

관계가 수십억 개인 그래프에서 정확히 예측하는 작업은 어렵고 시간이 많이 걸릴 수 있습니다. XGBoost와 같은 기존 ML 접근 방식은 테이블 형식의 데이터용으로 설계되었기 때문에 그래프에서는 효과적으로 작동하지 않을 수 있습니다. 따라서 이 방법을 그래프에서 사용하면 시간이 걸리고 전문 개발자 기술이 필요하며, 최적의 예측에 미치지 못할 수도 있습니다.

개발자 생산성

모두 열기

속성 그래프는 관계형 모델에 익숙한 개발자에게 친숙하기 때문에 널리 사용됩니다. Gremlin 순회 언어는 Property Graph를 빠르게 순회하는 방법을 제공합니다. Neptune은 오픈 소스 Apache TinkerPop Gremlin 순회 언어를 사용하여 속성 그래프 모델을 지원하며, TinkerPop 버전 3.3을 지원하는 Gremlin Websockets 서버를 제공합니다. Neptune을 사용하면 속성 그래프 간의 빠른 Gremlin 순회를 빠르게 빌드할 수 있습니다. 기존의 Gremlin 애플리케이션은 Neptune 인스턴스를 가리키도록 Gremlin 서비스 구성을 변경하여 Neptune을 쉽게 사용할 수 있습니다.

리소스 설명 프레임워크 (RDF) 는 복잡한 정보 도메인을 모델링할 수 있는 유연성을 제공하기 때문에 널리 사용됩니다. 위키데이터와 화학 분자 데이터베이스인 PubChem을 포함하여 RDF에서 사용할 수 있는 기존의 무료 또는 공개 데이터 세트가 많이 있습니다. 넵튠은 W3C의 시맨틱 웹 표준인 RDF 1.1 및 SPARQL 1.1 (쿼리 및 업데이트) 을 지원하며, SPARQL 프로토콜 1.1을 구현하는 HTTP REST 엔드포인트를 제공합니다. Neptune을 사용하면 기존 및 새로운 그래프 애플리케이션 모두에서 SPARQL 엔드포인트를 쉽게 사용할 수 있습니다.

Neptune은 현재 그래프 데이터베이스 개발 작업에서 가장 많이 사용되는 쿼리 언어 중 하나인 openCypher를 사용한 그래프 애플리케이션 구축을 지원합니다. 개발자, 비즈니스 분석가 및 데이터 과학자는 openCypher의 SQL에서 영감을 받은 구문을 좋아합니다. 그래프 애플리케이션에 대한 쿼리를 작성하는 데 친숙한 구조를 제공하기 때문입니다. Neptune Database의 경우 동일한 속성 그래프 데이터에 대해 openCypher와 Gremlin 쿼리 언어를 함께 사용할 수 있습니다. openCypher 지원은 Bolt 프로토콜과 호환되므로 Bolt 프로토콜을 사용해 Neptune에 연결하는 애플리케이션을 계속 실행할 수 있습니다.

Neptune은 Amazon S3에 저장된 속성 그래프 데이터에 대해 빠른 병렬 대량 로드를 지원합니다. REST 인터페이스를 사용하여 데이터의 Amazon S3 위치를 지정할 수 있습니다. CSV로 구분된 형식을 사용하여 데이터를 노드 및 엣지에 로드합니다. 자세한 내용은 Neptune 프로퍼티 그래프 벌크 로딩 문서를 참조하십시오.

Neptune Database는 Amazon S3에 저장된 RDF 데이터에 대해 빠른 병렬 대량 로드를 지원합니다. REST 인터페이스를 사용하여 데이터의 Amazon S3 위치를 지정할 수 있습니다. N-Triples(NT), N-Quads(NQ), RDF/XML 및 Turtle RDF 1.1 직렬화가 지원됩니다. 자세한 내용은 Neptune RDF 벌크 로딩 문서를 참조하십시오.