Amazon OpenSearch Service 도메인의 내결함성을 높이려면 어떻게 해야 합니까?

3분 분량

우발적인 삭제, 애플리케이션 또는 하드웨어 장애 또는 가동 중단으로부터 Amazon OpenSearch Service 리소스를 보호하려고 합니다. 내결함성 향상 또는 스냅샷 복원에 대한 모범 사례로는 어떤 것이 있습니까?

간략한 설명

OpenSearch Service 도메인의 내결함성을 개선하려면 다음과 같은 모범 사례를 고려합니다.

정기적으로 인덱스 스냅샷을 생성합니다.
Amazon CloudWatch 지표를 사용하여 OpenSearch Service 리소스를 모니터링합니다.
OpenSearch Service 한도를 이해하세요.
전용 마스터 노드를 사용합니다.
3개 이상의 노드를 사용합니다.
영역 인식을 활성화합니다.
프로덕션 환경에서는 T2 인스턴스를 사용하지 않도록 합니다.

해결 방법

정기적 인덱스 스냅샷 생성

모든 OpenSearch Service 도메인은 자동 스냅샷을 생성합니다. 수동 인덱스 스냅샷을 생성하여 OpenSearch Service 도메인에 있는 데이터의 특정 시점 백업을 생성합니다. 스냅샷을 Amazon S3(Amazon Simple Storage Service) 버킷에 저장합니다. 수동 인덱스 스냅샷을 사용하여 OpenSearch Service 도메인 간에 데이터를 마이그레이션하거나 데이터를 다른 OpenSearch Service 도메인으로 복원할 수도 있습니다.

Amazon CloudWatch 지표 모니터링

OpenSearch Service 콘솔의 클러스터 상태 및 인스턴스 상태 탭을 사용하여 클러스터의 Amazon CloudWatch 지표를 모니터링합니다.
Amazon CloudWatch 경보를 생성합니다(중요한 OpenSearch Service 지표에 대해). 예를 들어 AutomatedSnapshotFailure 지표를 모니터링하여 자동 스냅샷이 정기적으로 생성되는지 확인합니다. 자습서는 OpenSearch Service 시작하기: 주요 지표에 대한 CloudWatch 경보 설정을 참조하세요.

전용 프라이머리 노드 사용

전용 마스터 노드는 과부하 노드로 인한 문제를 방지하는 데 도움이 됩니다. 다음과 같은 경우에 전용 마스터 노드를 사용하십시오.

도메인이 프로덕션 환경에서 사용되는 경우
도메인에 6개 이상의 노드가 있는 경우
여러 유형 및 인덱스에 걸쳐 많은 필드가 정의되어 인덱스 매핑이 복잡한 경우

3개 이상의 노드 사용

의도치 않게 파티셔닝된 네트워크(브레인 분할)를 방지하려면 3개 이상의 노드를 사용합니다. 잠재적인 데이터 손실을 방지하려면 각 인덱스에 복제본이 하나 이상 있어야 합니다. (기본적으로 각 인덱스에는 복제본이 하나씩 있습니다.)

영역 인식 활성화

영역 인지는 가동 중지 및 데이터 손실을 방지하는 데 도움이 됩니다. 영역 인지가 활성화되면 OpenSearch Service는 노드 및 복제본 인덱스 샤드를 동일한 AWS 리전에 있는 두 개 또는 세 개의 가용 영역에 할당합니다.

참고: 세 개의 가용 영역을 설정하려면 인덱스 복제본 두 개를 사용하세요. 단일 영역 장애가 발생한 경우 두 복제본은 100% 데이터 중복성을 제공합니다.

프로덕션 환경에서 T2 인스턴스를 사용하지 않기

프로덕션 환경에서는 M 클래스 이상의 Amazon EC2(Amazon Elastic Compute Cloud) 인스턴스를 사용하도록 합니다. T2 인스턴스 유형을 사용할 경우 인스턴스의 CPU 크레딧, CPU 사용량, 메모리 사용량 및 안정성을 모니터링해야 합니다. 필요한 경우 확장 또는 축소합니다.

또한 T2 인스턴스에 대한 다음과 같은 제한 사항에 유의합니다.

T2 인스턴스에는 CPU 크레딧이 할당됩니다. 네트워크 트래픽이 급증하는 경우 OpenSearch Service 클러스터가 T2 인스턴스에서 사용 가능한 CPU 크레딧을 초과할 수 있습니다. 자세한 내용은 성성능 순간 확장 가능 인스턴스에 대한 CPU 크레딧 및 기준 사용률을 참조하세요.
T2 인스턴스에는 35GB의 EBS 볼륨 제한이 있습니다.
T2 인스턴스에는 10MB의 페이로드 제한이 있습니다. 요청 페이로드가 페이로드 제한을 초과하지 않는지 확인하세요. OpenSearch Service 네트워크 제한에 대한 자세한 내용은 네트워크 제한을 참조하세요.
T2 인스턴스 유형은 OpenSearch Service 인스턴스 수가 10개 이하인 경우에만 사용할 수 있습니다. 지원되는 OpenSearch Service 인스턴스 유형에 대한 자세한 내용은 지원되는 인스턴스 유형을 참조하세요.
T2 인스턴스 유형은 데이터 노드 또는 전용 마스터 노드로 사용해서는 안 됩니다. T2 인스턴스 유형은 지속적인 과부하 하에서 불안정해질 수 있습니다. 자세한 내용은 OpenSearch Service 모범 사례를 참조하세요.