Amazon Elasticsearch Service 도메인의 내결함성을 높이려면 어떻게 해야 합니까?

최종 업데이트 날짜: 2021년 1월 5일

우발적인 삭제, 애플리케이션 또는 하드웨어 장애 또는 가동 중단으로부터 Amazon ES(Amazon Elasticsearch Service) 리소스를 보호하려고 합니다. 내결함성 향상 또는 스냅샷 복원에 대한 모범 사례로는 어떤 것이 있습니까?

간략한 설명

Amazon ES 도메인의 내결함성을 개선하려면 다음과 같은 모범 사례를 고려합니다.

  • 정기적으로 인덱스 스냅샷을 생성합니다.
  • Amazon CloudWatch 지표를 사용하여 Amazon ES 리소스를 모니터링합니다.
  • Amazon ES Service Limits에 대해 이해합니다.
  • 전용 마스터 노드를 사용합니다.
  • 3개 이상의 노드를 사용합니다.
  • 영역 인식을 활성화합니다.
  • 프로덕션 환경에서는 T2 인스턴스를 사용하지 않도록 합니다.

해결 방법

정기적 인덱스 스냅샷 생성

모든 Amazon ES 도메인은 자동 스냅샷을 생성합니다. 수동 인덱스 스냅샷을 생성하여 Amazon ES 도메인에 있는 데이터의 특정 시점 백업을 생성합니다. 스냅샷을 Amazon S3(Amazon Simple Storage Service) 버킷에 저장합니다. 수동 인덱스 스냅샷을 사용하여 Amazon ES 도메인 간에 데이터를 마이그레이션하고 데이터를 다른 Amazon ES 도메인으로 복원할 수도 있습니다.

Amazon CloudWatch 지표 모니터링

전용 마스터 노드 사용

전용 마스터 노드는 과부하 노드로 인한 문제를 방지하는 데 도움이 됩니다. 다음과 같은 경우에 전용 마스터 노드를 사용하십시오.

  • 도메인이 프로덕션 환경에서 사용되는 경우
  • 도메인에 6개 이상의 노드가 있는 경우
  • 여러 유형 및 인덱스에 걸쳐 많은 필드가 정의되어 인덱스 매핑이 복잡한 경우

3개 이상의 노드 사용

의도치 않게 파티셔닝된 네트워크(브레인 분할)를 방지하려면 3개 이상의 노드를 사용합니다. 잠재적인 데이터 손실을 방지하려면 각 인덱스에 복제본이 하나 이상 있어야 합니다. (기본적으로 각 인덱스에는 복제본이 하나씩 있습니다.)

영역 인식 활성화

영역 인식은 가동 중지 및 데이터 손실을 방지하는 데 도움이 됩니다. 영역 인식이 활성화되면 Amazon ES는 노드 및 복제본 인덱스 샤드를 동일한 리전에 있는 두 개 또는 세 개의 가용 영역에 할당합니다.

참고: 세 개의 가용 영역을 설정하려면 인덱스 복제본 두 개를 사용하세요. 단일 영역 장애가 발생한 경우 두 복제본은 100% 데이터 중복성을 보장합니다.

프로덕션 환경에서 T2 인스턴스를 사용하지 않기

프로덕션 환경에서는 M 클래스 이상의 Amazon EC2(Amazon Elastic Compute Cloud) 인스턴스를 사용하도록 합니다. T2 인스턴스 유형을 사용하기로 결정한 경우 인스턴스의 CPU 크레딧, CPU 사용량, 메모리 사용량 및 안정성을 모니터링해야 합니다. 필요한 경우 확장 또는 축소합니다.

또한 T2 인스턴스에 대한 다음과 같은 제한 사항에 유의합니다.

  • T2 인스턴스에는 CPU 크레딧이 할당됩니다. 네트워크 트래픽이 급증하는 경우 Elasticsearch 클러스터가 T2 인스턴스에서 사용 가능한 CPU 크레딧을 초과할 수 있습니다. 자세한 내용은 성성능 순간 확장 가능 인스턴스에 대한 CPU 크레딧 및 기준 사용률을 참조하세요.
  • T2 인스턴스에는 35GB의 EBS 볼륨 제한이 있습니다.
  • T2 인스턴스에는 10MB의 페이로드 제한이 있습니다. 요청 페이로드가 페이로드 제한을 초과하지 않는지 확인하세요. Amazon ES 서비스 제한에 대한 자세한 내용은 네트워크 제한을 참조하세요.
  • T2 인스턴스 유형은 Amazon ES 인스턴스 수가 10개 이하인 경우에만 사용할 수 있습니다. 지원되는 Amazon ES 인스턴스 유형에 대한 자세한 내용은 지원되는 인스턴스 유형을 참조하세요.
  • T2 인스턴스 유형은 데이터 노드 또는 전용 마스터 노드로 사용해서는 안 됩니다. T2 인스턴스 유형은 지속적인 과부하 하에서 불안정해질 수 있습니다. 자세한 내용은 Amazon Elasticsearch Service 모범 사례를 참조하세요.