콘솔에 “초기 동기화 완료 중(Finalizing Initial Sync)” 메시지가 표시되는데 CloudEndure의 복제 프로세스가 100%에서 멈추는 이유는 무엇입니까?

최종 업데이트 날짜: 2020년 12월 7일

CloudEndure Migration 또는 CloudEndure Disaster Recovery를 사용하고 있습니다. 복제 프로세스가 100%에서 멈추고 CloudEndure 콘솔에 [“초기 동기화 완료 중(Finalizing initial sync)”]이라는 메시지가 표시됩니다. 이 문제를 해결하려면 어떻게 해야 하나요?

간략한 설명

최종 초기 동기화 단계 수행 중 복제 프로세스가 100%에서 멈추는 경우 CloudEndure 콘솔에 다음과 같은 두 가지 메시지가 표시될 수 있습니다.

  • “초기 동기화 완료 중 - 백로그 비우기 중(Finalizing Initial Sync - Flushing Backlog)”
  • “초기 동기화 완료 중 - 시작 가능한 첫 번째 스냅샷 생성 중(Finalizing Initial Sync - Creating First Launchable Snapshot)” 이 오류는 다음과 같은 이유로 발생할 수 있습니다.

해결 방법

초기 동기화 완료 중 - 백로그 비우기 중(Finalizing Initial Sync - Flushing Backlog)

동기화가 초기화되도록 백로그가 비우기를 완료할 때까지 기다립니다.

소스 시스템의 쓰기 작업이 매우 많으면 시간 경과에 따라 백로그가 늘어날 수 있습니다. CloudEndure 콘솔에서 하나 이상의 시스템이 [초기 동기화 완료 중(Finalizing Initial Sync)] 상태에 머무를 수 있습니다. 이 경우 다음을 수행합니다.

1.    복제 속도를 테스트합니다. 복제 속도를 테스트한 후 필요한 대역폭을 계산한 다음 소스 시스템에 대역폭을 할당합니다.

2.    [복제 설정(Replication Settings)]에서 [네트워크 대역폭 조절(Network bandwidth throttling)] 옵션을 비활성화했는지 확인합니다. 구성에 이 옵션 활성화가 필요한 경우 값을 필요한 최소 대역폭 이상으로 설정해야 합니다. 자세한 내용은 [선택 사항] 네트워크 대역폭 조절 활성화를 참조하세요.

3.    Amazon CloudWatch 지표를 사용하여 복제 서버의 네트워크/디스크 사용률을 확인합니다. 리소스가 서버를 조절하는 경우 전용 복제 서버를 사용하거나 HDD 디스크 대신 고속 SSD 데이터 디스크를 사용하도록 선택합니다.

특정 소스 시스템에서 사용하는 복제 서버를 확인하려면 다음 예제와 같이 소스 시스템에서 netstat 명령을 실행합니다. 시스템이 포트 1500을 통해 연결하는 원격 IP를 기록해 둡니다.

$ netstat -anp | grep ":1500"

또는 소스 시스템의 agent.log.0 파일을 검토하여 사용 중인 정확한 복제 서버를 식별합니다.

$ sudo cat /var/lib/cloudendure/agent.log.0 | grep :1500 | tail -n 1

초기 동기화 완료 중 - 시작 가능한 첫 번째 스냅샷 생성 중(Finalizing Initial Sync - Creating First Launchable Snapshot)

이 오류 메시지 문제를 해결하려면 다음을 수행합니다.

  • CloudEndure 사용자의 AWS Identity and Access Management(IAM) 정책에 필요한 Amazon Elastic Compute Cloud(Amazon EC2) API를 실행할 수 있는 모든 권한이 있는지 확인합니다.
  • 복제 서버가 리전 내의 Amazon EC2 엔드포인트와 통신하는지 확인합니다.
  • 네트워크 연결 차단기를 식별합니다.
  • [복제 설정(Replication Settings)]에서 최근 변경 사항을 확인합니다.
  • 올바른 프록시 설정을 사용하고 있는지 확인합니다.
  • CloudEndure Agent가 제대로 작동하는지 확인합니다.
  • 서비스 할당량 문제를 확인합니다.

CloudEndure 사용자의 IAM 정책에 필요한 Amazon EC2 API를 실행할 수 있는 모든 권한이 있는지 확인합니다.

샘플 정책은 IAM 샘플 정책을 참조하세요. 또는 AWS CloudTrail 이벤트 기록을 보고 구성된 CloudEndure IAM 사용자에 대한 API 오류를 확인합니다.

복제 서버가 리전 내의 Amazon EC2 엔드포인트와 통신하는지 확인

1.    스테이징 영역과 동일한 서브넷에서 새 Linux 시스템을 시작합니다.

2.    새 시스템에 로그인한 후 다음 명령을 실행하여 연결을 테스트합니다. 다음 예제 명령에서 us-east-1을 사용자의 리전으로 바꿉니다.

$ dig ec2.us-east-1.amazonaws.com
$ telnet ec2.us-east-1.amazonaws.com 443
$ wget https://ec2.us-east-1.amazonaws.com

위의 명령 중 하나라도 실패하면 네트워크 연결 문제가 발생합니다. 다음 섹션으로 진행합니다.

네트워크 연결 차단기 식별

VPC, 서브넷, 보안 그룹, 네트워크 ACL(액세스 제어 목록) 및 라우팅 테이블 설정이 [복제 설정(Replication Settings)]과 일치하는지 확인합니다. 불일치로 인해 복제 서버와 Amazon EC2 엔드포인트의 통신이 차단될 수 있습니다.

복제 서버가 퍼블릭 서브넷에서 시작되는 경우 다음을 수행합니다.

1.    보안 그룹, 네트워크 ACL 및 라우팅 테이블이 TCP 포트 443의 Amazon EC2 엔드포인트와 통신을 허용하는지 확인합니다.

2.    VPC 수준에서 enableDnsHostnamesenableDnsSupport 속성이 true로 설정되어 있는지 확인합니다.

$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsHostnames
$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsSupport

복제 서버가 프라이빗 서브넷에서 시작되는 경우 다음을 수행하세요.

1.    보안 그룹, 네트워크 ACL 및 라우팅 테이블이 TCP 포트 443의 Amazon EC2 엔드포인트와 통신을 허용하는지 확인합니다.

2.    라우팅 테이블에 NAT 게이트웨이나 NAT 인스턴스를 구성한 경우 TCP 포트 443의 Amazon EC2 엔드포인트로 아웃바운드 트래픽이 제대로 흐르는지 확인합니다.

3.    전송 게이트웨이 또는 가상 프라이빗 게이트웨이를 통과하도록 아웃바운드 트래픽을 구성한 경우 라우팅 테이블에서 아웃바운드 트래픽이 TCP 포트 443의 리전별 Amazon EC2 엔드포인트에 도달할 수 있도록 허용하는지 확인합니다.

4.    내부 또는 외부 방화벽이 통신을 차단하는지 확인합니다.

5.    VPC에 인터페이스 VPC 엔드포인트가 있는 경우 프라이빗 네트워크를 통해 TCP 포트 443의 Amazon EC2 엔드포인트 간에 통신이 이루어지는지 확인합니다. 이렇게 하려면 다음을 수행합니다.

VPC 엔드포인트와 연결된 보안 그룹이 TCP 포트 443의 복제 인스턴스에서 들어오는 트래픽을 허용하는지 확인합니다.

VPC 수준에서 enableDnsHostnamesenableDnsSupport 속성이 true로 설정되어 있는지 확인합니다. 또한 VPC 인터페이스 엔드포인트에서 PrivateDnsEnabled 값이 true로 설정되어 있는지 확인합니다.

$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsHostnames
$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsSupport
$ aws ec2 describe-vpc-endpoints --vpc-endpoint-ids vpce-088d25a4bbf4a7abc

[복제 설정(Replication Settings)]의 최근 변경 사항 확인

[CloudEndure의 이벤트 로그(CloudEndure Event Log)]에서 [복제 설정(Replication Settings)] 의 변경 사항을 추적할 수 있습니다. 예를 들어 [스테인리스 영역 태그(Staging Area Tags)] 필드에 잘못된 태그가 삽입되어 있는지 확인합니다. 허용되는 문자 목록은 태그 제한을 참조하세요.

올바른 프록시 설정을 사용하고 있는지 확인

1.    복제 서버에서 프록시 서버를 사용하는 경우 프록시의 설정이 TCP 포트 443의 리전별 Amazon EC2 엔드포인트와 통신을 허용하는지 확인합니다.

2.    SSL 가로채기 및 인증에 대한 허용 목록에 console.cloudendure.com이 포함되어 있는지 확인합니다. 자세한 내용은 AWS에 대한 복제 설정 정의프록시 정의 섹션을 참조하세요.

CloudEndure 에이전트가 제대로 작동하는지 확인

CloudEndure 에이전트가 소스 시스템에서 제대로 작동하는지 확인합니다. CloudEndure 에이전트 로그에서 가능한 오류를 확인하여 문제를 정확히 찾아낼 수 있습니다.

Amazon EC2 서비스 할당량 문제 확인

서비스 할당량 문제 또는 API 조절 및 속도 제한 문제로 인해 CloudEndure가 실행 가능한 첫 번째 복구 스냅샷을 생성하지 못할 수 있습니다. CloudTrail 이벤트 기록을 점검하여 서비스 할당량 또는 조절 문제가 있는지 확인합니다.

자세한 내용은 Amazon EC2 서비스 할당량을 참조하세요.</p


이 문서가 도움이 되었나요?


결제 또는 기술 지원이 필요합니까?