AWS Backup에서 FSx for ONTAP 볼륨을 백업할 수 없는 이유는 무엇인가요?
최종 업데이트 날짜: 2022년 11월 21일
AWS Backup을 사용하여 Amazon FSx for NetApp ONTAP 볼륨을 백업할 때 오류가 발생하거나 백업 진행 속도가 느립니다.
간략한 설명
파일 시스템에 남은 공간이 충분하지 않으면 백업이 실패하는 경우가 많습니다. 볼륨에 사용 가능한 공간이 있더라도 볼륨은 씬 프로비저닝됩니다. 즉, 볼륨은 볼륨에 저장된 데이터를 위한 파일 시스템의 스토리지 용량만 사용합니다. 따라서 볼륨에 사용 가능한 공간이 있더라도 파일 시스템 SSD(집계: aggr1)에는 사용 가능한 공간이 없을 수 있습니다.
FSx for ONTAP 볼륨의 백업을 생성하기 전에 먼저 Amazon FSx의 볼륨이 가득 차지 않았는지 확인합니다. FSx for ONTAP에서는 스냅샷을 생성하는 데 약간의 여유 공간이 필요하기 때문에 전체 볼륨을 백업할 수 없습니다. FSx for ONTAP은 사용률이 볼륨의 사용량 임계값을 초과하면 볼륨이 가득 찬 것으로 간주합니다. 기본적으로 사용량 임계값은 98%입니다.
또한 볼륨의 여유 공간을 보고할 때 FSx for ONTAP은 다음 중 더 작은 쪽을 여유 공간으로 간주합니다.
- 볼륨에서 사용 가능한 용량.
- 파일 시스템의 SSD 티어에서 사용 가능한 용량입니다.
예를 들어 100TB SSD 파일 시스템을 생성한 경우 FSx for ONTAP은 해당 볼륨에 1TB의 여유 용량이 있는 것으로 보고합니다. 따라서 FSx for ONTAP은 볼륨이 99% 찼다고 보고합니다. 99%는 볼륨의 기본 사용량 임계값인 98%를 초과합니다. 볼륨이 98% 이상 찼다고 보고되기 때문에 볼륨 백업이 실패할 수 있습니다.
해결 방법
describe-backups AWS Command Line Interface(AWS CLI) 명령을 실행하여 백업에 대한 모든 실패 메시지를 확인합니다. 다음 예제 명령에서 xyzabc를 백업 ID로 바꿉니다.
$ aws fsx describe-backups --backup-id backup-xyzabc --region region_id
참고: AWS CLI 명령을 실행할 때 오류가 발생하는 경우, 최신 버전의 AWS CLI를 사용하고 있는지 확인합니다.
장애가 볼륨의 스토리지 부족으로 인한 것인지 확인한 후 다음을 수행합니다.
참고: AWS Backup에서 생성한 백업은 볼륨 자체의 .snapshot 디렉터리에 저장된다는 점에 유의하세요. 이는 백업이 볼륨의 공간을 차지한다는 것을 의미합니다.
space-full-threshold-percent를 100%로 늘립니다
FSx for ONTAP 볼륨이 씬 프로비저닝됩니다. 따라서 파일 시스템보다 더 큰 크기의 볼륨을 프로비저닝할 수 있습니다. 이로 인해 스냅샷을 생성할 때 공간 문제가 발생할 수 있습니다. 예를 들어 1TB 파일 시스템에 100TB 볼륨을 생성하는 경우 NetApp ONTAP CLI를 사용하여 스냅샷을 생성할 수 있습니다. 하지만 AWS Backup으로는 스냅샷을 생성할 수 없습니다. 1TB 파일 시스템의 경우 약 42TB 볼륨의 백업을 생성할 수 있습니다. 볼륨에 TB 크기가 추가되면 AWS Backup에서 백업을 생성하지 못합니다.
이 문제를 해결하려면 NetApp ONTAP CLI를 사용하여 다음 명령을 실행합니다.
::> vol modify -vserver <svm_name> -volume <vol_name> -space-full-threshold-percent 100
위 명령은 볼륨의 전체 임계값을 늘립니다. 이렇게 하면 FSx for ONTAP에서 볼륨이 꽉 찬 것으로 보고되지 않아 백업을 계속할 수 있습니다.
파일 시스템의 SSD 스토리지 용량 늘리기
파일 시스템의 SSD 스토리지 용량을 늘려 여유 SSD 용량이 항상 최대 볼륨 크기보다 2% 이상 크게 유지합니다. 예를 들어, 최대 볼륨 크기가 100TB인 경우 항상 최소 2TB의 여유 용량을 확보하도록 SSD 용량 크기를 조정하세요. 이렇게 하면 볼륨의 space-full-threshold-percent를 기본값인 98%로 유지하더라도 FSx for ONTAP은 볼륨이 가득 찬 것으로 보고하지 않습니다.
볼륨에서 스냅샷 자동 삭제 시작 설정 확인
볼륨에 스냅샷 자동 삭제가 켜져 있고 시작이 snap_reserve로 설정된 경우 백업이 실패할 수 있습니다. snap_reserve 파라미터는 스냅샷에 대해 예약된 공간이 Space Reserved for Snapshot Copies(스냅샷 복사본용으로 예약된 공간)에 할당된 값에 도달하면 스냅샷을 삭제합니다. 기본값은 5%입니다. 백업이 생성되면 Amazon FSx는 볼륨의 스냅샷을 생성한 다음 이 스냅샷을 이전 백업 스냅샷(있는 경우)과 비교합니다. 그러면 Amazon FSx가 변경된 데이터만 백업에 복사합니다. 이전 스냅샷의 크기가 Space Reserved for Snapshot Copies(스냅샷 복사본용으로 예약된 공간)에 할당된 값보다 크면 새 백업이 생성 시 자동으로 삭제됩니다. 즉, Amazon FSx가 볼륨의 백업을 생성할 수 없습니다.
이를 방지하려면 Space Reserved for Snapshot Copies(스냅샷 복사본용으로 예약된 공간) 파라미터가 이전 백업의 크기를 초과하도록 볼륨 크기를 늘리세요. 스냅샷 예약을 이전 백업 크기보다 큰 값으로 설정하려면 다음 NetApp ONTAP CLI 명령을 실행합니다.
::> volume modify -vserver com -volume vol_name -percent-snapshot -space 20
위 명령은 Space Reserved for Snapshot Copies(스냅샷 복사본용으로 예약된 공간) 옵션을 20%로 설정합니다. 자세한 내용은 NetApp 설명서의 스냅샷 복사본 예약 관리를 참조하세요.