DataSync를 사용하여 프라이빗 네트워크를 통해 두 Amazon EFS 파일 시스템 간에 데이터를 전송하려면 어떻게 해야 하나요?

최종 업데이트 날짜: 2022년 4월 18일

AWS DataSync를 사용하여 프라이빗 네트워크를 통해 두 Amazon Elastic File System(Amazon EFS) 파일 시스템 간에 데이터를 전송하려고 합니다.

간략한 설명

DataSync를 사용하면 두 Amazon EFS 파일 시스템 간에 데이터를 전송할 수 있습니다. 파일 시스템 간의 데이터 전송은 다음 범주 중 하나로 분류됩니다.

  • 동일한 리전의 서로 다른 계정에 있는 파일 시스템
  • 서로 다른 리전의 서로 다른 계정에 있는 파일 시스템
  • 서로 다른 리전의 동일한 계정에 있는 파일 시스템
  • 동일한 리전의 동일한 계정에 있는 파일 시스템

DataSync를 사용하여 데이터를 전송하려면 특정 요구 사항을 충족하는 DataSync 에이전트를 배포해야 합니다. 이 방법을 사용하면 고객 관리형 프라이빗 네트워크를 사용하여 데이터를 전송할 수 있습니다.

위의 모든 사용 사례에 대해 Amazon EFS 파일 시스템 간에 DataSync 전송을 활성화하려면 다음을 수행합니다.

  1. 계정 간 및 리전 간 Virtual Private Cloud(VPC) 피어링 연결을 생성합니다. 참고: 동일한 리전의 동일한 계정에 있는 파일 시스템 간에 데이터를 전송하는 사용 사례의 경우 이 단계를 건너뜁니다.
  2. 소스 및 대상 Amazon EFS 파일 시스템에서 보안 그룹 규칙을 구성합니다.
  3. 대상 Amazon EFS 파일 시스템이 있는 계정 및 리전에서 DataSync용 VPC 엔드포인트를 생성합니다.
  4. 소스 파일 시스템이 있는 계정 및 리전에 DataSync 에이전트를 배포합니다.
  5. 대상 파일 시스템이 있는 계정 및 리전에서 DataSync 에이전트를 활성화합니다.
  6. 소스 파일 시스템이 있는 계정 및 리전에 NFS 유형으로 소스 위치를 생성합니다.
  7. 대상 파일 시스템이 있는 계정 및 리전에 EFS 유형으로 대상 위치를 생성합니다.
  8. DataSync 태스크를 생성한 다음 실행합니다.

참고: VPC 피어링 대신 AWS Transit Gateway를 사용하는 경우 VPC 피어링 연결을 생성할 필요가 없습니다.

동일한 계정의 파일 시스템 간에 데이터를 전송할 때는 원하는 경우 에이전트 없는 전송이라고도 하는 클라우드 내 전송 기능을 사용할 수 있습니다. 이 기능은 AWS 서비스 간의 완전 자동 전송을 지원합니다. 이 기능의 대략적 아키텍처는 Data transfer between AWS storage services(AWS 스토리지 서비스 간 데이터 전송)를 참조하세요. 이 방법을 사용하면 DataSync 에이전트를 배포할 필요가 없습니다. 대신 DataSync가 DataSync 에이전트를 자동으로 관리합니다.

동일한 리전 또는 다른 리전의 동일한 계정에 있는 두 Amazon EFS 파일 시스템 간에 DataSync 전송을 활성화하려면 다음과 같이 합니다.

  • 해당 리전을 선택하여 소스 및 대상 파일 시스템의 위치를 생성합니다.
  • Amazon EFS 위치를 생성할 때 적절한 서브넷 및 보안 그룹을 선택합니다.
  • DataSync 태스크를 생성한 다음 실행합니다.

자세한 내용은 Creating a location for Amazon EFS(Amazon EFS를 위한 위치 생성)를 참조하세요.

참고:

  • 에이전트 없는 전송은 현재 계정 간 전송 시나리오를 지원하지 않습니다.
  • 에이전트 없는 전송을 사용하면 AWS 관리형 네트워크를 사용하여 데이터가 전송됩니다.
  • AWS 스토리지 서비스 간 데이터 전송을 위한 태스크당 파일 수는 2천 5백만 개로 제한됩니다.

해결 방법

다음 구성 단계는 다음 예제 환경을 기반으로 하며 VPC 엔드포인트를 사용하는 사용 사례에 적용됩니다.

  • 소스 AWS 계정은 111111111111입니다.
  • 소스 AWS 리전은 미국 동부(버지니아 북부)(us-east-1)입니다.
  • 원본 VPC CIDR은 10.10.0.0/16(퍼블릿 서브넷 1개)입니다.
  • DataSync 에이전트 가상 머신(VM)의 IP 주소는 10.10.3.124입니다. DataSync VM은 소스 Amazon EFS 파일 시스템이 상주하는 계정 및 리전에 배포됩니다.
  • 대상 AWS 계정은 222222222222입니다.
  • 대상 리전은 미국 동부(오하이오)(us-east-2)입니다.
  • 대상 VPC CIDR은 10.20.0.0/16입니다.

중요: 환경의 소스 및 대상 VPC CIDR을 기반으로 보안 그룹 규칙을 구성해야 합니다.

계정 간 및 리전 간 VPC 피어링 연결 생성

Amazon EFS 파일 시스템의 소스 및 대상 계정에 있는 VPC 사이에 VPC 피어링 연결을 생성합니다.

다음 단계로 넘어가기 전에 Amazon VPC 콘솔을 사용하여 다음 사항을 확인합니다.

  • 피어링 연결을 확인합니다. 상태가 활성인지 확인합니다.
  • 원본 VPC를 확인합니다. VPC의 라우팅 테이블을 검토하여 pcx로 시작하는 대상에 대해 활성화된 경로가 있는지 확인합니다. 이 경로는 피어링 연결에 사용합니다.
  • 대상 VPC를 확인합니다. VPC의 라우팅 테이블을 검토하여 pcx로 시작하는 대상에 대해 활성화된 경로가 있는지 확인합니다.

소스 및 대상 Amazon EFS 파일 시스템의 보안 그룹 규칙 구성

중요: 다음의 예제 보안 그룹 규칙은 예제 VPC CIDR을 기반으로 합니다. 환경의 VPC CIDR을 기반으로 보안 그룹 규칙을 구성해야 합니다.

다음을 구성합니다.

  • 소스 Amazon EFS 파일 시스템이 있는 계정의 VPC 및 서브넷에 1개의 보안 그룹(예: Source_EFS_SG)
  • 대상 Amazon EFS 파일 시스템이 있는 계정의 VPC 및 서브넷에 2개의 보안 그룹(예: DS_Destination_Location_SG 및 Destination_EFS_SG)
  • 대상 Amazon EFS 파일 시스템이 있는 계정의 VPC 및 서브넷에 1개의 보안 그룹. 이 보안 그룹은 DataSync VPC 엔드포인트와 연결하는 데 사용됩니다(예: DS_VPCE_SG).

이러한 네 가지 보안 그룹에 대해 다음과 유사하게 인바운드 및 아웃바운드 규칙을 구성합니다.

Source_EFS_SG:

인바운드:

유형 프로토콜 포트 범위 원본 설명
NFS TCP 2049 10.10.3.124/32 NFS

아웃바운드:

유형 프로토콜 포트 범위 원본 설명
모든 트래픽 모두 모두 0.0.0.0/0 기본값

DS_Destination_Location_SG:

인바운드:

유형 프로토콜 포트 범위 원본 설명
모든 트래픽 모두 모두 DS_Destination_Location_SG(보안 그룹 ID) DS_Destination_Location_SG

아웃바운드:

유형 프로토콜 포트 범위 원본 설명
모든 트래픽 모두 모두 0.0.0.0/0 기본값

Destination_EFS_SG:

인바운드:

유형 프로토콜 포트 범위 원본 설명
TCP NFS 2049 DS_Destination_Location_SG(보안 그룹 ID) Destination_EFS_SG
TCP HTTPS 443 10.10.3.124/32 Data_Transfer_From_Source

아웃바운드:

유형 프로토콜 포트 범위 원본 설명
모든 트래픽 모두 모두 0.0.0.0/0 기본값

DS_VPCE_SG:

인바운드:

유형 프로토콜 포트 범위 원본 설명
TCP HTTPS 443 10.10.3.124/32 Agent_Activation
TCP 사용자 지정 TCP 1024-1064 10.10.3.124/32 Control_Traffic
TCP SSH 22 10.10.3.124/32 AWS_Support_Channel

아웃바운드:

유형 프로토콜 포트 범위 원본 설명
모든 트래픽 모두 모두 0.0.0.0/0 기본값

대상 Amazon EFS 파일 시스템의 리전에서 DataSync의 VPC 엔드포인트 생성

DataSync 에이전트 생성 및 활성화

참고: 다음 절차는 DataSync 콘솔을 사용하여 에이전트를 생성하는 방법입니다. AWS Command Line Interface(AWS CLI)를 사용하여 DataSync 에이전트를 생성할 수도 있습니다. 클라우드 내 파일 시스템에 액세스하기 위해 Amazon EC2 인스턴스로 에이전트 배포에서 제공하는 AMI ID를 사용하여 소스 Amazon EFS 파일 시스템의 계정 및 리전에 DataSync 에이전트를 배포하고 설치합니다. 아직 에이전트를 활성화하지는 않습니다.

  1. 대상 Amazon EFS 파일 시스템의 계정과 리전에서 DataSync 콘솔을 엽니다.
  2. 탐색 창에서 [에이전트(Agents)]를 선택합니다.
  3. [에이전트 생성(Create agent)]을 선택합니다.
  4. [서비스 엔드포인트]에서 [AWS PrivateLink를 사용하는 VPC 엔드포인트]를 선택합니다.
  5. [VPC 엔드포인트]에서 대상 리전에서 생성된 VPC 엔드포인트를 선택합니다.
  6. [서브넷]에서 VPC 엔드포인트가 있는 서브넷을 선택합니다.
  7. [보안 그룹(Security Group)]에서 VPC 엔드포인트의 보안 그룹을 선택합니다.
  8. [에이전트로부터 자동으로 정품 인증 키 가져오기(Automatically get the activation key from your agent)]를 선택합니다.
  9. [에이전트 주소(Agent address)]에 DataSync 에이전트 Amazon EC2 인스턴스의 IP 주소를 입력합니다.
    퍼블릭 IP 주소 또는 프라이빗 IP 주소를 사용하여 DataSync 에이전트를 활성화할 수 있습니다. 프라이빗 IP 주소만 있는 경우, 에이전트와 동일한 서브넷에 있는 머신에서 에이전트를 활성화해야 합니다.
  10. [키 가져오기(Get key)]를 선택합니다.
  11. 대상 Amazon EFS 파일 시스템과 동일한 리전에서 에이전트를 활성화합니다.

소스 및 대상 Amazon EFS 파일 시스템의 위치 생성

소스 위치 생성:

  1. 소스 Amazon EFS 파일 시스템의 계정과 리전에서 DataSync 콘솔을 엽니다.
  2. 탐색 창에서 [위치(Locations)]를 선택합니다.
  3. [위치 생성(Create location)</]을 선택합니다.
  4. [위치 유형(Location type)]에서 [네트워크 파일 시스템(NFS)(Network File System (NFS))]을 선택합니다.
  5. [에이전트(Agents)]에서 활성화한 DataSync 에이전트를 선택합니다.
  6. [NFS 서버(NFS Server)]에 소스 파일 시스템의 탑재 대상 IP 주소를 입력합니다.
  7. [위치 생성(Create location)</]을 선택합니다.

대상 위치 생성:

  1. 대상 Amazon EFS 파일 시스템의 계정과 리전에서 DataSync 콘솔을 엽니다.
  2. 탐색 창에서 [위치(Locations)]를 선택합니다.
  3. [위치 생성(Create location)</]을 선택합니다.
  4. [위치 유형(Location type)]에서 [Amazon EFS 파일 시스템(Amazon EFS file system)]을 선택합니다.
  5. [EFS 파일 시스템(EFS File system)]에서 대상 파일 시스템을 선택합니다.
  6. [탑재 경로(Mount path)]에 대상 파일 시스템의 탑재 경로를 입력합니다.
    참고: 하위 폴더를 포함한 경로가 실제로 존재하는지 확인하세요. DataSync는 해당 구조가 없더라도 소스 및 대상에 폴더 구조를 만들지 않습니다. 이 경우 [해당 파일 또는 디렉터리가 없습니다(No such file or directory)]라는 오류와 함께 태스크가 실패합니다.
  7. [서브넷(Subnet)]에서 대상 파일 시스템이 있는 서브넷을 선택합니다.
  8. [보안 그룹(Security Group)]에서 대상 파일 시스템에 대해 이전에 만든 보안 그룹(예: DS_Destination_Location_SG)을 선택합니다.
  9. [위치 생성(Create location)</]을 선택합니다.

참고: 대상 파일 시스템의 탑재 대상에 Destination_EFS_SG와 유사한 보안 그룹이 있는지 확인하세요.

DataSync 태스크를 생성한 다음, 태스크 실행

태스크 설정을 구성합니다. 태스크 상태가 [사용 가능(Available)]으로 표시되고 나면 태스크를 실행할 수 있습니다. 그러면 태스크가 여러 단계에 걸쳐 실행됩니다. 각 태스크 단계에 대한 자세한 내용은 태스크 실행 단계의 이해를 참조하세요.


이 문서가 도움이 되었습니까?


결제 또는 기술 지원이 필요합니까?