일반

Q: AWS DataSync란 무엇입니까?

A: AWS DataSync는 온라인 데이터 전송 서비스로, 인터넷 또는 AWS Direct Connect를 통한 스토리지 시스템과 AWS 스토리지 시스템(예: Amazon S3 및 Amazon EFS) 간 대량의 데이터 복사를 간소화, 자동화 및 가속화합니다.

Q: AWS DataSync를 사용해야 하는 이유는 무엇입니까?

A: AWS DataSync를 사용하면 오픈 소스 도구를 사용하여 사용자 지정 솔루션을 구축하거나 비싼 상용 네트워크 가속화 소프트웨어 라이센스를 사용 및 관리할 필요 없이 수백만 개의 파일이 포함된 대규모 데이터 세트를 이동, 복사 및 동기화할 수 있습니다. 활성 데이터의 일회성 마이그레이션, 데이터 처리 워크플로의 주기적 분산 또는 비즈니스 연속성을 위한 지속적 복제에 DataSync를 사용할 수 있습니다.

Q: DataSync로 해결되는 문제는 무엇입니까?

A: DataSync는 온라인 데이터 전송의 복잡성과 비용을 절감하여 온프레미스 스토리지 시스템과 Amazon S3 또는 Amazon EFS(Elastic File System) 사이의 데이터 세트 전송을 간소화합니다. DataSync는 표준 스토리지 프로토콜(NFS)을 통해 기존 스토리지 시스템 및 데이터 원본과 연결되고, 특별히 구축된 네트워크 프로토콜 및 확장 아키텍처를 사용하여 AWS로의/AWS로부터의 전송을 가속화합니다. DataSync는 데이터 이동, 전송 진행 상황 모니터링, 데이터 전송의 암호화 및 검증, 오류에 대한 고객 알림에 대한 모든 작업을 자동으로 조정 및 처리합니다. DataSync를 통해 최소 약정 또는 선결제 금액 없이 복사된 데이터의 양만큼 지불하기만 하면 됩니다.

Q: 데이터 전송이 가능한 곳은 어디입니까?

A: DataSync는 NFS 서버, Amazon S3 버킷 그리고 Amazon EFS 파일 시스템 간에 데이터를 복사할 수 있습니다.

설정

Q: DataSync를 시작하려면 어떻게 해야 합니까?

A: AWS Management Console에서 또는 AWS CLI(명령줄 인터페이스)를 통해 클릭 몇 번 만으로 DataSync를 사용하여 데이터를 전송할 수 있습니다. 시작하려면 DataSync 에이전트를 배포하고, 원본 및 대상 스토리지 위치를 구성하고, 복사를 시작합니다.

Q: DataSync 에이전트를 배포하려면 어떻게 해야 합니까?

A: DataSync 에이전트를 VMware ESXi 하이퍼바이저 또는 Amazon EC2에 배포합니다. 온프레미스 NFS 서버에서 데이터를 복사하려면 AWS 콘솔에서 OVA를 다운로드하고 온프레미스 VMware ESXi 하이퍼바이저에 배포합니다. 클라우드 내 NFS 서버에서 데이터를 복사하려면 제공된 AMI에서 Amazon EC2 인스턴스를 생성하면 됩니다. 두 경우 모두 에이전트가 NFS 서버에 액세스할 수 있도록 에이전트를 배포해야 합니다.

Q: DataSync 에이전트에 대한 리소스 요구 사항은 무엇입니까?

A: 에이전트를 실행하는 데 필요한 최소 리소스는 여기에서 확인할 수 있습니다.

사용

Q: DataSync는 어떻게 사용합니까?

A: DataSync를 사용하려면 다음 세 단계를 수행합니다.

1. 에이전트 배포 - DataSync 에이전트를 배포하고 Management Console 또는 API를 통해 이를 AWS 계정과 연결합니다. 에이전트는 NFS 서버에 액세스하여 데이터를 읽거나 쓰는 데 사용됩니다.

2. 데이터 전송 작업 생성 - 데이터 원본 및 대상의 위치와 데이터 전송을 구성할 때 사용할 옵션(예: 메타데이터 복사)을 지정하여 작업을 생성합니다.

3. 전송 시작 - 작업을 시작하고 콘솔 또는 Amazon CloudWatch에서의 데이터 이동을 모니터링합니다.

Q: DataSync 작업을 어떻게 시작할 수 있습니까?

A: AWS Management Console 또는 AWS 명령줄 인터페이스(CLI)를 통해 작업을 시작하면 DataSync가 데이터를 복사합니다. 작업 실행 시마다 원본의 변경 사항을 스캔하고, 원본과 대상 사이에 차이가 있는 경우 복사를 수행합니다. 원본의 어떤 특성을 사용하여 변경 여부를 판단할지를 구성하고, 특정 파일 또는 폴더를 포함/제외하도록 필터를 정의하고, 대상의 파일 또는 객체가 원본에 없는 경우 삭제해야 하는지 여부를 제어할 수 있습니다.

Q: DataSync는 데이터 무결성 검증을 어떻게 수행합니까?

A: DataSync는 전송 도중 및 전송 완료 시에 데이터 무결성 검증을 수행합니다(원본 및 대상 파일 간 체크섬 비교, 파일 메타데이터 비교).

Q: DataSync에 의해 전송 중인 데이터의 상태를 어떻게 모니터링할 수 있습니까?

A: AWS Management Console 또는 CLI를 사용하여 전송 중인 데이터의 상태를 모니터링할 수 있습니다. Amazon CloudWatch 지표를 사용하여 복사된 파일 수 또는 데이터의 크기를 확인할 수 있습니다. Amazon CloudWatch Logs는 세부 오류 정보에 사용할 수 있습니다. 추가로 작업 전환 상태에 따라 CloudWatch Events가 트리거되고, 하위 워크플로의 자동화가 활성화됩니다. AWS Management Console 또는 CLI에서 이와 같은 전송 진행 상황의 추가 정보를 확인할 수 있습니다.

Q: Amazon S3와의 파일 전송 시 DataSync는 어떻게 파일과 객체 사이를 매핑합니까?

A: 파일이 객체로 복사될 때 파일과 객체 사이에는 일대일 관계가 존재합니다. 파일 시스템 메타데이터는 S3 사용자 메타데이터에 저장됩니다. 메타데이터는 파일 시스템 메타데이터를 보유하고 있는 객체가 파일로 다시 복사될 때 복원됩니다.

Q: 데이터 전송 시 DataSync에서 보존하는 메타데이터는 무엇입니까?

A: DataSync는 사용자 ID, 그룹 ID 및 권한과 같은 POSIX 메타데이터를 보존하여 메타데이터 손실 없이 파일이 원래 위치에 복원될 수 있도록 합니다. 추가로 파일의 POSIX 메타데이터를 S3의 객체에 저장할 때 메타데이터는 File Gateway와 상호 운용이 가능합니다.

Q: DataSync에서 버전 관리, 수명 주기, 교차 리전 복제 및 S3 이벤트 알림을 사용할 수 있습니까?

A: 예. 버전 관리, 수명 주기 관리, 교차 리전 복제 및 S3 이벤트 알림에 대한 버킷 정책이 DataSync를 통해 버킷으로 전송된 객체에 직접 적용됩니다.

버전 관리 사용 시 객체 메타데이터에 대한 변경은 객체의 새 버전을 생성합니다.

S3 수명 주기 정책을 사용하여 객체의 스토리지 계층을 변경하거나 오래된 객체 또는 객체 버전을 삭제할 수 있습니다.

Q: DataSync 작업이 중단된 경우 어떻게 됩니까?

A: 작업이 중단된 경우(예: 네트워크 연결이 끊어지거나 DataSync 에이전트가 재시작되는 경우) 다음 작업 실행 시 누락된 파일을 전송하고, 데이터는 실행 종료 시 완전하고 일관된 상태가 됩니다. 작업이 시작될 때마다 증분 복사를 수행하여 변경 사항만을 원본에서 대상으로 전송합니다.

Q: AWS Direct Connect를 통해 DataSync를 사용할 수 있습니까?

A: 예. Direct Connect 링크를 통해 DataSync를 사용하여 특별한 구성 없이 퍼블릭 인터넷 엔드포인트에 액세스할 수 있습니다.

Q: DataSync는 파일을 전송할 때 원본 디렉터리 구조를 유지합니까?

A: 예. DataSync는 파일을 전송할 때 원본 위치의 구조와 비슷한 디렉터리 구조를 대상에 생성합니다.

성능

Q: DataSync는 얼마나 빠르게 파일 시스템에서 AWS로 복사할 수 있습니까?

A: DataSync가 데이터 세트를 복사할 수 있는 속도는 데이터 크기, 원본 및 대상 스토리지에서 달성할 수 있는 I/O 대역폭, 사용 가능한 네트워크 대역폭 및 네트워크 상태에 따라 계산됩니다. 단일 DataSync 에이전트는 10Gbps 네트워크 링크를 포화 상태로 만들 수 있습니다.

Q: DataSync 작업에서 사용하는 네트워크 대역폭의 크기를 제어할 수 있습니까?

A: 예, 내장 대역폭 제한을 구성하여 DataSync에서 사용할 네트워크 대역폭의 크기를 제어할 수 있습니다. 이는 동일한 네트워크 연결을 사용하는 다른 사용자 또는 애플리케이션에 미치는 영향을 최소화하는 데 도움이 될 수 있습니다.

Q: DataSync가 원본 파일 시스템의 성능에 영향을 미칩니까?

A: 온프레미스 파일 스토어의 용량, 전송되는 파일의 수와 크기에 따라 DataSync는 동일한 원본 데이터 스토어에 액세스할 때 다른 클라이언트의 응답 시간에 영향을 미칠 수 있습니다. 이는 해당 스토리지 시스템에서 에이전트가 데이터를 읽거나 쓰기 때문입니다. 작업에 대한 대역폭 제한을 구성하면 스토리지 시스템에 대한 I/O 제한으로 이 영향을 줄일 수 있습니다.

보안 및 규정 준수

Q: 전송 및 저장되는 도중 데이터는 암호화됩니까?

A: 예. 원본과 대상 사이에서 전송되는 모든 데이터는 TLS(전송 계층 보안, SSL(보안 소켓 계층)을 대체)를 통해 암호화됩니다. DataSync 자체에는 데이터가 잔류하지 않습니다. 또한 S3 버킷에 대한 기본 암호화Amazon EFS 파일 시스템 저장 시 데이터 암호화 사용을 지원합니다.

Q: DataSync는 어떻게 NFS 파일 시스템에 액세스합니까?

A: DataSync는 사용자가 IT 환경 또는 Amazon EC2에 배포한 에이전트를 사용하여 NFS 프로토콜을 통해 파일 시스템에 액세스합니다. 이러한 에이전트는 AWS 내의 DataSync 서비스 엔드포인트에 연결되며, 활성화된 후에는 AWS Management Console 또는 CLI를 통해 안전하게 관리됩니다. 온프레미스에서 데이터를 복사하는 경우 VPN/터널을 설정하거나 인바운드 연결을 허용할 필요가 없으며, 에이전트는 표준 네트워크 포트를 사용하여 방화벽을 통해 라우팅하도록 구성될 수 있습니다.

Q: DataSync는 Amazon S3 버킷에 어떻게 액세스합니까?

A: DataSync는 사용자가 구성한 IAM 역할을 사용하여 Amazon S3 버킷에 액세스합니다.

Q: DataSync는 어떻게 Amazon EFS 파일 시스템에 액세스합니까?

A: DataSync는 NFS 프로토콜을 사용하여 Amazon EFS 파일 시스템에 액세스합니다. 이를 위해 DataSync는 DataSync 서비스에서 관리하는 ENI(탄력적 네트워크 인터페이스)를 통해 VPC 내에 파일 시스템을 탑재합니다. DataSync는 사용자를 대신하여 이러한 ENI의 생성, 사용 및 삭제를 완전히 관리합니다.

Q: DataSync에서 지원하는 규정 준수 프로그램은 무엇입니까?

A: AWS는 클라우드에서 가장 오래 실행 중인 규정 준수 프로그램을 보유하고 있으며 고객이 요구 사항을 처리할 수 있도록 도움을 드리고자 노력하고 있습니다. DataSync는 글로벌 및 업계 보안 표준을 충족하도록 평가를 받았습니다. AWS Backup은 HIPAA 적격 서비스이며, PCI DSS, ISO 9001, 27001, 27017, 27018, SOC 1, 2, 3도 준수합니다. 따라서 쉽게 보안을 검증하고 의무 사항을 충족할 수 있습니다. 자세한 내용 및 리소스는 AWS 규정 준수 페이지를 참조하십시오. 또한 규정 준수 프로그램 제공 범위 내 서비스 페이지에서 전체 서비스 및 인증서 목록을 확인할 수 있습니다.

Q: DataSync는 PCI를 준수합니까?

A: 예. DataSync는 PCI-DSS를 준수하고, 따라서 이를 사용하여 결제 정보를 전송할 수 있습니다. AWS Artifact에서 PCI 규정 준수 패키지를 다운로드하여 AWS에서의 PCI 규정 준수 달성 방법에 대한 자세한 내용을 알아볼 수 있습니다.

Q: DataSync는 HIPAA 적격 상태입니까?

A: 예. DataSync는 HIPAA 적격 상태입니다. 따라서 AWS와 HIPAA BAA를 체결한 경우 DataSync를 사용하여 PHI(개인 건강 정보)를 전송할 수 있습니다.

AWS DataSync 선택 시기

Q: DataSync는 rsync 또는 S3 sync 같은 명령줄 도구를 사용하는 것과 어떻게 다릅니까?

A: 명령줄 도구를 기반으로 제작된 DIY 솔루션과 달리, DataSync는 자동화된 완전관리형 데이터 전송을 수행합니다. 특별히 구축된 네트워크 프로토콜 및 스케일 아웃 아키텍처를 사용하여 최대 10배 빠른 속도로 데이터를 전송합니다.

특히, DataSync는 데이터 전송을 완전히 자동화합니다. 기본 제공되는 재시도 및 네트워크 복원력 메커니즘을 바탕으로 DataSync API 및 콘솔을 통해 CloudWatch 지표, 이벤트 및 로그를 모니터링하여 전송 프로세스를 세부적으로 파악할 수 있게 해 줍니다. DataSync는 전송 중에는 물론, 전송 종료 시에도 데이터 무결성 검증을 수행합니다. 또한 이 서비스는 대역폭 조절, 원본 권한 및 메타데이터 복사 같은 특정한 요구 사항을 충족하도록 유연한 구성을 지원합니다.

DataSync는 포괄적인 보안을 지원합니다. 원본과 대상 간에 전송되는 모든 데이터는 TLS를 통해 암호화되며, AWS 스토리지에 액세스할 때는 IAM 역할 같은 기본 제공되는 AWS 보안 메커니즘이 적용됩니다.

Q: AWS DataSync와 AWS Snowball Edge 중에서 선택할 때는 어떤 기준을 고려해야 합니까?

A: AWS Snowball Edge는 당장 AWS에 있는 데이터가 필요하지 않은 고객, 대역폭이 제한되어 있는 고객, 원격이나 연결되지 않았거나 제한된 환경에서 데이터를 전송하는 고객에게 적합합니다. DataSync는 활성 데이터 세트에 대한 온라인 마이그레이션, 지속적으로 생성되는 데이터에 대한 적시 전송 또는 비즈니스 연속성을 위한 복제가 필요한 고객에게 이상적입니다.

Q: AWS DataSync와 AWS Storage Gateway 중에서 선택할 때는 어떤 기준을 고려해야 합니까?

A: 온프레미스와 S3 또는 EFS 같은 AWS 스토리지 간에 데이터를 전송하려는 경우에는 DataSync를 사용합니다. DataSync는 일반적으로 스토리지 마이그레이션에 사용하거나, AWS에서 처리할 온프레미스 디바이스(예: 카메라 및 기기)에서 데이터를 적시에 반복해서 전송하는 경우에 사용합니다. 온프레미스에서 낮은 지연 시간으로 AWS의 데이터에 액세스하려는 경우에는 AWS Storage Gateway를 사용합니다. Storage Gateway는 대개 백업, 하이브리드 워크로드, 지연 시간이 중요한 온프레미스 애플리케이션, 사무실 간의 콘텐츠 배포, S3 객체의 파일 기반 액세스에 사용됩니다.

DataSync와 Storage Gateway의 파일 게이트웨이 구성을 함께 사용하는 경우 지연 시간이 중요한 애플리케이션에 온프레미스에서 계속 액세스할 수 있도록 하면서 온프레미스 스토리지를 AWS로 신속하게 이동할 수 있습니다.

Q: AWS DataSync와 Amazon S3 Transfer Acceleration 중에서 선택할 때는 어떤 기준을 고려해야 합니까?

A: 애플리케이션이 이미 Amazon S3 API에 통합되어 있고, S3로의 대용량 파일 전송을 위해 더 높은 처리량을 원할 경우 S3 Transfer Acceleration을 사용할 수 있습니다. 기존 스토리지 시스템(예: Network Attached Storage) 또는 변경될 수 없는 기기(예: DNA 시퀀서, 비디오 카메라)로부터 데이터를 전송하고자 하는 경우 또는 여러 개의 대상을 원하는 경우 DataSync를 사용할 수 있습니다. 또한 DataSync는 데이터 전송을 자동화 및 간소화합니다. 이를 위해 기본 제공 재시도 및 네트워크 복원력 메커니즘, 데이터 무결성 검증, 특정 요구을 충족하는 유연한 구성(예: 대역폭 조절, 원본 권한 및 메타데이터 복사) 같은 추가적인 기능을 제공합니다.

Q: AWS DataSync와 AWS Transfer for SFTP 중에서 선택할 때는 어떤 기준을 고려해야 합니까?

A: 현재 SFTP를 사용하여 타사와 데이터를 교환하는 경우 Transfer for SFTP를 활용하면 운영 부담을 줄이면서 Amazon S3에서 직접 SFTP를 통한 완전관리형 전송을 수행할 수 있습니다.

NFS, Amazon S3 그리고 Amazon EFS 간에 데이터를 자동으로 빠르게 전송하려면 DataSync를 사용하면 됩니다. DataSync는 활성 데이터 세트에 대한 온라인 마이그레이션, 지속적으로 생성되는 데이터에 대한 적시 전송 또는 비즈니스 연속성을 위한 복제가 필요한 고객에게 이상적입니다. 

마이그레이션에 DataSync 사용

Q: 마이그레이션에 DataSync를 사용하려면 어떻게 해야 합니까?

A: DataSync를 사용하여 온프레미스 스토리지에서 Amazon S3, Amazon EFS 및 WorkDocs로 마이그레이션할 수 있습니다. 권장되는 마이그레이션 흐름에 대한 자세한 내용은 여기에서 확인할 수 있습니다.

Q: DataSync를 사용하여 WorkDocs로 마이그레이션하려면 어떻게 해야 합니까?

A: DataSync는 WorkDocs Migration Service의 일부로 제공됩니다. DataSync를 사용하면 홈 디렉터리 및 부서 공유를 WorkDocs를 쉽고 빠르게 마이그레이션할 수 있습니다.

DataSync 요금에 대해 자세히 알아보기
요금에 대해 자세히 알아보기

AWS DataSync는 간단하고, 예측 가능한 사용량 기반 요금제를 갖추고 있습니다. 복사한 데이터의 크기에 대해서만 지불합니다.  

자세히 알아보기 
AWS 계정에 가입
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입 
콘솔에서 DataSync 시작하기
콘솔에서 데이터 이동 시작

AWS 콘솔에서 AWS DataSync 구축을 시작합니다.

로그인