게시된 날짜: Aug 27, 2019
Amazon SageMaker는 이제 SageMaker에서 머신 러닝 모델을 교육하기 위한 데이터 소스로 Amazon Elastic File System(Amazon EFS) 및 Amazon FSx for Lustre 파일 시스템을 지원합니다. Amazon FSx for Lustre는 머신 러닝, 분석 및 고성능 컴퓨팅과 같은 워크로드에 최적화된 고성능 파일 시스템입니다. Amazon EFS는 Linux 기반의 워크로드를 AWS 클라우드 서비스와 온프레미스 리소스에서 사용할 수 있도록 간단하고 확장 가능하며 탄력적인 파일 시스템을 제공합니다. Amazon SageMaker를 사용하면 이러한 파일 시스템에 대한 지원을 통해 데이터세트가 포함된 모델의 교육을 가속화하고 간소화할 수 있습니다. 파일 시스템 데이터 소스를 사용하여 교육 프로세스의 데이터 다운로드 단계를 제거하고 파일 시스템의 다양한 성능 및 처리량 이점을 활용하여 교육 작업을 더 빨리 실행함으로써 시작 시간을 줄입니다.
현재까지 Amazon SageMaker는 파일 입력 모드를 사용하는 경우 교육 작업 시작 시 전체 교육 세트를 Amazon S3에서 로컬 파일 스토리지로 투명하게 다운로드했습니다. 이제 고객은 Amazon FSx for Lustre를 통해 초기 Amazon S3 다운로드 시간을 없앰으로써 파일 모드 교육 작업을 가속화할 수 있습니다. Amazon FSx for Lustre 파일 시스템이 Amazon S3 버킷에 연결된 경우 객체에 처음 액세스할 때 Amazon S3에서 파일 시스템으로 객체가 자동으로 복사됩니다. 또한 여러 SageMaker 작업에서 동일한 FSx 파일 시스템을 사용할 수 있으므로 공통 객체의 반복 다운로드를 방지할 수 있습니다.
또한 현재까지 고객은 Amazon S3에 저장된 교육 세트가 있는 Amazon SageMaker만 사용할 수 있었습니다. 이제 고객은 Amazon EFS에 저장된 교육 세트를 사용할 수도 있습니다. Amazon SageMaker가 Amazon EFS와 직접 상호 작용하므로 Amazon SageMaker와 함께 사용하기 위해 Amazon EFS에서 Amazon S3으로 데이터세트를 복사할 필요가 없습니다.
대부분의 Amazon SageMaker 내장 머신 러닝 알고리즘은 입력 데이터 소스로 EFS 및 FSx for Lustre를 지원합니다. 이 기능은 해당 파일 시스템을 사용할 수 있는 모든 리전에서 사용할 수 있습니다. 리전 가용성에 대한 자세한 내용은 AWS 리전 표를 확인하십시오.