Amazon SageMaker Canvas, 이제 ML을 위한 데이터 흐름 가져오기 및 더 빠른 데이터 준비 지원
이제 Amazon SageMaker Canvas의 Amazon SageMaker Data Wrangler는 Amazon SageMaker Studio Classic에서 데이터 흐름 가져오기는 물론 기계 학습(ML)을 위한 더 빠르고 유연한 데이터 준비를 지원합니다. SageMaker Canvas의 SageMaker Data Wrangler 최신 버전을 통해 이제 사용자 지정 구분 기호 및 더 많은 샘플링 옵션을 사용하여 S3에서 데이터를 더 쉽게 가져오고 향상된 성능으로 데이터를 준비할 수 있습니다. 또한 변환을 더 빠르게 검증하고 데이터 레시피를 손쉽게 반복할 수 있습니다. 아울러 SageMaker Canvas의 최신 데이터 준비 기능과 개선 사항을 활용하도록 SageMaker Studio Classic에서 데이터 흐름을 가져올 수도 있습니다.
대량의 데이터를 집계, 분석, 변환하는 것은 매우 반복적인 프로세스이기 때문에 ML 프로젝트에서 가장 시간이 많이 소요되는 부분입니다. 이러한 새로운 개선 사항을 통해 top-k, 랜덤 또는 층화 샘플링과 같은 여러 샘플링 방법을 사용하여 데이터를 가져오고, 필요에 따라 샘플 크기와 방법을 조정하여 대표 샘플을 얻을 수 있습니다. 짧아진 지연 시간으로 데이터를 변환하고, 변환이 데이터 크기에 미치는 영향을 빠르게 검증하고, 필요에 따라 단계를 재정렬할 수 있습니다. 그뿐만 아니라 데이터 레시피를 복사하고 데이터 소스를 교체하여 다른 데이터세트 및 모델에 재사용할 수 있습니다. 마지막으로 클릭 한 번으로 모든 기존 데이터 흐름을 SageMaker Studio Classic의 SageMaker Data Wrangler에서 SageMaker Canvas로 가져오거나, S3 또는 로컬 파일 업로드를 통해 특정 데이터 흐름을 수동으로 가져올 수 있습니다.
이러한 향상된 데이터 준비 기능은 SageMaker Canvas가 지원되는 모든 AWS 리전에서 사용할 수 있습니다. 자세한 내용은 블로그와 AWS 기술 설명서를 참조하세요.