게시된 날짜: Dec 8, 2020
Amazon SageMaker Data Wrangler는 기계 학습(ML)을 위해 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. Amazon SageMaker Data Wrangler를 통해 데이터 준비 및 피처 엔지니어링 프로세스를 간소화하고 단일 시각적 인터페이스에서 데이터 선택, 정리, 탐색 및 시각화를 포함한 데이터 준비 워크플로의 모든 단계를 완료할 수 있습니다.
대부분의 ML 모델의 경우, 다양한 소스의 데이터를 집계 및 준비하는 데 몇 주 또는 몇 달이 소요될 수 있습니다. 여기에는 원시 데이터를 모델을 훈련하고 예측하기 위해 사용할 수 있는 기능으로 전환, 변환 및 확인하는 모든 과정이 포함됩니다. 작성자 데이터 변환에 대해 코드를 작성해야 하므로 모델에 효율적으로 사용할 수 있는 형식으로 데이터를 변환할 수 있으며, 대규모 데이터 소스에서 실행할 수 있는 추가 코드를 작성하면 부가 가치가 더욱 높은 작업에 시간을 효과적으로 사용할 수 있습니다.
Amazon SageMaker Data Wrangler의 데이터 선택 도구를 사용하면 여러 데이터 소스(예: Amazon S3, Amazon Athena, Amazon Redshift, AWS Lake Formation 및 Amazon SageMaker Feature Store)에서 데이터를 선택해 단 한 번의 클릭으로 내보낼 수 있습니다. Amazon SageMaker Data Wrangler에는 300개가 넘는 기본 제공 데이터 변환이 포함되어 있어서, 코드를 작성하지 않고도 빠르게 피처를 정규화하고 변환하며 결합할 수 있습니다. Amazon SageMaker Data Wrangler의 시각화 템플릿을 사용하면 ML을 위해 처음으로 완벽하게 통합된 개발 환경(IDE)인 Amazon SageMaker Studio에서 템플릿을 보며 이러한 변환이 의도한 대로 완료되었는지 빠르게 미리 보고 검사할 수 있습니다. 데이터가 준비되면 Amazon SageMaker Pipelines에서 완벽하게 자동화된 ML 워크플로를 구축하고 Amazon SageMaker Feature Store에서 재사용하도록 저장할 수 있습니다.
Amazon SageMaker Studio가 제공되는 모든 리전에서 Amazon SageMaker Data Wrangler를 사용할 수 있습니다. Amazon SageMaker Data Wrangler를 시작하려면 설명서를 참조하세요.