게시된 날짜: Jun 8, 2021
Amazon SageMaker Data Wrangler는 기계 학습(ML)을 위해 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. SageMaker Data Wrangler를 통해 데이터 준비 및 특성 엔지니어링 프로세스를 간소화하고 단일 시각적 인터페이스에서 데이터 선택, 정리, 탐색 및 시각화를 포함한 데이터 준비 워크플로의 모든 단계를 완료할 수 있습니다. 오늘부터 Amazon SageMaker Data Wrangler에서 Snowflake를 데이터 원본으로 사용하여 기계 학습을 위해 Snowflake에서 데이터를 쉽게 준비할 수 있습니다.
Snowflake를 Amazon SageMaker Data Wrangler의 데이터 원본으로 사용하면 이제 코드 한 줄 쓰지 않고도 쉽고 빠르게 Snowflake에 연결할 수 있습니다. 또한 이제 Amazon S3에 저장된 데이터와 Amazon Athena 및 Amazon Redshift를 통해 쿼리된 데이터를 Snowflake의 데이터에 결합하여 기계 학습을 위한 데이터를 준비할 수 있습니다. 연결되면, Snowflake에 저장된 데이터를 대화식으로 쿼리하고, 300개 이상의 사전 구성된 데이터 변환을 통해 데이터를 쉽게 변환하고, 데이터를 이해하며, 사전 구성된 강력한 시각화 템플릿 세트를 사용하여 잠재적인 오류와 극단값을 식별할 수 있습니다. 모델을 프로덕션으로 배포하기 전에 데이터 준비 워크플로에서 불일치 항목을 빠르게 식별하고 문제를 진단할 수 있습니다. 마지막으로 데이터 준비 워크플로를 Amazon S3로 내보내 Amazon SageMaker Autopilot, Amazon SageMaker Feature Store 및 Amazon SageMaker Pipeline과 같은 다른 SageMaker 기능과 함께 사용할 수 있습니다.