게시된 날짜: Nov 30, 2022

오늘 AWS는 Amazon AppFlow와의 통합을 통해 기계 학습(ML)용 데이터 원본으로 40개 이상의 타사 애플리케이션에 대한 Amazon SageMaker Data Wrangler 지원의 정식 출시를 발표했습니다. Amazon SageMaker Data Wrangler는 기계 학습(ML)을 위해 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. ML용 고품질 데이터 준비는 여러 도구를 사용하여 다양한 원본과 형식에 걸쳐 데이터를 집계해야 하기 때문에 종종 복잡하고 시간이 많이 소요됩니다. SageMaker Data Wrangler를 통해 Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks 및 Salesforce Customer Data Platform 같은 다양한 인기 있는 원본에서 데이터를 알아보고 가져올 수 있습니다. 오늘부터 고객은 Amazon AppFlow를 통해 Salesforce Marketing, SAP, Google Analytics, LinkedIn 등을 포함하는 40개 이상의 타사 애플리케이션 데이터 원본에서 ML용 데이터를 보다 쉽게 집계할 수 있게 되었습니다. 

Amazon AppFlow는 고객이 타사 애플리케이션에서 Amazon S3 같은 AWS 서비스로 데이터를 안전하게 전송하고 클릭 몇 번만으로 데이터를 AWS Glue 데이터 카탈로그에 카탈로그화할 수 있는 완전관리형 서비스입니다. 데이터 원본이 AppFlow에 설정되면 Data Wrangler SQL 탐색기를 사용하여 데이터 원본에서 테이블 및 스키마를 찾아볼 수 있습니다. Athena 쿼리를 작성하여 사용 사례와 관련이 있는지 확인하기 위해 데이터를 미리 보고 데이터를 가져와 ML 모델 훈련을 준비할 수 있습니다. 또한 가져온 후 여러 소스의 데이터를 합쳐 ML에 맞는 적당한 데이터 세트를 생성할 수 있습니다. 데이터를 가져오면 데이터 품질을 신속하게 파악하고, 데이터를 정리하고, 300개 이상의 기본 제공 분석 및 데이터 변환으로 기능을 생성합니다. 또한 SageMaker Autopilot으로 모델을 훈련 및 배포하고, Data Wrangler의 SageMaker Pipeline과의 통합을 사용하여 기능 엔지니어링, 훈련 또는 배포 파이프라인에서 데이터 준비 프로세스를 운영할 수 있습니다.

Data Wrangler는 현재 AppFlow가 제공되는 모든 리전에서 40개 이상의 타사 데이터 원본을 지원합니다. 이 기능은 Data Wrangler 및 AppFlow 비용 외에 추가 비용 없이 사용할 수 있습니다.