게시된 날짜: Aug 21, 2023
이제 Amazon SageMaker Data Wrangler는 데이터를 미리 보고 SageMaker Data Wrangler로 가져올 수 있는 S3 액세스 포인트와 SageMaker Data Wrangler에서 내보낸 데이터의 대상으로 S3 액세스 포인트를 지원합니다. ML용으로 고품질 데이터를 준비하기 위해서는 여러 도구를 사용하여 다양한 소스와 형식의 데이터를 집계해야 하므로 복잡하고 시간이 오래 걸리는 경우가 대부분입니다. SageMaker Data Wrangler를 사용하면 Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks 및 40개 이상의 SaaS 데이터 소스 등 널리 사용되는 다양한 소스에서 데이터를 탐색하고 가져올 수 있습니다. Amazon S3를 사용하여 공유 데이터 세트를 저장하는 고객이 많아지고 있습니다. 이때 데이터는 여러 애플리케이션, 팀 및 개인이 집계 및 액세스하게 됩니다. 조직은 S3 액세스 포인트를 통해 세부적인 수준에서 세분화된 액세스 제어를 허용할 수 있습니다. 즉, 단일 버킷 정책을 수정하는 대신, 특정 사용 사례에 맞게 조정된 개별 정책을 사용하여 여러 액세스 포인트를 생성함으로써 잘못된 구성이나 민감한 데이터에 대한 의도하지 않은 액세스의 위험을 줄일 수 있습니다. 오늘부터 SageMaker Data Wrangler를 사용하면 고객은 S3에 저장된 공유 데이터 세트에서 데이터를 더 쉽게 준비하고 조직은 조직 내 데이터 액세스를 안전하게 제어할 수 있습니다.
데이터를 가져오면 300개 이상의 기본 제공 분석 및 데이터 변환을 활용하여 데이터 품질을 신속하게 파악하고, 데이터를 정리하고, 기능을 생성할 수 있습니다. 또한 SageMaker Autopilot으로 모델을 훈련 및 배포하고, Data Wrangler의 SageMaker Pipeline과의 통합을 사용하여 특성 추출, 훈련 또는 배포 파이프라인에서 데이터 준비 프로세스를 운영화할 수 있습니다.
SageMaker Data Wrangler는 현재 Data Wrangler가 제공되는 모든 리전에서 Amazon S3 액세스 포인트를 지원합니다. 자세한 내용은 AWS 기술 설명서를 참조하세요.