게시된 날짜: Oct 14, 2021
Amazon SageMaker Data Wrangler는 기계 학습(ML)을 위해 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. SageMaker Data Wrangler를 통해 데이터 준비 및 특성 추출 프로세스를 간소화하고 단일 시각적 인터페이스에서 데이터 선택, 정리, 탐색 및 시각화를 포함한 데이터 준비 워크플로의 모든 단계를 완료할 수 있습니다.
오늘부터 Wrokgroups를 사용하여 Amazon Athena에서 데이터 쿼리, 데이터 집합에 대한 다중 키 조인 활성화, 상관관계 및 중복 행 시각화, 데이터 흐름 내보내기 시 고객 관리형 키 제공을 수행할 수 있어 기계 학습용 데이터 준비가 쉽고 빨라집니다. 다음은 이러한 기능에 대한 자세한 설명입니다.
- Athena Workgroups 지원. Amazon Athena Workgroups는 동일한 AWS 계정을 이용하는 사용자, 팀 또는 애플리케이션 간에 쿼리 실행 및 쿼리 기록을 분리하는 데 사용할 수 있는 리소스 유형입니다. 오늘부터 사용자는 선택한 Workgroup을 사용해 SageMaker Data Wrangler에서 Athena를 사용하여 데이터를 쿼리할 수 있습니다.
- 데이터 준비를 돕는 두 가지 새로운 시각화:
- SageMaker Data Wrangler의 특성 상관관계 시각화를 사용하여 사용자는 쉽게 데이터 집합의 특성 상관관계를 계산해서 상관관계 매트릭스로 시각화할 수 있습니다.
- 새로운 중복 행 감지 시각화 기능을 사용하여 사용자는 데이터 집합에 중복 행이 있는지를 빠르게 감지할 수 있습니다.
- 다중 키 조인. SageMaker Data Wrangler에서 두 개의 데이터 집합을 함께 조인할 때 여러 열을 지정하고 SageMaker Data Wrangler 흐름 내에서 중간 단계를 삭제할 수 있습니다.
- Amazon Key Management Servce(KMS)를 사용해 고객 관리형 키(CMK) 지원. 오늘부터 ‘S3로 내보내기’ 기능과, SageMaker Data Wrangle 내에서 내보낸 노트북을 사용할 때 KMS 키를 지정할 수 있습니다.
Amazon SageMaker Data Wrangler의 새로운 기능을 시작하려면 Amazon SageMaker Studio를 최신 릴리스로 업그레이드한 후 열고 메뉴에서 파일 > 새로 만들기 > 흐름을 클릭하거나 SageMaker Studio 시작 관리자에서 ‘새 데이터 흐름’을 클릭합니다. 새로운 기능에 대한 자세한 사항은 설명서를 참조하세요.