게시된 날짜: Oct 6, 2021
Amazon SageMaker Data Wrangler는 기계 학습(ML)을 위해 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. SageMaker Data Wrangler를 통해 데이터 준비 및 특성 추출 프로세스를 간소화하고 단일 시각적 인터페이스에서 데이터 선택, 정리, 탐색 및 시각화를 포함한 데이터 준비 워크플로의 모든 단계를 완료할 수 있습니다.
오늘부터 새로운 시계열 변환 세트와, 사용자 시계열 데이터로부터 인사이트를 빠르게 생성할 수 있는 두 가지 새로운 시계열 시각화를 포함해 Amazon SageMaker Data Wrangler의 신규 기능을 사용하여 기계 학습 데이터를 더 쉽고 빠르게 준비할 수 있습니다. 새로운 시계열 변환은 결측값 대체, 시계열의 기능화(예: 푸리에 계수, 자기상관 통계, 엔트로피 등), 데이터 세트를 균일 빈도, 시간 지연 특징, 롤링 윈도 함수로 다운샘플링 또는 업샘플링하는 연산자 리샘플링을 지원합니다. 이 새로운 변환은 벡터 값 열의 그룹화, 길이 통합, 평면화(flattening), 내보내기 등 일반적인 작업도 지원합니다.
추가로 Amazon SageMaker Data Wrangler에서 새로운 시계열 시각화를 사용해 데이터의 계절적 변동과 추세를 시각화하고 이상을 식별할 수 있습니다. 예를 들어 계절적 변동과 추세 시각화가 있으면 영업 데이터에서 계절 영향을 추세에서 분리할 수 있습니다. 추가로 이상값 감지 시각화를 통해 고객 구매 데이터 세트 내에서 이상값을 식별해 고객 구매 행동에서 변경 사항을 감지할 수 있습니다.
Amazon SageMaker Data Wrangler의 새로운 기능을 시작하려면 Amazon SageMaker Studio를 최신 릴리스로 업그레이드한 후 열고 메뉴에서 파일 > 새로 만들기 > 흐름을 클릭하거나 SageMaker Studio 시작 관리자에서 ‘새 데이터 흐름’을 클릭합니다. 새로운 시계열 변환과 시각화에 대해 자세히 알아보려면 설명서를 참조하세요.