게시된 날짜: Sep 29, 2022
이제 Amazon SageMaker Canvas에서 더욱 다양한 데이터를 탐색할 수 있도록 수학 함수와 연산자가 지원되므로 데이터에서 새 특성을 정의할 수 있습니다. 시각적 포인트 앤 클릭 서비스인 SageMaker Canvas에서는 기계 학습 경험이 없는 비즈니스 분석가도 코드를 작성할 필요 없이 정확한 ML 예측을 직접 생성할 수 있습니다.
SageMaker Canvas는 데이터 세트 필터링/조인/수정을 위한 여러 가지 데이터 변환, 그리고 데이터 내의 변수 간 관계 파악을 위한 고급 시각화를 지원합니다. 오늘부터는 이러한 데이터 변환에서 수학 함수와 논리 연산자를 사용해 ML 모델을 구축하기 전에 데이터 분포를 더욱 정확하게 파악할 수 있습니다. 이러한 함수와 연산자의 결과를 활용하면 새 특성을 생성하여 특정 속성용으로 시각화할 수 있습니다. 지원되는 수학 함수는 더하기, 빼기, 곱하기, 나누기, 평균, 표준 편차, 변형, 지수, 로그입니다. 또한 SageMaker Canvas는 특정 조건 정의를 위한 is-then-else 문과 같은 논리 연산자도 지원하므로 데이터를 더욱 유동적으로 파악/분산/탐색할 수 있습니다.
SageMaker Canvas에서 이 새로운 기능을 사용하면 데이터 전처리 기술인 비닝을 수행할 수 있습니다. 비닝을 수행하면 관련 숫자 또는 범주 값을 더 적은 수의 세트인 ‘빈(bin)’으로 그룹화할 수 있습니다. 예를 들어 가구 품목을 추적하는 데이터 세트가 있다면 사무용 가구, 거실 가구, 침실 가구 등의 여러 빈에 가구 품목을 그룹화할 수 있습니다. 비닝을 수행하면 데이터 세트의 이상치와 잘못된 값을 식별할 수 있으며 비선형성을 줄일 수 있으므로 ML 모델의 정확도가 높아집니다.