게시된 날짜: Nov 7, 2022
Amazon SageMaker Canvas가 고급 데이터 분석을 위해 상관 관계 행렬을 지원함에 따라, ML 모델을 구축하기 전에 데이터로부터 인사이트를 얻을 수 있는 기능이 확대됩니다. SageMaker Canvas는 시각적 포인트 앤 클릭 인터페이스로, 기계 학습 경험이 없는 비즈니스 분석가도 코드를 작성할 필요 없이 정확한 ML 예측을 스스로 생성할 수 있도록 합니다.
SageMaker Canvas에서는 새로운 기능과 상자 그림, 막대 그래프 및 산점도를 통한 데이터의 시각적 탐색을 정의하고 생성하기 위해 수학 함수 및 연산자를 사용하여 표준 및 사용자 지정 값으로 누락된 값 및 이상치를 산입하는 기능과 같은 데이터를 분석 및 살펴보는 기능이 제공됩니다. 오늘부터 지원되는 SageMaker Canvas의 상관 관계 행렬을 통해 고객은 데이터 세트를 두 개 이상의 값 사이의 상관 관계 및 서로 어떤 관계가 있는지 보여주는 행렬로 요약할 수 있게 되었습니다. 이를 통해 고객은 고급 분석을 위해 지정된 데이터 세트의 패턴을 식별하고 시각화할 수 있습니다.
이제 숫자, 범주 및 두 변수의 조합에 대한 상관 관계 행렬을 생성할 수 있습니다. 숫자 값의 경우 Pearson 또는 Spearman 상관 관계를 사용하거나 범주 값의 경우 상호 정보를 사용하여 데이터 세트를 분석할 수 있으므로 향상된 선택폭과 유연성을 누릴 수 있습니다. 이러한 행렬의 결과는 누락된 값을 산입하고, 차이를 이해하기 위해 값에 가중치를 할당하고, 기타 고급 분석을 수행하는 데 사용될 수 있습니다. 상관 관계 행렬은 수요와 공급을 기반으로 가격 차이를 분석하고, 날씨 패턴을 기반으로 비의 양을 예측하고, 제품 및 서비스의 새로운 기능을 바탕으로 구매 성향을 파악하는 등 많은 사용 사례에 적용될 수 있습니다.