게시된 날짜: Jul 25, 2023
이제 Amazon SageMaker Canvas는 5개의 새로운 데이터 변환 기능을 지원하므로 기계 학습(ML) 모델을 구축하기 전에 보다 효과적으로 데이터를 준비하고 분석할 수 있습니다. 데이터는 기계 학습의 기반으로, 더 나은 인사이트를 얻기 위해 원시 데이터를 ML 모델 구축에 적합하도록 변환하고 예측을 생성하는 것이 중요합니다. 오늘부터 SageMaker Canvas를 통해 열의 데이터 유형을 숫자, 텍스트 및 날짜 시간으로 변경하고 해당 데이터 유형(예: 이진 및 범주)에 대한 관련 기능도 표시할 수 있습니다. 따라서 기능을 기반으로 열의 데이터 유형을 수동으로 유연하게 변경할 수 있습니다. 올바른 데이터 유형을 선택하는 기능을 통해 ML 모델을 구축하기 전에 데이터 무결성과 정확성이 보장됩니다. 예를 들어 날짜 시간 데이터 유형을 사용하면 유효한 날짜만 해당하는 열에 저장됩니다.
또한 Canvas를 사용하면 시계열 데이터를 다시 샘플링하여 시계열 데이터 세트의 정기적인 관찰 간격을 설정할 수 있습니다. 이는 시계열 데이터에 불규칙한 간격의 관찰이 포함된 경우 특히 유용합니다. 이 데이터를 다시 샘플링하면 일정한 시간 간격 사이에 동일한 간격을 두는 데 도움이 되므로 분석 및 예측과 같은 다운스트림 작업에 유용합니다. 마지막으로 Canvas는 이제 오름차순 또는 내림차순으로 정렬하고, 행을 임의로 섞고, 중복된 행을 삭제하는 기능 등의 더 나은 방법으로 데이터의 행을 관리합니다.
이러한 새로운 데이터 변환 기능은 현재 Canvas가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 자세한 내용은 제품 설명서를 참조하세요.