게시된 날짜: Apr 7, 2021
이제 AWS Glue는 불완전한 데이터 집합에서 누락된 값 대체를 제공합니다. 누락된 값 채우기 변환을 사용하면 데이터 열에서 빈 항목에 대한 예측된 값을 가져올 수 있습니다. 이 기능을 사용하면 null 또는 빈 값을 포함하는 데이터 집합을 쉽게 정리할 수 있으므로 쿼리 시간에 이를 고려하지 않아도 됩니다.
누락된 값 채우기는 데이터 집합의 전체 행에서 패턴을 학습하고 지정한 열에서 누락된 데이터의 값을 예측하는 AWS Glue의 새로운 기계 학습 변환입니다. 이 기능은 테이블 형식의 데이터 집합에서 범주 및 숫자 데이터 모두에 작동하며, AWS Glue에서 데이터 집합에 추가하는 전체 열을 생성하기 위해 기존 및 기계 학습 방법을 조합해 사용합니다. 누락된 값 채우기를 시작하는 가장 쉬운 방법은 AWS Glue Studio의 변환 목록에서 선택하는 것입니다.
누락된 값 채우기 변환은 AWS Glue와 동일한 AWS 리전에서 사용할 수 있습니다.
이 기능에 대한 자세한 내용은 참조 설명서 및 AWS Glue Studio 설명서를 참조하세요.