게시된 날짜: Dec 8, 2020
Amazon Redshift ML은 데이터 분석가, 데이터베이스 개발자, 데이터 사이언티스트 등 데이터 웨어하우스 사용자가 익숙한 SQL 명령을 사용하여 기계 학습(ML) 모델을 생성, 훈련 및 배포할 수 있게 해줍니다. Amazon Redshift는 가장 널리 사용되는 클라우드 데이터 웨어하우스이며, Amazon Redshift ML을 통해 이제 데이터를 이전하거나 새로운 기술을 학습하지 않고도 SQL을 사용하여 완전 관리형 기계 학습 서비스인 Amazon SageMaker를 활용할 수 있습니다.
Amazon SageMaker를 기반으로 한 Amazon Redshift ML을 통해 SQL 문을 사용하여 Amazon Redshift의 데이터에서 기계 학습 모델을 생성 및 훈련한 후, 이러한 모델을 쿼리 및 보고서에서 직접 이탈 예측 및 사기 위험 점수 등의 사용 사례에 사용할 수 있습니다. Amazon Redshift ML은 Amazon SageMaker Autopilot을 사용하여 훈련 데이터를 기반으로 최상의 모델을 자동으로 검색하고 조정합니다. SageMaker Autopilot은 최상의 회귀, 이진 또는 다중 클래스 분류 및 선형 모델 중에서 선택합니다.
또는 XGBoost(Xtreme Gradient Boosted tree) 같은 모델 유형, 회귀 또는 분류 같은 문제 유형, 전처리기 또는 하이퍼파라미터를 선택할 수 있습니다. Amazon Redshift ML은 파라미터를 사용하여 Amazon Redshift 데이터 웨어하우스에서 모델을 구축, 훈련 및 배포합니다. 사용자 정의 함수(UDF)를 호출하는 것처럼 SQL 쿼리를 사용하여 이러한 훈련된 모델에서 예측을 얻고 대규모 병렬 처리 기능 등 Amazon Redshift의 모든 이점을 활용할 수 있습니다.
Amazon Redshift ML은 기존 클러스터 리소스를 예측에 활용하므로 추가 Amazon Redshift 요금을 피할 수 있습니다. 모델 생성이나 사용에 대한 추가 Amazon Redshift 요금이 없으며, 예측은 Amazon Redshift 클러스터에서 로컬로 발생하므로 클러스터 크기를 조정해야 하는 경우 외에는 추가 비용을 지불할 필요가 없습니다. Amazon Redshift ML은 모델을 훈련시키는 데 Amazon SageMaker를 사용하며, 여기에는 관련된 추가 비용이 있습니다. 자세한 내용은 Redshift 요금 페이지를 참조하세요.