SageMaker Canvas, 페타바이트 규모에서 노코드 ML 및 데이터 준비 지원
Amazon SageMaker Canvas는 이제 기업이 페타바이트 규모의 데이터세트 지원을 활성화하여 데이터의 잠재력을 최대한 활용할 수 있도록 합니다. 오늘부터 대규모 데이터세트를 대화형 방식으로 준비하고, 엔드 투 엔드 데이터 흐름을 생성하고, 페타바이트 규모로 AutoML 실험을 트리거할 수 있습니다. 이는 이전 5GB 제한에서 크게 증가한 수치입니다. 50개 이상의 커넥터, 직관적인 “데이터와의 채팅” 인터페이스 및 페타바이트 지원으로 Canvas는 실제 기업 사용 사례를 처리하기 위해 확장 가능한 로우코드/노코드 ML 솔루션을 제공합니다.
오늘부터 Canvas는 무작위 및 층화 방식과 같은 새로운 샘플링 기술을 지원하여 10배 증가한 수치인 최대 20만 행의 샘플링을 허용합니다. 이를 통해 EMR Serverless와의 새롭고 원활한 통합을 활용하여 전체 데이터세트를 처리하기 전에 대화형 방식으로 데이터 품질 인사이트를 수집하고 데이터 변환의 영향을 쉽게 이해할 수 있습니다. Canvas는 EMR Serverless에 대한 샘플링, 준비, 모델 구축 및 추론 전반에서 5GB 이상의 데이터 처리를 자동으로 확장하여 직관적인 환경을 통해 데이터의 예측 잠재력을 최대한 활용합니다. EMR Serverless를 사용하면 추가 EMR 요금 비용이 발생합니다.
새로운 페타바이트 지원 및 개선된 대화형 환경은 SageMaker Canvas가 제공되는 모든 AWS 리전에서 사용할 수 있습니다.
노코드 ML 및 대규모 데이터세트의 데이터 준비를 시작하려면 기술 설명서를 사용하여 Canvas 도메인 및 사용자 프로필에서 “대규모 데이터 처리 구성”을 활성화하고 AWS 기계 학습 블로그에서 새로운 기능을 사용하는 방법에 대해 알아보세요. 기존 사용자는 설명서에 따라 SageMaker 도메인 설정을 업데이트하고, Canvas 워크스페이스에서 로그아웃한 다음 다시 로그인하여 최신 버전에 액세스해야 합니다.