게시된 날짜: Dec 16, 2022
Amazon SageMaker 특성 저장소는 오늘 오프라인 저장소를 위한 SageMaker Python SDK 지원을 발표합니다. Amazon SageMaker 특성 저장소는 기계 학습(ML) 특성을 저장, 업데이트, 검색 및 공유하기 위한 완전 관리형의 특수 목적용 리포지토리입니다. SageMaker 특성 저장소의 오프라인 저장소에는 이전 ML 기능이 포함되어 있으며, 이를 사용하여 훈련 및 배치 추론을 위한 훈련 데이터 세트를 생성할 수 있습니다. 지금까지는 Athena와 Glue를 사용하고 임시 SQL 쿼리를 작성하여 이러한 훈련 데이터 세트를 생성해야 했습니다.
이번 릴리스에서는 Python SDK 메서드를 사용하여 훈련 데이터 세트를 만들 수 있습니다. SDK를 사용하여 데이터를 데이터프레임으로 읽거나 csv로 내보낼 수 있습니다. 복잡한 SQL 쿼리를 작성하는 대신 기능 그룹 가입, 시간 이동(Time Travel), 적시의 정확한 조인 생성, 학습 데이터 세트의 중복 레코드 필터링과 같은 일반적인 오프라인 저장소 사용 사례에서 이러한 메서드를 호출할 수 있습니다.
자세히 알아보려면 여기에서 설명서를 확인하세요. 시작하려면 Amazon SageMaker 콘솔에 로그인하세요.