게시된 날짜: Oct 23, 2023
Amazon SageMaker 특성 저장소는 사용자 지정 데이터 소스를 특성 처리 파이프라인에 통합하는 기능을 지원합니다. 따라서 사용자는 다양한 데이터 소스를 통합하고 수행할 변환 함수를 정의하여 더 풍부하고 다양한 ML 기능을 구축할 수 있으며, SageMaker 특성 저장소가 데이터를 ML 특성으로 처리합니다.
이번 출시로 Amazon Kinesis와 같은 스트리밍 데이터 소스에 연결하고, 실시간 데이터 처리를 위한 확장 가능하고 내결함성을 갖춘 스트림 처리 엔진인 Spark Structured Streaming을 사용하여 변환을 작성할 수 있습니다. 아울러 배치 특성 처리를 위해 Amazon Redshift, Snowflake 및 Databricks와 같은 데이터 웨어하우스에 연결하고, 일정에 따라 또는 Amazon EventBridge 규칙을 사용한 트리거로 특성 처리를 시작할 수 있습니다. Amazon SageMaker 특성 저장소는 파이프라인을 생성 및 관리하고 ML 모델 제공 및 훈련에 사용할 특성 그룹에 기록합니다. 파이프라인 실행을 추적하고, 계보를 시각화하여 데이터 소스까지 특성을 추적하고, 특성 처리 코드를 보는 등의 작업을 모두 Amazon SageMaker Studio의 단일 환경에서 수행할 수 있습니다.
자세한 내용은 여기에서 설명서를 확인하세요. 시작하려면 Amazon SageMaker 콘솔에서 SageMaker Studio로 이동하세요.