참조 배포

Amazon SageMaker 및 AWS 기반 데이터 레이크를 사용한 예측적 데이터 과학

예측 및 규범적 애플리케이션을 구축하기 위한 데이터를 저장 및 변환

이 Quick Start에서는 Amazon Web Services (AWS) 클라우드에서 Amazon SageMaker를 사용하여 기계 학습(ML) 모델을 구축, 교육 및 배포하기 위한 데이터 레이크 환경을 구축합니다. 배포에는 약 10~15 분이 소요되며 Amazon Simple Storage Service(Amazon S3), Amazon API Gateway, AWS Lambda, Amazon Kinesis Data Streams, Amazon Kinesis Data Firehose와 같은 AWS 서비스가 사용됩니다.

Amazon SageMaker는 개발자와 데이터 과학자가 ML 모델을 빠르고 쉽게 구축, 교육 및 배포할 수 있는 관리형 플랫폼입니다.

이 Quick Start는 복잡한 ML 하드웨어 클러스터를 구성할 필요 없이 데이터의 파워로부터 비즈니스 가치를 위한 예측 및 규범적 모델을 구축하려는 사용자를 대상으로 합니다. 이는 원시 데이터에서 시작하여 프로덕션 시스템 내 예측 REST API에서 끝나는 엔드 투 엔드 데이터 과학을 구현합니다.

또한 Pariveda Solutions에서 개발한 데모 시나리오도 제공합니다. 이 데모는 Amazon S3에 원시 데이터를 저장하고, 데이터를 Amazon SageMaker에서 사용하기 위해 변환하고, Amazon SageMaker를 사용하여 ML 모델을 구축하고 Amazon Elastic Compute Cloud(Amazon EC2) 스팟 요금을 위해 API에서 모델을 호스팅하는 방법을 보여줍니다.

pariveda-data-lake-sagemaker-LP-logo

이 Quick Start는 Pariveda Solutions와 AWS가 공동으로 개발하였습니다. Pariveda는 APN 파트너입니다.

모든 AWS 솔루션 살펴보기 »
  •  구축할 내용
  •  배포 방법
  •  비용 및 라이선스
  •  리소스
  •  구축할 내용
  • 이 Quick Start 아키텍처는 다음을 구축합니다.

    • 원시, 모델링, 향상 및 변환된 데이터를 저장하기 위해, Amazon S3에 구조화된 데이터 레이크.
    • Amazon SageMaker로 수집될 주요 엔지니어링 및 변환된 데이터용 스테이징 버킷.
    • 사용 및 ML 모델 교육을 위해 원시 데이터를 준비하고 데이터 입력 및 출력을 변환하기 위해 AWS Lambda에 호스트되는 데이터 변환 코드.
    • 일정에 따라 실행되거나 데이터 레이크 내 데이터 변화에 의해 트리거되어 새로운 모델을 구축, 관리 및 그 REST 엔드포인트를 생성하는 Lambda를 통한 Amazon SageMaker 자동화.
    • 개발자가 애플리케이션에 대한 과거 데이터 또는 예측을 가져올 수 있도록 퍼블릭 API를 호스트하기 위한 Amazon API Gateway 엔드포인트.
    • 수집, 모델링, 향상 및 변환 단계에서 새로운 데이터를 실시간으로 처리하기 위한 Amazon Kinesis Data Streams.
    • 모델링 및 향상 단계의 결과를 내구적으로 저장하기 위해 Amazon S3로 전송하는 Amazon Kinesis Data Firehose.
    • 데이터 변환, 모델 교육 및 예측 엔드포인트 구성 요소 호스팅에 대한 모니터링을 제공하기 위한 Amazon CloudWatch 대시보드.
    • Jupyter 노트북을 사용한 데이터 탐색을 위한 AWS SageMaker 노트북 서버.
    • 각 처리 구성 요소에 최소 권한 원칙을 적용하기 위한 AWS Identity and Access Management(IAM). IAM 역할 및 정책은 필요한 리소스로만 액세스를 제한합니다.
    • 일별 Amazon Elastic Compute Cloud(Amazon EC2) 스팟 요금 예측 모델을 구축하고 업데이트하는 데모 시나리오.
  •  배포 방법
  • 몇 개의 간단한 단계를 통해 Amazon SageMaker 및 AWS 기반 데이터 레이크를 사용한 예측적 데이터 과학 환경을 약 10~15분에 구축할 수 있습니다.

    1. 아직 AWS 계정이 없다면 https://aws.amazon.com에서 등록하십시오.
    2. Quick Start를 시작합니다.
    3. (선택 사항) 제공된 데모 시나리오를 사용하여 배포를 테스트합니다.
    4. (선택 사항) 자체 ML 모델을 교육합니다.
  •  비용 및 라이선스
  • 이 Quick Start 참조 배포를 실행하는 동안 사용되는 AWS 서비스 비용은 고객이 부담해야 합니다. Quick Start 사용에 따르는 추가 비용은 없습니다.

    이 Quick Start에 대한 AWS CloudFormation 템플릿에는 사용자 지정할 수 있는 구성 파라미터가 포함되어 있습니다. 인스턴스 유형과 같은 일부 설정에 따라 배포 비용이 달라집니다. 예상 비용은 사용하게 될 각 AWS 서비스에 대한 요금 페이지를 참조하십시오. 요금은 변경될 수 있습니다.

    이 Quick Start는 기본 AWS 서비스를 사용하므로 추가 라이선스가 필요하지 않습니다.

  •  리소스
  • 이 Quick Start 참조 배포는 솔루션 개요, AWS Competency Partners가 제작한 옵션 컨설팅 제안 및 개념 증명(PoC) 프로젝트의 AWS 공동 투자가 포함되어 있는 Solution Space의 솔루션과 관련이 있습니다. 이 리소스에 대한 추가 정보가 필요한 경우 Solution Space를 방문하십시오.