참조 배포

AWS 기반 Databricks

데이터 과학, 기계 학습 및 분석을 위한 협업 WorkSpace

이 파트너 솔루션은 Databricks API를 사용하여 Amazon Web Services(AWS) 클라우드에 Databricks WorkSpaces를 만들려는 IT 인프라 아키텍트, 관리자 및 DevOps 전문가를 대상으로 합니다. 이 파트너 솔루션은 AWS 계정에 새 WorkSpace를 만들고 더 많은 WorkSpace를 배포하기 위한 환경을 설정합니다.

Databricks는 데이터 엔지니어링, 기계 학습 및 협업 데이터 과학을 위한 통합 데이터 분석 플랫폼입니다. Databricks WorkSpace는 모든 Databricks 자산에 액세스하기 위한 서비스형 소프트웨어(SaaS) 환경입니다. WorkSpace는 객체(예: 노트북, 라이브러리 및 실험)를 폴더로 구성하고 데이터와 클러스터, 작업 등의 계산 리소스에 대한 액세스를 제공합니다.

중요: 이 AWS 파트너 솔루션을 배포하려면 Databricks 계정이 플랫폼의 E2 버전에 있어야 합니다. 자세한 내용은 Databricks에 문의하세요.
관련 콘텐츠 보기

이 파트너 솔루션은 Databricks와 AWS가 공동으로 만들었습니다. Databricks는 AWS 파트너입니다.

  •  구축할 내용
  • 이 파트너 솔루션은 Databricks WorkSpace를 구성하는 다음 항목을 설정합니다.

    • 최소 3개의 가용 영역에 걸쳐 있는 고가용성 아키텍처
    • 고객의 AWS 계정에 있는 Databricks 관리형 또는 고객 관리형 Virtual Private Cloud(VPC). 이 VPC는 AWS 모범 사례에 따라 프라이빗 서브넷과 퍼블릭 서브넷으로 구성되어 AWS에서 자체 가상 네트워크를 제공합니다.
    • 프라이빗 서브넷의 경우
      • Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스의 Databricks 클러스터
      • 보안 클러스터 연결을 사용하기 위한 하나 이상의 보안 그룹
    • 퍼블릭 서브넷의 경우
      • 아웃바운드 인터넷 액세스를 허용하기 위한 네트워크 주소 변환(NAT) 게이트웨이
    • Databricks WorkSpace 인스턴스 로그에 대한 Amazon CloudWatch
    • (선택 사항) 노트북을 암호화하기 위한 고객 관리형 AWS Key Management Service(AWS KMS) 키
    • 클러스터 로그, 노트북 개정, 작업 결과와 같은 객체를 저장하기 위한 Amazon Simple Storage Service(Amazon S3) 버킷
    • 사용자 인증을 위해 임시의 제한된 권한 자격 증명을 요청할 수 있도록 하기 위한 AWS Security Token Service(AWS STS)
    • S3 아티팩트 및 로그에 액세스하기 위한 VPC 엔드포인트
    • Databricks가 새 WorkSpace를 위해 VPC에 클러스터를 배포할 수 있도록 하기 위한 교차 계정 AWS Identity and Access Management(IAM) 역할 선택한 배포 옵션에 따라 배포 중 이 IAM 역할을 생성하거나 기존 IAM 역할을 사용합니다.
  •  배포 방법
  • Databricks를 배포하려면 배포 안내서의 지침을 따르세요. 새 WorkSpace의 VPC로 클러스터를 시작하려면 Databricks에 AWS 계정의 교차 계정 IAM 역할에 대한 액세스 권한이 필요합니다. 배포 프로세스는 15분가량 걸리며 다음 단계를 포함합니다.

    1. 아직 AWS 계정이 없으면 https://aws.amazon.com에서 가입하고 계정에 로그인합니다.
    2. 다음 옵션 중에서 선택하여 파트너 솔루션을 시작합니다.

    Amazon은 이 솔루션에서 AWS와 협업하는 AWS 파트너와 사용자 배포 정보를 공유할 수 있습니다.  

  •  비용 및 라이선스
  • 이 파트너 솔루션을 실행하는 동안 사용되는 AWS 서비스 비용은 고객이 부담합니다. 이 파트너 솔루션 사용에 따른 추가 비용은 없습니다.

    이 파트너 솔루션의 AWS CloudFormation 템플릿에는 사용자 지정할 수 있는 구성 파라미터가 포함되어 있습니다. 인스턴스 유형과 같은 일부 설정에 따라 배포 비용이 달라집니다. 예상 비용은 사용하는 각 AWS 서비스의 요금 페이지를 참조하세요. 요금은 변경될 수 있습니다.

    : 결제 지표를 계정의 Amazon S3 버킷으로 전송하려면 파트너 솔루션을 배포한 후 AWS Cost and Usage Report를 사용하세요. 매월 사용량을 기준으로 요금을 산정하고 월말에 데이터를 집계합니다. 자세한 내용은 AWS Cost and Usage Reports란 무엇인가요?를 참조하세요.

    Databricks 예상 비용은 제품 계층 및 기능에 대한 Databricks 요금 페이지를 참조하세요.

파트너 성공 사례
AWS 파트너 솔루션을 사용하여 배포를 간소화하는 Databricks

AWS 클라우드에 Databricks Workspace를 배포하는 데 걸리는 시간과 복잡한 구성 단계를 줄여야 하는 과제에 직면한 Databricks는 AWS Integration and Automation 팀과 협력하여 모범 사례가 통합되어 있는 AWS CloudFormation 템플릿 기반의 자동화된 참조 아키텍처인 AWS 파트너 솔루션을 설계했습니다. 

전체 파트너 추천 읽기
맨 위로 이동