Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena 및 다른 AWS 빅 데이터 플랫폼을 활용하여 데이터를 처리하고 빅 데이터 환경을 만드는 방법을 배웁니다

이 과정에서는 Amazon EMR, Amazon Redshift, Amazon Kinesis 및 기타 AWS 빅 데이터 플랫폼과 같은 클라우드 기반 빅 데이터 솔루션에 대해 배웁니다. Amazon EMR을 사용하여 Hive 및 Hue와 같은 광범위한 하둡 도구 에코시스템을 통해 데이터를 처리하는 방법을 보여줍니다. 또한, 빅 데이터 환경을 생성하고, Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena 및 Amazon Kinesis로 작업하고, 모범 사례를 활용해 안전하고 비용 효율적인 빅 데이터 환경을 설계하는 방법을 가르칩니다.

레벨

중급

전달 방식

강의식 교육, 실습

기간

3일

본 교육 과정의 대상은 다음과 같습니다.

  • 솔루션스 아키텍트
  • 시스템 운영 관리자
  • 데이터 과학자
  • 데이터 분석가

이 과정에서 배우게 될 내용은 다음과 같습니다.

  • 빅 데이터 에코시스템에 적합한 AWS 솔루션
  • Amazon EMR의 맥락에서 Apache 하둡 사용
  • Amazon EMR 클러스터의 구성 요소를 파악한 후 Amazon EMR 클러스터를 시작 및 구성
  • Hive, Pig, 스트리밍을 비롯해 Amazon EMR에 사용 가능한 일반적인 프로그래밍 프레임워크 사용
  • Hue(Hadoop User Experience)를 사용하여 Amazon EMR의 사용 편의성 개선
  • Amazon EMR에서 Apache Spark를 통해 인 메모리 분석 사용
  • 적절한 AWS 데이터 스토리지 옵션 선택
  • 거의 실시간 빅 데이터 처리를 위해 Amazon Kinesis를 사용하는 이점 파악
  • Amazon Redshift를 활용해 데이터를 효율적으로 저장 및 분석
  • 빅 데이터 솔루션의 비용과 보안을 이해하고 관리
  • 데이터 수집, 전송, 압축 옵션 파악
  • 임시 쿼리 분석에 Amazon Athena 활용
  • AWS Glue를 사용하여 ETL(추출, 변환 및 로드) 워크로드를 자동화
  • Amazon QuickSight로 데이터와 쿼리를 표시하기 위해 시각화 소프트웨어 사용
이 과정을 수강하려면 다음 사전 조건을 갖추는 것이 좋습니다.
 
  • Apache 하둡, 하둡 분산 파일 시스템(HDFS) 및 SQL/NoSQL 쿼리를 비롯한 빅 데이터 기술에 대한 기본 지식
  • Big Data Technology Fundamentals 디지털 교육 이수 또는 이에 상응하는 경력
  • 핵심 AWS 서비스 및 퍼블릭 클라우드 구현에 대한 실무 지식
  • AWS Technical Essentials 이수 또는 이에 상응하는 경력
  • 데이터 웨어하우징, 관계형 데이터베이스 시스템, 데이터베이스 설계에 대한 이해

본 과정은 다음 방법을 통해 제공됩니다.

  • 강의실 교육
  • 실습

이 과정에서는 다양한 실습을 통해 새로운 기술을 테스트하고 지식을 실무 환경에 적용해 봅니다.

kr-bigdata

aws.training으로 이동