빅 데이터 솔루션을 위해 AWS 서비스를 활용하기 위한 기본 토대를 구축

빅 데이터 기술 원리 과정은 빅 데이터 솔루션에 사용되는 기술의 기본적인 일반 지식을 제공합니다. MapReduce, HDFS, Pig와 Hive 프로그래밍 프레임워크 등 하둡 에코시스템을 사용한 빅 데이터 솔루션 개발에 대해 다룹니다. 이 웹 기반 교육 과정을 통해 빅 데이터 솔루션용 AWS 서비스를 사용하기 위한 기반을 다질 수 있습니다.이 과정은 무료로 제공되며, 단일 교육 과정으로 활용하거나 AWS 기반 빅 데이터 강의식 과정을 수강하기 전에 준비 과정으로 활용할 수 있습니다.

수준

기초

전달 방식

자습형, 온라인

기간

90분

본 과정에서 배우게 될 내용은 다음과 같습니다.

  • 빅 데이터 솔루션 개발에 사용할 수 있는 일반 도구 및 기술 식별
  • 구성 요소 map, shuffle/sort, reduce 등의 MapReduce 프로그래밍 프레임워크 이해
  • Hive 프로그래밍 프레임워크를 사용하여 빅 데이터 솔루션을 개발할 수 있는 옵션 구별

본 교육 과정의 대상은 다음과 같습니다.

  • 엔터프라이즈 솔루션스 아키텍트, 빅 데이터 솔루션스 아키텍트, 데이터 과학자, 데이터 분석가 등 빅 데이터 개념을 처음 접하는 사람

이 과정에 참석하려면 다음 조건이 갖춰져 있는 것이 좋습니다.

  • Java나 C# 등의 언어를 사용한 기본 프로그래밍에 대한 실무 지식

본 과정은 다음 방법을 통해 전달됩니다.

  • 웹 기반 온라인 교육

참고: 과정 개요는 해당 강의가 제공되는 지역 및 언어에 따라 내용이 조금씩 다를 수 있습니다.

모듈 1 – 빅 데이터 소개

  • 비즈니스 측면에서 본 빅 데이터의 중요성
  • 하둡 에코시스템
  • 빅 데이터의 특성
  • 빅 데이터 처리
  • 빅 데이터 분석을 위한 도구 및 기술
  • 빅 데이터 솔루션 구현
  • 사례 연구 – 소셜 미디어 분석

모듈 2 – MapReduce 및 하둡 소개

  • 하둡 아키텍처
  • MapReduce 프레임워크
  • MapReduce 프로그래밍
  • MapReduce 및 HDFS/S3
  • 사용 사례 – 권장 엔진

모듈 3 – Pig 프로그래밍을 사용한 데이터 분석

  • Pig 소개
  • Pig 데이터 유형
  • Pig의 데이터 표시
  • Pig 실행
  • 사용자 정의 함수
  • Pig와 기존 RDBMS 비교
  • Pig의 고급 기술  

모듈 4 – Hive를 사용한 빅 데이터 쿼리

  • Hive 소개
  • Hive의 데이터 표시
  • Hive 데이터 유형
  • Hive 쿼리로 데이터 탐색
  • Hive와 AWS
  • 사용 사례 – 임시 분석 및 제품 피드백
지금 빅 데이터 기술 기초 과정에 등록하기