Amazon EMR、Amazon Redshift、Amazon Kinesis、Amazon Athena、その他の AWS ビッグデータプラットフォームを使用して、データを処理し、ビッグデータ環境を作成する方法について学習します

Big Data on AWS では、Amazon EMR、Amazon Redshift、Amazon Kinesis、その他の AWS ビッグデータプラットフォームなど、クラウドベースのビッグデータソリューションを紹介します。このコースでは、Hive や Hue といった Hadoop ツールの広範なエコシステムを使用して Amazon EMR でデータを処理する方法を説明します。また、ビッグデータ環境の作成、Amazon DynamoDB、Amazon Redshift、Amazon Quicksight、Amazon Athena、Amazon Kinesis との連携、セキュリティとコスト効率性に優れたビッグデータ環境を設計するためのベストプラクティスの活用方法についても学習します。

レベル

中級

形態

クラスルーム、ライブまたは仮想クラス

期間

3 日間

このコースでは、次のことについて説明します。

  • AWS ソリューションをビッグデータエコシステム内に合わせる.
  • Amazon EMR 環境で Apache Hadoop を活用する
  • Amazon EMR クラスターのコンポーネントを確認する
  • Amazon EMR クラスターを起動して設定する
  • Hive、Pig、およびストリーミングなど、Amazon EMR で利用できる一般的なプログラミングフレームワークを活用する
  • Hue を活用して Amazon EMR の使いやすさを改善する
  • Amazon EMR の Spark でインメモリ分析を使用する
  • 適切な AWS データストレージオプションを選択する
  • ほぼリアルタイムのビッグデータ処理に Amazon Kinesis を使用するメリットを特定する
  • Amazon Redshift を活用してデータを効率的に保存し、分析する
  • ビックデータソリューションのコストとセキュリティを理解し、管理する.
  • データの取り込み、転送、圧縮のオプションを特定する
  • Amazon Athena をアドホッククエリ分析に活用する
  • AWS Glue を活用して ETL ワークロードを自動化する
  • Amazon QuickSight を使ってデータやクエリを表示する可視化ソフトウェアを使用する
  • AWS Data Pipeline を使ってビッグデータワークフローを調整する.

このコースは次のような方を対象としています。

  • ビッグデータソリューションの設計と実装の担当者、つまりソリューションアーキテクトおよびシステム運用管理者
  • AWS ビッグデータソリューションの背後にあるサービスおよびアーキテクチャパターンに関心をお持ちのデータサイエンティストとデータアナリスト

このコースを受講するにあたっては、次の前提条件を身につけておくことをお勧めします。

このコースは、次の形式を組み合わせて実施します。

  • クラスルームトレーニング (ILT)
  • ハンズオンラボ

このコースでは、さまざまな実務的演習を通して、新しいスキルを試すとともに知識を実際の運用環境に応用することができます。

注: コースの概要は、クラスが提供されるリージョンの場所または言語によって若干異なることがあります。

第 1 日

  • ビッグデータの概要
  • 取り込み
  • ビッグデータのストリーミングと Amazon Kinesis
  • Amazon Kinesis を用いたストリーミングと、Apache サーバーログの分析
  • ストレージソリューション
  • Amazon Athena を使ったログデータの分析
  • Apache Hadoop と Amazon EMR

第 2 日

  • Amazon Elastic MapReduce の使用
  • DynamoDB でのデータの保存とクエリ
  • Hadoop プログラミングフレームワーク
  • Amazon EMR での Hive を使ったサーバーログの処理
  • Hue を使った Amazon EMR エクスペリエンスの効率化
  • Amazon EMR での Hue を使った Pig スクリプトの実行
  • Amazon EMR での Spark
  • Amazon EMR での Spark を使ったニューヨークのタクシーのデータセットの処理

第 3 日

  • AWS Glue を使った ETL ワークロードの自動化
  • Amazon Redshift とビッグデータ
  • ビッグデータの可視化と調整
  • Amazon EMR のコストの管理
  • ビッグデータソリューションのセキュリティ確保
  • ビッグデータの設計パターン
Big Data Thumbnail

aws.training を参照

プライベートトレーニングについてお問い合わせください »


「Big Data on AWS」では、AWSクラウドプラットフォームでのビッグデータソリューションについて紹介します。このコースではAmazon Elastic MapReduce (Amazon EMR) 、およびHiveやHueといったHadoopツールの広範なエコシステムを使ってデータを処理する方法について説明します。また、ビッグデータ環境を作成する方法、Amazon DynamoDB、Amazon Redshift、およびAmazon Kinesisとの連携方法、セキュリティやコストの効率化のためのベストプラクティスを活用する方法についても説明します。

本コースを修了すると次の事ができるようになります。

  • ビッグデータエコシステム内でAWSソリューションを適合する
  • Amazon EMRのコンテキストでApache Hadoopを活用する
  • Amazon EMRクラスタのコンポーネントを識別する
  • Amazon EMRクラスタを作成および構成する
  • Amazon EMRに対して有効なHive、Pig、およびStreamingといった一般的なプログラミングフレームワークを活用する
  • Amazon EMRの使いやすさを向上するためHueを活用する
  • Amazon EMRでSparkおよびSpark SQLによるメモリ内分析を使用する
  • 適切なAWSデータストレージオプションを選択する
  • 準リアルタイムビッグデータ処理に対してAmazon Kinesisを使用する利点を確認する
  • データウェアハウスおよびカラムナデータベースの概念を定義する
  • データの効率的な格納と分析のためにAmazon Redshiftを活用する
  • Amazon EMRおよびAmazon Redshift展開についてのコストとセキュリティを理解および管理する
  • データの統合、転送、圧縮のためのオプションを理解する
  • データおよびクエリを示すために視覚化ソフトウェアを使用する
  • AWS Data Pipelineを使ってビッグデータワークフローを編成する

 

受講スケジュールを参照
AWS提供スケジュール


このコースは次のような方を対象としています。
  • データの保存先としてAWSを利用し、AWS上での大規模なデータ処理のために、Amazon EMRやAmazon Kinesisなど様々なAWSサービスをビッグデータパイプラインの構築に活用する方。
 
  • データの収集、変換、ロード処理、分散デートストア、 Apache Hadoop をはじめとしたビッグデータ技術に対する基本的な知識
  • Web ベーストレーニングの Big Data Technology Fundamentals の修了または同等の経験
  • コア AWS サービスおよびパブリッククラウドについての実務的知識
  • AWS Techinical Essentials 1 と 2 コースの修了または同等の経験(必須)
  • Architecting on AWS コースの修了または同等の経験(推奨)
  • リレーショナルデータベースシステム、およびデータベースの基本的な知識

このコースは、次の形式を組み合わせて実施します。

  • クラスルームトレーニング
  • ハンズオンラボ
  • 3 日間(9:30 - 17:30)

注: コースの内容は、クラスが提供されるリージョンの場所または言語によって若干異なることがあります。

このコースで取り上げる概念を日別に示します。

 

第 1 日

  • ビッグデータ、Apache Hadoop、およびAmazon EMRの利点についての概要
  • Amazon EMRアーキテクチャ
  • Amazon EMRの使用
  • Hadoopプログラムフレームワーク
  • 広告分析でのHiveの使用
  • 生命科学分析でのStreamingの使用

 

第 2 日

  • Amazon EMRでのHueの使用
  • Amazon EMRでのHueによるPigスクリプトの実行
  • インメモリ分析用SparkおよびSpark SQL
  • インメモリ分析でのSparkおよびSpark SQLの使用
  • Amazon EMRコストおよびセキュリティの管理
  • データの取り込み、転送、および圧縮
  • リアルタイムビッグデータ処理におけるAmazon Kinesisの使用
  • AWSデータストレージオプション
  • DynamoDB とAmazon EMRの連携

 

第 3 日

  • データウェアハウスおよびカラムナデータベース管理システム
  • Amazon Redshiftおよびビッグデータ
  • ビッグデータに対するAmazon Redshiftの使用
  • AWSでのビッグデータエコシステム
  • ビッグデータの視覚化と編成
  • Tibco Spotfireを使ったビッグデータの視覚化

210,000 円(税別) 

表示される料金には消費税は含まれません。料金とあわせて別途消費税を請求させていただきます。詳しくはこちら