Amazon Web Services ブログ

AWS 上にデータレイクを構築し分析する方法を AWS エキスパートと一緒に1日で学びませんか?

この記事は、2021年3月30日に Kumar Kumaraguruparan によって投稿された Spend a day with AWS experts, and learn how to build a data lake を翻訳したものです。


データ分析・活用になぜデータレイクが必要なのでしょうか?

IDC によると、今後3年間で、過去30年間を合わせたよりも多くのデータが生成されるという調査結果があることをご存知でしょうか?デジタル化した社会ではこれまで以上に多くのデータが作成され、ソーシャルメディアや各種 IoT センサーなど、多くのソースから流れてくるリアルタイムのデータが生成されています。さらに、データは、顧客の注文記録のような従来のリレーショナルデータベースで管理できるような構造化されたものから、テキスト、画像、ビデオのような従来のリレーショナルデータベースでは管理できない非構造化されたものまで、さまざまな形態があります。

企業・組織は、これらのデータを活用して、顧客とのインタラクションを目指し、患者一人一人にあわせた医療、生徒一人一人にあわせた教育など、さまざまな製品・サービスをパーソナライズすることに関心を寄せています。しかし、多くの場合、それらのデータはデータベースやデータウェアハウスなどの様々なデータソースに散らばっていて、データ分析・活用が困難です。データが豊富な組織では、散在するデータからインサイト(気付き)を得るための最初のステップとして、データレイクにデータを集めることを行っています。様々なデータをデータレイクにまとめれば、データウェアハウスで分析するだけでなく、機械学習を使ってモデルを構築し、そのデータからインサイト(気付き)を導き出すことができるようになります。

データレイク市場は、20.6%の年平均成長率で成長しており、2024年には201億ドルに達すると言われています。この成長率は、各所に散在するデータからインサイト(気付き)を導き出したいという様々な企業・組織の願望を反映しています。データエンジニア、データサイエンティスト、データアナリストにとって、この新しい1日コース「Building Data Lakes on AWS」は、散在するデータからインサイト(気付き)を導き出すためのデータ分析パイプラインを AWS 上に構築するための必要なスキルを習得することに役立ちます。

Building Data Lakes on AWS

AWS 上にデータレイクを構築・データ分析をする一連の流れを学習できる Building Data Lakes on AWS は、AWS の認定トレーナーによる講義・ハンズオン形式で、サーバー構築・運用が不要な AWS サーバーレスサービスのみでデータレイクを構築・データ分析を実践する中級者向けのコースです。様々なデータソースからデータレイクにデータ収集し、そのデータを処理、カタログ化・分析するステップを学びます。

このコースは、データレイクの紹介から始まり、データを収集、処理・カタログ化、そして分析する一連の流れと、その中でのデータレイクの位置づけ・意義を理解するのに役立ちます。データレイクを手動で構築するプロセスから AWS Lake Formation のブループリントを使用した自動化の方法を講義・ハンズオン形式で学びます。

データを抽出・変換し、データカタログの作成を支援する AWS Glue や、データレイクの構築・運用を一元的に支援する AWS Lake Formation など、データレイク構築・運用に役立つ AWS サービスについて学びます。また、Amazon Athena によるデータ分析、Amazon QuickSight によるデータの可視化も体験できます。

このトレーニングは、AWS の認定トレーナーが講師を務めるため、技術的な知識が豊富な認定トレーナーからリアルタイムにフィードバックを受けることができます。

AWS Certified Data Analytics – Specialty に挑戦しませんか?

AWS データレイクと分析サービスに関する専門知識を有していることを証明する、業界で認知された資格である、AWS Certified Data Analytics – Specialty 認定の取得を検討することをお勧めします。認定資格取得の準備に役立つ追加情報は、こちらでご確認ください。

AWS サービスを活用したデータ分析についてもっと学びたい場合、次のリソースが活用できます

データ分析に関する AWS トレーニングと認定資格の詳細については、AWS Ramp-Up Guide for Data Analytics をダウンロードし、学習の道筋をつけてください。また、認定トレーナーがサポートするオンラインクラスルームトレーニングコースや無料のデジタルトレーニングもご利用いただけます。

※日本で開催しているオンラインクラスルームトレーニングコース

  • Big Data on AWS : Amazon Kinesis, Amazon Athena, Amazon EMR などを中心にデータの収集からデータ分析までのデータ分析基盤全体を学習します。
  • Data Warehousing on AWS : AWS のペタバイト規模のデータウェアハウスである Amazon Redshift を使用してソリューションを設計するための概念、戦略、およびベストプラクティスについて学習します。

コース開催予定

このコースは、日本では2021年12月から開催されています。AWS Training & Certification で開催日の検索とお申込みが可能です。直近の開催は3月、5月、6月で下記リンクからお申し込みいただけます。お待ちしています。

※なお、本コースは中級者向けのコースですが、これからデータ活用を始める方も AWS サーバーレスサービスでデータを分析する一連の流れを学習いただけるコースです。

翻訳は Technical Trainer 大塚康徳が担当しました。