Amazon Web Services ブログ
【資料&動画公開】AWS で実践!Analytics Modernization ~ETL 編~
2021年7月14日に、「AWS で実践!Analytics Modernization ~ETL 編~」というオンラインセミナーを開催しました。昨今、データレイクをクラウド上に作ることが一般的になりつつありますが、データレイクに溜まったデータを活用する際に重要になるのが前処理(ETL)であり、その前処理をどのようにAWS上で実現し、モダン化するかという点を解説しました。
今回このセミナーの動画と資料を公開しましたのでご紹介します。全部で3つのセッションがありますが、各セッションの中も内容単位で区切った動画にしていますので、必要なところだけ見ていただけるようになっています。
セッション1: AWSのETLソリューション紹介(アマゾン ウェブ サービス ジャパン株式会社 シニアソリューションアーキテクト 下佐粉 昭)
このセッションでは、ETLを選択する上で必要となる考え方やキーワード(サーバーレス、冪等性等)ご説明し、関連するAWS サービスをご説明し、それぞれの違い・特性を把握する方法を解説しています。資料(PDF)のダウンロードはこちらから可能です。
1-1. クラウドでのETL選択の考え方(約21分)
1-2. ETLジョブ実行に利用できるAWSサービス(約16分)
1-3. ワークフロー制御に利用できるAWSサービス、まとめ(約5分)
セッション2: AWS ETL サービス適材適所選択のコツ(アマゾン ウェブ サービス ジャパン株式会社 ソリューションアーキテクト 鈴木浩之)
このセッションでは、ETL選択のうえで検討すべきポイントを整理した後、実際のユースケースや事例を踏まえながら、各種AWS サービスを選択する際の勘所について解説しています。資料(PDF)のダウンロードはこちらから可能です。
2-1. ETLの概要とAWS関連サービス(約6分)
2-2. AWSで実現するETL、ユースケース別よくある疑問点(約30分)
2-3. AWS ETLサービスの組み合わせパターン事例(約3分)
セッション3: 変わるETL – ビジネスとETL の進化(アマゾン ウェブ サービス ジャパン株式会社 シニア サーバーレススペシャリスト 下川 賢介)
このセッションでは、ビジネス環境の変化からETL開発にどういった変化があるかを確認し、ビジネス、組織との繋がりを解説します。その後、AWS サーバーレスサービスである AWS Lambda と AWS Step Functions を利用した軽量なETLの構築方法、そして Amazon Kinesis Data Streams を利用したイベント駆動でのETL処理の方法を通して、いかにビジネス変化に対応していくかについて解説しています。資料(PDF)のダウンロードはこちらから可能です。
3-1. ビジネスのイノベーションとETLの改善について(約12分)
3-2. AWS Step Functionsを用いたサーバーレスワークフローによる軽量ETLの実現(約14分)
3-3. AWS LambdaとAmazon Kinesis Data Streamsを使った、リアルタイムETL処理(約18分)
まとめ
分析対象となるデータの量・種類は年々増加する傾向にあります。多様なデータを分析しやすい状態にするには前処理がかかせませんし、大規模に対応するには、分散処理によるスループットの向上やサーバーレスによる運用管理の低減が助けになります。また、ビジネスの変化に追従できるよう組織にも変化が求められます。ぜひ本セミナーの内容を活用してデータ分析のモダナイゼーションを実現していただければ幸いです。
また、AWSでは今後も多様なセミナーを開催していく予定です。今後のスケジュールについてはこちらのページをご確認ださい。
ソリューションアーキテクト 下佐粉 昭 (twitter – @simosako)