Amazon Web Services ブログ

データエンジニアリングプロフェッショナル認定資格: DeepLearning.AI と AWS による新しいハンズオン専門講座

データエンジニアは、現代のデータ主導の環境において重要な役割を果たし、データインジェストや処理から変換や提供に至るまで、重要なタスクを管理します。データエンジニアの専門知識は、膨大なデータセットの価値を活用することが最も重要である生成 AI の時代に特に役立ちます。

意欲的で経験豊富なデータプロフェッショナルを支援するために、DeepLearning.AIAmazon Web Services (AWS) は提携して、Coursera の上級プロフェッショナル認定資格であるデータエンジニアリングスペシャライゼーションを立ち上げました。この包括的なプログラムは、現代の組織に関連する幅広いデータエンジニアリングの概念、ツール、および手法を対象としています。同プログラムは、データを使った経験がある程度あり、データエンジニアリングの基礎を学びたい学習者を対象としています。スペシャライゼーションは 4 つのハンズオンコースで構成され、各コースを修了すると Coursera コース修了証が授与されます。

スペシャライゼーションの概要

このデータエンジニアリングスペシャライゼーションは、有名な機械学習 (ML) のパイオニアである Andrew Ng 氏によって設立された、世界クラスの AI 教育の大手プロバイダーである DeepLearning.AI と AWS による共同の取り組みです。

データエンジニアリングの著名な人物であり、ベストセラーの書籍『Fundamentals of Data Engineering』の共著者である Joe Reis 氏が主任講師としてプログラムを率いています。基本的なフレームワークを提供することで、カリキュラムはデータアーキテクチャ、オーケストレーション、DataOps、データ管理などの重要な側面をカバーしながら、学習者がデータエンジニアリングライフサイクルを総合的に理解できるようにします。

このプログラムでは学習体験をさらに充実させるために、AWS クラウドで実施されるハンズオンラボと技術評価を実施しています。これらの実践的なクラウドベースの演習は、Gal HeyneNavnit ShuklaMorgan Willis などの AWS 技術専門家と協力して設計されました。受講者は、Amazon KinesisAWS GlueAmazon Simple Storage Service (Amazon S3)Amazon Redshift などの AWS のサービスとツールを使用して理論的な概念を適用し、実践的なスキルと経験を身に付けます。

スペシャライゼーションのハイライト

参加者には、いくつかの重要な学習機会があります。

コアスキルと戦略の習得

このスペシャライゼーションにより、データエンジニアは、さまざまなユースケースに対応するデータエンジニアリングソリューションを設計し、データアーキテクチャに適したテクノロジーを選択し、潜在的な落とし穴を回避する能力が身に付きます。習得したスキルは、さまざまなプラットフォームやテクノロジーに広く適用でき、学習者に用途の広いプログラムが提供されます。

データエンジニアリング教育への比類のないアプローチ

特定のテクノロジーに焦点を当てた従来のコースとは異なり、このスペシャライゼーションではデータエンジニアリングの基礎を包括的に理解できます。データエンジニアリング戦略をより広範なビジネス目標と整合させ、データソリューションの構築と維持に対するより統合された効果的なアプローチを取ることの重要性が強調されています。

データエンジニアリングの総合的な理解

書籍『Fundamentals of Data Engineering』から得たインサイトを活かし、本カリキュラムでは、プロフェッショナルがデータ主導型の業界で羽ばたく準備を整えるための総合的な教育を施します。

AWS クラウドラボで学ぶ実践的なスキル

AWS パートナー Vocareum が主催するハンズオンラボでは、受講者はコースで提供される AWS 環境でテクニックを直接使うことができます。この実践的な経験は、複雑なデータエンジニアリングを習得し、業界で活躍するために必要なスキルを身に付けるために不可欠です。

このスペシャライゼーションを選ぶ理由は?

  • 構造化された学習パス – この仕様は、基礎概念から高度なアプリケーションまで、段階的に学習できるように慎重に構成されています。
  • 専門家によるインサイト –『Fundamentals of Data Engineering』の著者やその他の業界専門家からインサイトを得ることができます。データエンジニアリング向けのクラウドサービスを使用して、実践的な知識を応用してクラウド上に最新のデータアーキテクチャを構築する方法を学びましょう。
  • 実践的な体験 – AWS クラウドのハンズオンラボに参加すると、学ぶだけでなく、その知識を実際のシナリオに応用することもできます。
  • 包括的なカリキュラム – このプログラムは、ソースシステムでのデータ生成、取り込み、変換、保存、提供など、データエンジニアリングライフサイクルのあらゆる側面を網羅しています。また、セキュリティ、データ管理、オーケストレーションなど、データエンジニアリングの主要な底流も扱います。

このスペシャライゼーションを修了すると、学習者はデータエンジニアリングのキャリアに着手するために必要なスキルと専門知識を十分に身につけることができます。データエンジニアリングは、データを活用して価値を創造しようとしている組織の中核で求められている役割です。データ中心の ML と分析は、データエンジニアリングの基盤なしには実現できません。

コースモジュール

データエンジニアリングスペシャライゼーションは、次の 4 つのコースで構成されています。

  • コース 1 – Introduction to Data Engineering – この基礎モジュールでは、データエンジニアリングのコラボレーションの性質を探り、主要な利害関係者を特定し、その要件を理解します。このコースでは、全体的なエコシステムの理解、データの品質やスケーラビリティなどの重要な要素、効果的な要件収集に重点を置いて、データエンジニアリングソリューションを構築するためのメンタルフレームワークを掘り下げます。次に、このコースではデータエンジニアリングのライフサイクルを検証し、ステージ間の相互接続について説明します。このコースでは、AWS のデータエンジニアリングスタックを紹介することで、適切なテクノロジーの使用方法を学びます。このコースを修了すると、学習者はデータエンジニアリングの課題に対処し、情報に基づいた意思決定を行うためのスキルと考え方が身に付きます。
  • コース 2 – Source Systems, Data Ingestion, and Pipelines – このコースでは、データエンジニアが多様なデータソース、取り込みパターン、パイプライン構築の実際的な側面を深く掘り下げます。学習者は、さまざまなデータ形式の特徴と、各タイプのデータを生成するための適切なソースシステムを探求し、効果的なデータパイプラインを設計するための知識を身に付けます。このコースでは、ACID コンプライアンスや CRUD オペレーションなど、リレーショナルデータベースと NoSQL データベースの基礎を扱い、エンジニアがさまざまなデータソースシステムの操作方法を学びます。このコースでは、クラウドネットワークの重要性、データベース接続の問題の解決、メッセージキューとストリーミングプラットフォームの使用について説明します。これらは強力でスケーラブルなデータアーキテクチャを構築するために不可欠なスキルです。このコースの概念を習得することで、データエンジニアはデータインジェストプロセスを自動化し、接続を最適化し、データエンジニアリングプロジェクトを成功させるための基盤を確立できるようになります。
  • コース 3 – Data Storage and Queries – このコースにより、データエンジニアは堅牢で効率的なデータストレージとクエリソリューションを設計するための原則とベストプラクティスが身に付きます。学習者はデータレイクハウスの概念を学び、メダリオンのようなアーキテクチャを実装し、オープンテーブル形式を使用してトランザクションデータレイクを構築します。このコースでは、ストリーミングデータの集計や結合などの高度なクエリを教えると同時に、データウェアハウスやデータレイク機能についても学習することで、SQL の習熟度を高めます。学習者はストレージのパフォーマンスを比較し、インデックス作成などの最適化戦略を見つけます。データエンジニアは、クエリの実行と処理を理解することで、データサービスの高いパフォーマンスとスケーラビリティを実現できます。
  • コース 4 – Data Modeling, Transformation, and Serving – このキャップストーンコースでは、データエンジニアがデータボールトやスタースキーマなどの高度なデータモデリング手法を探求します。学習者は、Inmon と Kimball のようなモデリングアプローチを区別することで、最適な分析や ML のユースケースに合わせてデータを変換して構造化する能力を身に付けます。このコースでは、テキストデータ、画像データ、表形式データの前処理スキルをデータエンジニアに提供します。学習者は、教師あり学習と教師なし学習の違い、分類とリグレッションのタスクを理解し、さまざまな予測アプリケーションをサポートするデータソリューションを設計することができます。データエンジニアは、これらのデータモデリング、変換、および提供の概念を習得することで、堅牢でスケーラブルな、ビジネスに合わせたデータアーキテクチャを構築し、最大の価値をもたらすことができます。

登録

データエンジニアリングを初めて学ぶ方も、スキルの向上を目指している方も、このスペシャライゼーションでは、理論と実践経験をバランスよく組み合わせた 4 つのコースを提供します。各コースで Coursera コース修了証が授与されます。

以下からデータエンジニアリングの旅を始めましょう。

これらのコースに登録し、4 つのコースをすべて修了すると、DeepLearning.AI Data Engineering Professional Certificate も取得できます。

今すぐ登録して、この包括的で実践的なプログラムでデータエンジニアリングの習得に向けた第一歩を踏み出しましょう。このプログラムは、『Fundamentals of Data Engineering』を基に構築され、AWS によって運営されています。

原文はこちらです。