Amazon Web Services ブログ
「価値あるデータを取得する」を解説する動画を公開しました!【ML Enablement Series Light#5】
「ML Max!」
ということで今週も機械学習の価値を最大化するための解説動画、ML Enablement Series (※)の、
価値あるデータを取得する【ML-Light-05】【AWS Black Belt】
を公開しました。
ML Enablement Series とは、機械学習プロダクトにかかわる全ての人に向けて機械学習の知識をお届けする Light パートと、機械学習のマネージドサービスを活用して MLOps を推進したいエンジニア向けの Dark パート から構成されています。 週1回を目安に Light と Dark を交互に配信しています。
今回は、 Light パート の第 5 回目として、価値あるデータを取得するための「 Prepare (準備)」 を対象にしています。Prepare のゴールは、 「Analyze での診断結果に基づきデータを充足するための依頼がなされ、追加作成や収集が完了する」ことです。そのために大切なこととして、以下の 2 点を挙げて、説明しています。
- データの収集や作成に必要な情報を、関連するステークホルダーに提供できるようになる。
- ステークホルダーとのコミュニケーションを円滑に行えるようになる。
Prepare で最も重要な成果物は 「データ充足のステークホルダーに向けた依頼書」 です。 機械学習モデルの開発チームは、関連するステークホルダーに、依頼書に沿ったデータの収集、アノテーションやラベリングのデータの作成を依頼します。
プログラミング演習では依頼されたステークホルダーが利用可能なツールを紹介し、コミュニケーション演習では依頼を行う際に取るべきコミュニケーションを解説します。
データの質や量は機械学習プロジェクトの成功を左右します。 必要なデータ収集、データ作成は誰に何を依頼すべきか。ステークホルダーと円滑にコミュニケーションを行うためどうするべきかを解説しました。データ収集やデータ作成の関連作業を担当する方はぜひご覧ください。
今回の 動画 は AWS BlackBelt オンライン ML Enablement シリーズの YouTube の再生リスト( Light パート / Dark パート ) に追加しています。こちらもご利用ください。
AWS Black Belt Online Seminar 全体の資料はこちらにあります
プレゼンテーション作成は片山が、本記事は楊が担当しています。
これまでの「ML Enablement Series」
- [ML-Light-01] 機械学習モデル開発プロジェクトの進め方
- [ML-Light-02] 機械学習モデルの開発環境を構築する
- [ML-Light-03] 機械学習の価値を計算する
- [ML-Light-04] データから価値を創出できるか診断する
- [ML-Light-05] 価値あるデータを取得する
- [ML-Light-06] 機械学習モデルが認識しやすいデータに変換する
- [ML-Dark-01] Amazon SageMaker Training で機械学習のモデル開発を楽にする
- [ML-Dark-01b] Amazon SageMaker Training ハンズオン編
- [ML-Dark-02] Amazon SageMaker による実験管理
- [ML-Dark-03] Amazon SageMaker 推論 Part1 推論の頻出課題とSageMakerによる解決方法
- [ML-Dark-04] Amazon SageMaker 推論 Part2すぐにプロダクション利用できる!モデルをデプロイして推論する方法
- [ML-Dark-05a] Amazon SageMaker 推論 Part3(前編)もう悩まない!機械学習モデルのデプロイパターンと戦略
- [ML-Dark-05b] Amazon SageMaker 推論 Part3(後編)もう悩まない!機械学習モデルのデプロイパターンと戦略
- [ML-Dark-07] Amazon SageMaker モニタリング Part1