Amazon SageMaker Ground Truth | Amazon Web Services ブログ

the labeling and ML journey using Ground Truth and MLflow

Amazon SageMaker Ground Truth と Databricks MLflow を用いた MLOps 感情分析パイプラインの構築

より深いインサイトを得るために機械学習（ML）を導入する企業が増える中、ラベリングとライフサイクル管理という2つの重要な課題に直面しています。ラベリングとは、データを確認し、ML モデルがそこから学習できるようにラベルを追加して、データのコンテキストを提供することです。ラベルとは、音声ファイルの文字起こし、写真内の車の位置、または MRI 画像内の臓器の箇所などが該当します。データのラベリングは、ML モデルがデータに対してうまく動作するようにするために必要です。ライフサイクル管理は、ML 実験のセットアップと、結果を得るために使用したデータセット、ライブラリ、バージョン、モデルを文書化するプロセスなどに関係するものです。あるチームは、1つのアプローチに落ち着くまでに何百もの実験を行うかもしれません。その実験の要素を記録しておかないと、過去のアプローチに立ち戻って再現するのは難しいでしょう。

Amazon SageMaker で DICOM イメージのアノテーションとMONAI フレームワークを使用した機械学習モデルを構築する

この記事は、“Annotate DICOM images and build an ML model using the MONAI framework on Amazon SageMaker” を翻訳したものです。 DICOM（Digital Imaging and Communications in Medicine）は、X線やMRIの画像と関連するメタデータを含む画像形式です。DICOMは、X線やMRIの表示と解釈を行う医療専門家および医療研究者のための標準です。この投稿の目的は、次の2つの問題を解決することです。 Amazon SageMaker Ground Truth は、組み込みまたはカスタムのデータラベリングワークフローをサポートするフルマネージド型のデータのラベリングサービスです。カスタムのデータラベリングワークフローを使用してDICOM 画像を表示しラベル付けをします。クラウド上で機械学習 (ML) モデルを準備、構築、トレーニング、デプロイするための専用ツールを備えた、包括的でフルマネージド型のデータサイエンスプラットフォームであるAmazon SageMaker でMONAI フレームワークを使用して DenseNet 画像分類モデルを開発します。この記事では、DICOM形式の胸部X線画像と、関連する放射線レポートをフリーテキストファイルとして公開しているMIMIC Chest X-Ray (MIMIC-CXR) Databaseに含まれる、胸部X線DICOM画像データセットを使用しています。ファイルにアクセスするには、ユーザー登録をして、データ使用契約書に署名する必要があります。画像のラベル付けは、Ground Truth プライベートワークフォースを通じて行います。AWS は、医用画像のラベル付けの経験をもつプロフェッショナルなマネージドワーカーを提供することもできます。

Amazon SageMaker Ground Truthを利用した動画ラベリングとAmazon Rekognition Custom Labelsへのインポート

「Amazon Rekognition Custom Labelsを利用した動物の特徴的な行動検出」にて、行動検知モデル作成手順について紹介致しましたが、本ブログではモデル作成の重要なステップであるAmazon SageMaker Ground Truthを利用した動画のデータラベリングをご紹介します。合わせて、2021年1月時点ではAmazon SageMaker Ground Truthでラベリングした動画データをAmazon Rekognition Custom Labelsのデータセットとしてそのままインポートできません。そのため、ここではインポートするためのマニフェストファイルの記述方法をご紹介します。ラベリングデータを利用した一般的な機械学習のワークフローは以下になります。このフローでモデルの精度向上に重要なのはラベリングデータの準備になります。もちろん、モデル開発やモデル学習に時間はかかると思います。しかし多くの場合、モデル開発に関しては既存もしくは機械学習のスペシャリストが作成したアルゴリズムやモデルを選定する事で開発の短縮化が行えますし、モデル学習についてもクラウドリソース(例えばGPUインスタンス)を利用することで学習時間の短縮化を行えます。そうすると、時間がかかるのがラベリングデータの準備であり、ラベリングの効率化・質の高いデータ数を増やす事が重要なポイントになります。このラベリングデータの準備を簡素化するツールとして、Amazon SageMaker Ground Truthがあります。

[詳解] Amazon Rekognition Custom Labels で特定の動作を認識する機械学習モデルを作る

このブログは、AWS ブログ「Amazon Rekognition Custom Labelsを利用した動物の特徴的な行動検出」における物体検知モデルを作る手順を詳細に説明したものです。画像に何が写っているのかや、特定の物体が写っているか、どこに写っているのかを知るために機械学習を使うことがよくあります。しかし、機械学習の知識や経験を得ることは簡単ではないため、自分で機械学習モデルを作ることを諦めている方もいらっしゃるかもしれません。 Amazon Rekognition は、機械学習に詳しくない方でも簡単に機械学習を使った画像分析をご利用いただくためのサービスです。Amazon Rekognition に画像を入力すると、画像に何が写っているのか、有名人の誰が写っているのか、写っている人がどんな表情なのかなどを知ることができます。これらの機能は、あらかじめ決められている対象を分析することができるものですが、お客様が独自に定義した被写体を抽出したり、画像のシーンを特定したい場合は、Amazon Rekognition Custom Labels をお使いいただくことができます。お客様によって用意された画像と各画像に紐づけられたラベル情報を使用して、Amazon Rekognition Custom Labels はお客様独自の機械学習モデル（物体検知モデル、もしくは、シーン分類モデル）を作成します。

【開催報告】AWS AI/ML@Tokyo #2 ～エンタプライズ企業におけるAmazon SageMakerの活用～

アマゾンウェブサービスジャパン株式会社の帆足 (Twitter: @hoahoa) です。AWS Japan 目黒オフィスでは、今年からAI/ML関連情報を発信するイベント「AWS AI/ML@Tokyo」を定期的に開催しています。2020年2月27日に開催された AWS AI/ML@Tokyo #2では、AWS Japan によるサービスの最新情報や事例紹介と、Amazon SageMaker をご利用いただいているお客様をゲストスピーカーにお招きし、実際に導入頂いたお客様による「体験談」をお話し頂きました。

【開催報告】第9回Amazon SageMaker 事例祭り

アマゾンウェブサービスジャパン株式会社機械学習ソリューションアーキテクトの上総 (Twitter:@tkazusa ) です。AWS Japan 目黒オフィスでは「Amazon SageMaker 事例祭り」(Twitter: #sagemaker_fes) を定期的に開催しています。2019年10月30日に開催された第9回 Aazon SageMaker 事例祭りでは、AWS Japan のソリューションアーキテクトによるサービスの最新情報や技術情報と、Amazon SageMaker をご利用いただいているお客様をゲストスピーカーにお招きし、実際に導入頂いたお客様による「体験談」をお話し頂きました。

Amazon Web Services ブログ

Category: Amazon SageMaker Ground Truth

Amazon SageMaker Ground Truth と Databricks MLflow を用いた MLOps 感情分析パイプラインの構築

Amazon SageMaker で DICOM イメージのアノテーションとMONAI フレームワークを使用した機械学習モデルを構築する

Amazon SageMaker Ground Truthを利用した動画ラベリングとAmazon Rekognition Custom Labelsへのインポート

[詳解] Amazon Rekognition Custom Labels で特定の動作を認識する機械学習モデルを作る

【開催報告】AWS AI/ML@Tokyo #2 ～エンタプライズ企業におけるAmazon SageMakerの活用～

【開催報告】第9回Amazon SageMaker 事例祭り