Amazon Web Services ブログ

Category: Artificial Intelligence

[詳解] Amazon Rekognition Custom Labels で特定の動作を認識する機械学習モデルを作る

このブログは、AWS ブログ「Amazon Rekognition Custom Labelsを利用した動物の特徴的な行動検出」における物体検知モデルを作る手順を詳細に説明したものです。 画像に何が写っているのかや、特定の物体が写っているか、どこに写っているのかを知るために機械学習を使うことがよくあります。しかし、機械学習の知識や経験を得ることは簡単ではないため、自分で機械学習モデルを作ることを諦めている方もいらっしゃるかもしれません。 Amazon Rekognition は、機械学習に詳しくない方でも簡単に機械学習を使った画像分析をご利用いただくためのサービスです。Amazon Rekognition に画像を入力すると、画像に何が写っているのか、有名人の誰が写っているのか、写っている人がどんな表情なのかなどを知ることができます。これらの機能は、あらかじめ決められている対象を分析することができるものですが、お客様が独自に定義した被写体を抽出したり、画像のシーンを特定したい場合は、Amazon Rekognition Custom Labels をお使いいただくことができます。お客様によって用意された画像と各画像に紐づけられたラベル情報を使用して、Amazon Rekognition Custom Labels はお客様独自の機械学習モデル(物体検知モデル、もしくは、シーン分類モデル)を作成します。

Read More

Amazon Rekognition Custom Labelsを利用した動物の特徴的な行動検出

従来、人間は動物の動きを観察し、様々な目的のために利用してきました。例えば、生態学において動態観察は重要であり、いつその行動が起こるのか、どれぐらいの頻度か、個体差があるのかを観察しています。しかしながら、このような動態や動きを識別してモニタリングする事は難しく、長い時間を要する場合があります。そこで、このワークフローを自動化するために、大日本住友製薬株式会社のアジャイルチームのメンバーとAWSのソリューションアーキテクトで、 Amazon Rekognition Custom Labelsを利用したソリューションを開発しました。Amazon Rekognition Custom Labelsは、画像内の特定の動きのラベル付け、そのデータを元にしたトレーニング、検知したい動きのモデル作成を簡単に行う事ができます。 このブログでは、機械学習(ML)がどのようにしてこのワークフローの自動化に役立つのかを楽しく単純な方法で示すために、我々はAmazon Rekognition Custom Labelsを利用して動画に映る猫の特徴的な行動を検知するカスタムモデルを作成しました。我々はこのソリューションのアーキテクチャ、構築手順、ソースコードを公開する事で、上述の領域や生物学、それ以外の領域に寄与できればと考えています。

Read More

Amazon SageMaker が今後も機械学習のトップランナーであり続けることの宣言と、GPU インスタンス料金の最大 18% 引き下げのお知らせ

アマゾン ウェブ サービス (AWS) は 2006 年以来、何百万人にも上るお客様の IT ワークロードの構築と管理を支援してきました。スタートアップ企業から大規模エンタープライズ、公共機関まで、あらゆる規模の組織が AWS のクラウドコンピューティングサービスを利用して、過去に例のないレベルのセキュリティ、回復力、スケーラビリティを実現しています。毎日、お客様はこれまでより短い時間とより低いコストで、実験、イノベーション、本番環境デプロイを行っています。その結果、追求、獲得したビジネスチャンスを、産業グレードの製品およびサービスに変換することが可能になりました。 お客様にとって機械学習の優先順位が上がってくるにつれて、同じ俊敏性と堅牢性を十分に備えた機械学習サービスの構築が求められるようになりました。その結果、フルマネージド型サービスである Amazon SageMaker が AWS re:Invent 2017 で発表、リリースされ、あらゆるデベロッパーやデータサイエンティストが機械学習モデルを高速で構築、トレーニング、デプロイできるようになりました。 Amazon SageMaker は現在、あらゆる業種の数万人に上るお客様が本番環境で高品質のモデルを構築、トレーニング、デプロイするのを支援しています。その例としては、金融サービス (Euler Hermes、Intuit、Slice Labs、Nerdwallet、Root Insurance、Coinbase、NuData Security、Siemens Financial Services)、ヘルスケア (GE Healthcare、Cerner、Roche、Celgene、Zocdoc)、報道およびメディア (Dow Jones、Thomson Reuters、ProQuest、SmartNews、Frame.io、Sportograf)、スポーツ (Formula 1、Bundesliga、Olympique de Marseille、NFL、Guiness Six Nations Rugby)、小売 (Zalando、Zappos、Fabulyst)、オートモーティブ (Atlas Van Lines、Edmunds、Regit)、デートアプリ (Tinder)、ホスピタリティ (Hotels.com、iFood)、産業および製造業 (Veolia、Formosa Plastics)、ゲーム (Voodoo)、カスタマーリレーションシップマネジメント (Zendesk、Freshworks)、エネルギー (Kinect Energy Group、Advanced Microgrid […]

Read More

ヘルスケア・ライフサイエンスチーム プロトタイピング: AWS Amplifyを利用したモバイルアプリ開発

ヘルスケア・ライフサイエンス ソリューション部では、お客様の課題に対してAWSの技術支援やアーキテクティングを実施しておりますが、支援の一つとしてプロトタイピングを提供しています。今回は、塩野義製薬株式会社(データサイエンス室、デジタルインテリジェンス部)、シオノギデジタルサイエンス株式会社と行った、モバイルアプリ開発のプロトタイピングを報告致します。プロトタイピングでのクイックな開発を実現するにあたり、共同でリアルタイムにコーディング可能な統合開発環境(IDE)であるAWS Cloud9と、フロントエンドの実装から、認証、AI、データ登録・参照、Amazon S3に蓄積したログの分析といったバックエンド実装までをAWS Amplifyを利用することで2日間でアプリ開発を行いました。

Read More

Amazon Transcribe で自動言語識別がサポートされるようになりました

  2017 年、自動音声認識サービスの 1 つとして、Amazon Transcribe のサービスが開始され、デベロッパーが 音声をテキストに変換する機能 (speech-to-text) を簡単にアプリケーションに追加できるようになりました。それ以来、多くの言語がサポートされ、リアルタイム対応の 6 言語を含む、31言語で音声録音の変換が可能になりました。 Amazon Transcribe の一般的なユースケースは 、顧客からの電話問い合わせのトランスクリプション(文字起こし)です。これにより、企業は自然言語処理技術を使用してトランスクリプション(文字起こし)したテキストを分析し、感情を読み取ったり、最も一般的な電話問い合わせの理由を特定したりできます。複数の公用語を持つ国や複数の地域で運用する場合、音声ファイルに異なる言語が含まれている可能性があります。したがって、トランスクリプション(文字起こし)を行う前に、適切な言語でファイルを手動でタグ付けする必要があります。これには、通常、多言語スピーカーのチームを編成する必要があり、音声ファイルの処理に余分なコストと遅延が発生します。 メディアおよびエンターテインメント業界では、 Amazon Transcribe を使用して、メディアコンテンツをアクセス可能で、検索可能なテキストファイルに変換することがよくあります。ユースケースには、字幕やトランスクリプトの生成、コンテンツの調整などが含まれます。オペレーションチームは、Amazon Transcribe を品質管理にも利用します。たとえば、抽出されたテキストに含まれるタイムスタンプから音声と動画が同期していることを確認できます。しかし、間違った言語で動画がストリーミングされないようにするために主要な言語をラベル付けしますが、これを検証する方法など、簡単には解決できない他の問題がありました。 本日、 Amazon Transcribe が音声録音で主要な言語を自動識別できるようになったことを発表します。この機能により、手動によるタグ付けが不要になり、より効率的なトランスクリプション(文字起こし)のワークフローを構築できます。Amazon Transcribe を使用して、上記の例に加え、ボイスメール、会議、その他あらゆる録音フォーマットを自動的に認識してトランスクリプション(文字起こし)することが簡単にできるようになりました。 自動言語識別の導入 Amazon Transcribe は 、30 秒以上の音声から効率的に音声言語でトランスクリプトを生成できます。手動でタグ付けする時間やリソースは必要ありません。主要な言語の自動識別は、バッチトランスクリプションモードで 31 言語すべてに対応しています。言語識別は、サンプリング技術により、トランスクリプション処理よりもはるかに高速に数秒で行われます。 すでに Amazon Transcribe を 音声認識に使用している場合は、 StartTranscriptionJob API でこの機能を有効にするだけで利用できるようになります。トランスクリプションジョブが完了する前に、GetTranscriptionJob API が音声録音での主要な言語と、信頼度スコアとして 0 ~ 1 を返します。トランスクリプトには、上位 5 つの言語とそれぞれの信頼度スコアがリストされています。 もちろん、 Amazon Transcribe […]

Read More

金融サービスにおける機械学習のベストプラクティス

本投稿は、金融サービスのお客様が AWS でエンドツーエンドの機械学習ソリューションを構築して運用化する支援をしている Stefan Natu 、Amazon SageMaker のシニア事業開発マネージャーである Kosti Vasilakakis 、アマゾン ウェブ サービス、ワールドワイド金融サービス事業開発の資本市場スペシャリストである Alvin Huang 、アマゾン ウェブ サービスのプリンシパル機械学習アーキテクチャ兼 AI/ML ソリューションアーキテクチャのシニアマネージャー であるDavid Ping の4名による寄稿を翻訳したものです。 先日、AWS は機械学習 (ML) ワークフローを構築している金融機関のためのセキュリティとモデルガバナンスに関する考慮事項の要点をまとめた新しいホワイトペーパー、金融サービスにおける機械学習のベストプラクティスを公開しました。このホワイトペーパーは、セキュリティとコンプライアンスに関する一般的な考慮事項について説明し、エンドツーエンドの例を詳しく説明するハンズオンデモとワークショップの提供を目的としています。このホワイトペーパーでは金融サービスの考慮事項に着目していますが、認証とアクセスの管理、データとモデルのセキュリティ、および ML 運用化 (MLOps) のベストプラクティスに関する情報のほとんどは、ヘルスケアなどのその他の規制対象業界にも当てはまります。 次の図にあるように、一般的な ML ワークフローには複数のステークホルダーが関与します。ワークフローを適切に制御して運用化するには、ビジネスステークホルダー、SysOps 管理者、データエンジニア、ソフトウェアエンジニア、および DevOps エンジニアを含めた複数のチームと連携する必要があります。 このホワイトペーパーでは、各チームのための考慮事項を説明すると共に、Amazon SageMaker と AWS のその他サービスを使用して ML ワークロードを構築、トレーニング、およびデプロイする方法の例と図解も提供します。具体的には、規制された環境でワークロードを実行するお客様からのフィードバックに基づいて、以下のトピックを取り上げています。 セキュアな ML 環境のプロビジョニング – これには以下が含まれます。 コンピューティングとネットワークの分離 – インターネット接続がないお客様のプライベートネットワークに Amazon SageMaker をデプロイする方法。 […]

Read More

【開催報告&資料公開】AWSの機械学習を使った画像データの業務活用セミナー

こんにちは、アマゾン ウェブ サービス ジャパン株式会社の大渕です。2020年9月2日にオンラインで開催された「AWSの機械学習を使った画像データの業務活用セミナー」では、AWS Japan による3つのセッションと、AWS の機械学習サービスを使って宿泊施設向け入退室管理システムを構築されたお客様のセッションが行われました。  

Read More

【開催報告 & 資料公開】 AI/ML@Tokyo #6 AutoGluon 開催報告

アマゾン ウェブ サービス ジャパン株式会社 機械学習ソリューションアーキテクトの宇都宮 (Twitter: @shokout) です。AWS Japan では、AI/ML 関連情報を発信するイベント「AWS AI/ML@Tokyo」を定期的に開催しています。2020年9月3日にオンラインで開催された AWS AI/ML@Tokyo #6 では、AWS ソリューションアーキテクトより、AutoGluon という AutoML を実現する OSS の概要と、AutoGluon を Amazon SageMaker 上で活用するための手法に関して解説いたしました。

Read More

Amazon SageMakerでのディープラーニング学習時における、GPUパフォーマンスチューニングのためのI/O最適化

GPUはディープラーニングの学習スピードを著しく向上させ、学習にかかる時間を数週間からほんの数時間へと短縮させる可能性があります。しかし、GPUを使用する恩恵を十分に得るためには以下の点を考慮する必要があります。 基盤となるハードウェアを十分に稼働させるためのコードの最適化 最新の高性能なライブラリとGPUドライバの使用 GPUの計算と一致する速度でデータがGPUに供給されるためのI/Oとネットワーク操作の最適化 マルチGPUもしくは分散学習の際のGPU間の通信の最適化 Amazon SageMakerは開発者とデータサイエンティストがあらゆる規模で迅速かつ簡単に機械学習(ML)モデルをビルド、学習、デプロイするためのフルマネージドサービスです。この記事では、インフラ基盤やディープラーニングフレームワークに関わらず、Amazon SageMakerでの学習時におけるGPUパフォーマンスの最適化に関して、I/Oの改善の一般的なテクニックに焦点を当てます。典型的には、I/Oの処理ルーチンを最適化するだけで、GPUを用いた学習全体で最大10倍のパフォーマンス向上がみられます。

Read More

[AWS Black Belt Online Seminar] Amazon CodeGuru 資料及び QA 公開

先日 (2020/08/04) 開催しました AWS Black Belt Online Seminar「Amazon CodeGuru」の資料を公開しました。当日、参加者の皆様から頂いた QA の一部についても共有しております。 20200804 AWS Black Belt Online Seminar Amazon CodeGuru from Amazon Web Services Japan AWS クラウドサービス活用資料集(すべての過去資料が閲覧できます) Q. P27 において、AWS CodeCommit でリポジトリを作成する時に CodeGuru Reviewer を有効化することもできれば、後から有効化もできるとのことですが、有効化された時点以降のものしか反映されないのでしょうか? A. はい、既存リポジトリにて CodeGuru Reviewer を有効化した場合、Pull Request ベースのコードレビューに関しましては有効化された以降の Pull Request 内の差分のみをレビューする形となっております。なお、BlackBelt Online Seminar を実施した翌日に、Full Repository Scan の機能が公開となりました。次のご質問で詳しく紹介します。 Q. CodeGuru Reviewer についてですが、新規変更点だけでなく、既存のコードの検査をしてみたいのですが、Pull Request […]

Read More