Amazon Web Services ブログ

Category: Artificial Intelligence

パイオニアが車載カメラ画像の認識でAmazon SageMaker Neo を利用

Pioneer Corp は、デジタルエンターテインメント製品を専門とする日本のグローバル企業です。パイオニア は、カーナビゲーションシステムを通じてドライバーが路面状況や交通状況を把握することをサポートしたいと考えており、ドライバーのナビゲーションをサポートするリアルタイムの画像共有サービスを開発しています。このサービスでは車載カメラから集められた画像の分析を行っており、サービス利用者は路面状況や混雑状況などを把握することができます。  これらの画像は公道上で撮られるものであるため、画像共有時には人の顔や車のナンバープレートを高精度で認識し、マスクしてプライバシーを保護する必要があります。 パイオニア は、Amazon SageMaker Neo を使用して画像共有サービスを構築しています。Amazon SageMaker は完全マネージド型サービスで、これにより開発者ははるかに少ない労力とコストで機械学習モデルを構築、トレーニング、およびデプロイすることができます。Amazon SageMaker Neo は、開発者が一度機械学習モデルをトレーニングすれば、クラウドやエッジデバイス上で推論を実行することのできるサービスです。Amazon SageMaker Neo は、精度を損なうことなく、10 分の 1 以下のラインタイムのメモリフットプリント、最大 2 倍の速度で実行するようにモデルを最適化します。 最初に、MXNet、TensorFlow、PyTorch や XGBoost を使って構築され、Amazon SageMaker を使ってトレーニングした ML モデルを用意します。次に、M4/M5/C4/C5 インスタンスやエッジデバイスなどのターゲットハードウェアプラットフォームを選択します。Amazon SageMaker Neo はワンクリックで、トレーニング済みモデルを実行できるようにコンパイルします。 コンパイラはニューラルネットワークを使用して、特定のパフォーマンス最適化をすべて検出して適用し、ターゲットハードウェアプラットフォーム上でモデルを最も効率的に実行できるようにします。最適化されたモデルをデプロイして、クラウドまたはエッジデバイス上で推論を実行できます。 ローンチ時、Amazon SageMaker Neo は次の 4 つの AWS リージョンで利用できました。米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (アイルランド)、アジアパシフィック (ソウル) です。2019 年 5 月から、SageMaker Neo は日本のアジアパシフィック (東京) […]

Read More

AWS DeepRacer ご利用後のリソース削除方法について

先日 2019年6月12日~14日に開催されたAWS Summit Tokyo 2019 では AWS DeepRacer リーグが行われました。AWS DeepRacer のご利用の際は、ご利用後に使わないリソースを適宜削除し、不要な課金を防いで利用しましょう。 AWS DeepRacer シミュレータのアーキテクチャ この図のように、AWS DeepRacer を立ち上げると、VPC 内に AWS DeepRacer の学習・推論評価用途 SageMaker, RoboMaker、描画、学習データの保存・データ転送に S3, Kinesis Video Stream, NAT Gateway が自動的に起動し、それぞれのサービスに対して課金が発生します。下記では、AWS DeepRacer ご利用後のリソース削除方法を紹介します。 注)本ブログは2019年6月15日時点の仕様を基にしており、今後変更の可能性がございます。   継続的な課金を停止するのに必要なこと リソースの自動削除 一度サービスを立ち上げると、学習・評価が終了しても、一部のサービスが起動したままの状態になっています。継続的な課金を防ぐために、下記の手順で関連リソースを削除することで、継続的な課金が防げます。 AWS DeepRacer → Reinforcement learning → Create model を選択 Account resources で、4つのリソースの左チェック印が緑色の場合、関連リソースが利用可能な状態となっています。 不要な課金を防ぐためには、Reset resources をクリックすれば、S3以外の関連リソースは削除されます。   S3 バケットの削除方法 また、S3バケットの削除は別途行う必要があります。S3 […]

Read More

Amazon SageMaker Neo が、エッジデバイスでの物体検出と画像の分類を支援

野村総合研究所 (NRI) は、日本におけるシステムソリューションおよびコンサルティングサービスの世界的大手プロバイダーであり、APN プレミアムコンサルティングパートナーです。NRI では、顧客が在庫と生産計画を最適化し、コストを削減し、より良いカスタマーエクスペリエンスを創造するのを支援する要求がますます高まっています。こうした要求に応えるために、同社は、顧客のより良い事業運営を支援するために、新しいデータソース、特に動画や写真に目を向けています。 例えば、NRIでは日本のコンビニエンスストアの店内カメラ画像を利用した在庫管理のサポートや、日本の空港で空港利用者の導線パターンを分析し、空港内の利用者の導線の最適化のサポートなど実施もしくは予定しています。 こうしたシナリオでは、物体を検出する機械学習モデルを作成する必要がありました。商品 (飲み物、軽食、紙製品など) や、小売店の店舗を出る人々、空港の通勤者を検出する必要がありました。 NRI は、こうした目標を達成するために Acer と AWS に着目しました。Acer aiSage は、コンピュータビジョンと AI を使用してリアルタイムの洞察を提供するエッジコンピューティングデバイスです。 Acer aiSage は、物体を検出して画像を一度分類するとどこでも実行できるモデルをトレーニングするサービスである Amazon SageMaker Neo、およびローカルコンピューティング、メッセージング、データキャッシング、同期、および機械学習の推論機能をエッジデバイスに提供するサービスである AWS IoT Greengrass を利用します。 NRI の執行役員/DX生産革新本部長である 大元 成和 氏は、「当社の顧客であるヤマハ発動機は、AIによる店舗解析、スマートストア機能の評価を検討中です」と述べています。「こうしたソリューションには、複数のコンピュータビジョンモデルを構築する必要があります。MXNet GluonCV を使用してモデルを構築後、Amazon SageMaker Neo を使用してモデルをコンパイルし、AWS IoT Greengrass を利用して Acer の aiSage にモデルをデプロイします。  Amazon SageMaker Neo は ML フレームワークを抽象化することでモデルのフットプリントを削減し、エッジデバイスでより高速に動作するように最適化できます。当社では、AI ソリューションのエッジ領域までを含めてフルに AWS の技術スタックを活用しています。」 以下は、NRI で物体検出と画像分類が機能している仕組みです。 […]

Read More

Amazon Personalize を使用してレコメンドエンジンを作成する

本日のブログは、Inawisdom より AWS ソリューションアーキテクトのリードである Phil Basford 氏によるゲストブログ投稿です。 re:Invent 2018 にて AWS は Amazon Personalize を発表しました。これは初めてのレコメンデーションエンジンを迅速に稼働させることを可能にし、エンドユーザーやビジネスが価値を即座に実現できるようにするものです。データサイエンスへの理解が深まるほど (すでに理解している場合でも)、Amazon Personalize が持つ層の厚い機能を活用してレコメンデーションを改善していくことが可能です。 Inawisdom で働いていているうちに、私は機械学習 (ML) とディープラーニングの用途がますます多様化していることに気付きました。私はほぼ毎日、エキサイティングな新しいユースケースに取り組んでいますが、とても楽しいです。 最もよく知られている ML のユースケースの成功例には、小売業のウェブサイト、音楽ストリーミングアプリ、ソーシャルメディアプラットフォームがあります。これまで何年にもわたり、これらの業界ではユーザーエクスペリエンスの中心に ML テクノロジーを組み込んでいます。通常、履歴データポイントとリアルタイムのアクティビティ (クリックデータなど) に基づき、各ユーザーにカスタマイズしたレコメンドをそれぞれ提供します。 Inawisdom は幸運にも早期アクセスを与えられ、プレビュー期間であった Amazon Personalize を試してみることができました。それも、データサイエンティストやデータエンジニアではなく、AWS ソリューションアーキテクトの私にアクセスをくれたのです。予備知識もないのに、ほんの数時間で Amazon Personalize からレコメンドを取得することができました。この記事では、私が行った方法について説明します。 概要 リコメンデーションエンジンを構築する上で一番大きな挑戦は、どこから手を付ければよいかの判断が難しいことでしょう。ML の経験が限られている、あるいはほとんど経験がない場合には、さらに困難となります。ただし、以下に挙げることを自分が知らない (そして理解する必要がある)ということを認識していることは重要です。たとえば、 どのデータを使用するか。 どうやって構造化するするか。 どのようなフレームワークやレシピが必要か。 データを使ってどのようにトレーニングするか。 正しいかどうかを、どうやって知るのか。 リアルタイムアプリケーション内で、どのように使用するのか。 大筋で言うと、Amazon Personalize はしくみを提供し、上記の事項を使ってユーザーを誘導しながらサポートしてくれます。あるいはデータサイエンティストであれば、実装のためのアクセラレータとして Amazon Personalize を利用することも可能です。 Amazon […]

Read More

AWS の機械学習サービスを使用してエンタープライズクラスの安定したスマートボットを構築する

Abbott Laboratories は、現場チームが他のクライアントと現場で解読できる以上のデータを持っています。  彼らのソリューションですか? スマートボットと連携して、Amazon Lex、AWS Lambda、Amazon Comprehend、Amazon SageMaker などの AWS の機械学習サービスを利用した、Maya と呼ばれるエンタープライズクラスの信頼性の高い安定したチャットボットを構築します。 背景としては、Abbott Laboratories は多国籍の医療会社であり、インドで AI をデプロイしている先駆者です。  Maya は、インドで Abbottの 3,000 人以上の現地従業員に対応し、営業活動をサポートして、従業員が手元で状況に応じた情報へアクセスできるようにします。 チャットボットは、従業員が現場で医師と打ち合わせをしている際に特に役立ちます。Maya がエンタープライズアプリケーションからの情報の照会や取得の非常に重要な部分を処理できるため、従業員は高レベルの作業に集中できます。 Maya は、Abbott の CRM (顧客関係管理) システムと統合されています。それぞれの照会で、ボットがユーザーに代わって認証を受け、必要な情報を取得します。 Amazon Lex が言語モデルを有効にする Amazon Lex は、Maya ソリューションの中核であり、バックエンドシステムからの会話の流れやデータアクセスプロトコルに関する長い議論の末に選ばれました。 チームは、会話の流れからインテントを特定しました。現在の Maya は、50 以上のインテントを備えています – ボットをより人間的にするための「ちょっとした世間話」のインテントを含めて、250 スロット近くになります。大半のインテントは、データ関連のアクション (たとえば、フィルター処理、計算など) を中心にしています。ちょっとした世間話のインテントは、「あなたの助けに感謝します」のようなフレーズを扱います。 Lambda が応答を決定する 50 のインテントのすべてが、単一の Lambda 関数にリンクされています。以下の手順は、関数を呼び出すすべてのリクエストに対して実行されます。 ビジネスルールに基づいてスロットを検証します。 新しく処理されたスロットに関連するすべての登録済みメソッドを呼び出します。 […]

Read More

AWS サービスを使用した独自のリアルタイム音声翻訳アプリケーションの構築

ある言語で何かを言うと、ツールが即時にそれを他の言語に翻訳することを想像してみてください。AWS のサービスを使って独自のリアルタイム音声翻訳アプリケーションを構築できればますます素晴らしいと思いませんか? そのアプリケーションは銀河ヒッチハイク・ガイドに登場するバベルフィッシュに匹敵するものになるでしょう。 「小さくて黄色の、蛭みたいな恰好で、これは宇宙で最も奇怪な道具だけど、このバベルフィッシュを耳に装うだけで世界中のどんな言葉も聞き取ることができる」 ダグラス・アダムス、銀河ヒッチハイク・ガイド この記事では、AWS の複数のサービスを接続して、バベルフィッシュのように機能する独自のアプリケーションを構築する方法をご紹介します。 このブログ記事について 読む時間 15 分 完了するまでの時間 30 分 完了するためのコスト 1 USD 未満 学習レベル 中級 (200) AWS のサービス Amazon Polly、Amazon Transcribe、Amazon Translate、AWS Lambda、Amazon CloudFront、Amazon S3 概要 このアプリケーションの中核は、以下の AI 言語サービスをつなげる AWS Lambda 関数で構成されています。 Amazon Transcribe – 完全マネージド型で継続的に訓練されるこの自動音声認識 (ASR) サービスは、音声を取り込み、正確なトランスクリプトを自動で生成します。Amazon Transcribe はリアルタイムの文字起こしをサポートし、これはほぼリアルタイムでの変換の実現に役立ちます。 Amazon Translate – このニューラル機械翻訳サービスは、高速、高品質、かつ低価格の言語翻訳を提供します。 Amazon Polly – このテキスト読み上げサービスは、人の声のように聞こえる音声を合成するために、高度な深層学習テクノロジーを使用します。 以下のイラストは、これら 3 […]

Read More

【アップデート】AWS DeepLens が国内で予約注文できるようになりました

2017 年の AWS re:Invent で、私たちは世界初の機械学習 (ML) 対応ビデオカメラ、AWS DeepLens を発表しました。開発者はプログラム可能なビデオカメラ、チュートリアル、コード、および ML スキルを拡張させるよう設計された事前トレーニング済みのモデルを使って ML を利用できます。AWS DeepLens を使用すると、コンピュータサイエンスや数学の博士号がなくても効果の高い ML プロジェクトを作成できます。ある程度の開発経験がある人なら誰でも使い始めることができます。 次のウェブサイトで、カナダ、欧州、日本の開発者が AWS DeepLens (2019 年版) を予約注文できるようになりました。 Amazon.ca Amazon.de Amazon.es Amazon.fr Amazon.it Amazon.co.jp Amazon.co.uk お客様の体験をさらに向上させるために、一世代前のデバイスから次の点を強化します。 すぐに ML を始められるようオンボーディングプロセスを最適化 Intel RealSense 深度センサーのサポートし、より高精度で高度な ML モデルを構築可能 2-D 画像入力に加えて深度データを使用可能 外部の Intel アクセラレータを使用して追加の AI パフォーマンスを達成したい人向けの Intel Movidius Neural Compute Stick をサポート 2019 年版は、Amazon SageMaker […]

Read More

思い出をとらえる: GeoSnapShot が、Amazon Rekognition を使用してアスリートを識別

スポーツイベントに出場し、後で自分で見つけるためにイベントの写真を念入りに調べたことがある方なら、GeoSnapShot による Amazon Rekognition を搭載した革新的なソリューションに感謝するでしょう。 GeoSnapShot の創業者である Andy Edwards 氏は、ハイレベルの乗馬の選手である妻と乗馬イベントに同行し、妻や妻の友人を撮影することからスポーツ写真の世界に入りました。全員の素晴らしい写真を撮ることは楽しかったのですが、全員を識別し、それぞれの人に写真を配布するのに必要だった手作業で時間がかかるプロセスには失望していました。彼は他の多くの写真家が同じ状況であることに気づきました。悲しいことに、単に選別プロセスが難しかったために、彼らが捉えた特別な思い出が失われていたのです。 実際に、世界中の写真家やスポーツ組織の多くが関連するこの課題を解決しようと決意して、Andy は 2013 年に GeoSnapShot を設立しました。同社はイベント主催者と提携し、自撮りした写真を選択してアップロードするすべてのアスリートが自分の画像をすばやく簡単に見つけることができるようにします。これは、Amazon Rekognition を使用して、2 つの方法で行われます。利用者の自撮り写真とイベントの写真の直接比較と、競技のゼッケン番号を識別する光学式文字認識を行います。GeoSnapShot は、こうした入力を使用して、数千枚ものイベント写真をほぼリアルタイムで処理できるため、イベント主催者が何時間も費やす必要があった、ゼッケン番号と選手名を手作業で一致させたり、選手ごとに写真を分類したりする作業をスピードアップできます。 この困難な作業のため、今までは、選手たちが写真を利用できるようになるまで数日から数週間待つ必要がありました。現在は、GeoSnapShot のスポーツ写真撮影のためのユニークなソリューションのおかげで、選手は汗が乾く前に自分の写真を確認できるようになりました。その結果、イベント主催者向けの写真販売はほぼ 30% 増加し、顧客満足度は大幅に向上しました。 GeoSnapShots のソリューションは 92 カ国で使用されており、アマチュア写真家も専門家も同様に、AWS 上に構築されたこのユーザーフレンドリーなソリューションを賞賛しています。おそらく、この技術の力の真の証明は、人気のある世界的な持久力イベント会社の Tough Mudder が最近 GeoSnapShot を使い始めたという事実でしょう。Tough Mudder の参加者は、その競争の特徴として頭からつま先まで泥まみれになるためにほとんど認識できないことが多いですが、それでも GeoSnapShot の利用者の識別は成功しています。(もちろん、競技参加者はわざわざ泥で覆われた自撮り写真をアップロードする必要はありません。 より魅力的な写真でもうまく機能します。) Tough Mudder のライブイベント担当副社長である Johnny Little 氏は、「行った思い出を追体験することは参加者にとってとても重要です。GeoSnapShot は、世界中のあらゆる Tough Mudder のイベントに最適なソリューションを提供しています」と述べています。 Andy は、同社のソリューションの基盤として AWS AI を賞賛します。「AWS は、私たちが事業の構築を始めたときに最も柔軟性の高いテクノロジープラットフォームを提供してくれました。GeoSnapShot […]

Read More

Gluon Time Series でニューラル時系列モデルを作る

オープンソース版 Gluon Time Series (GluonTS) の一般公開したことを喜んでお知らせいたします。これは、Amazon の研究者達が、深層学習をベースにした時系列モデルの構築、評価、比較のために開発した、Python のツールキットです。GluonTS は、Apache MXNet のための Gluon インターフェースをベースにしており、時系列モデルの構築を、シンプルかつ効率的にするコンポーネントを提供します。 今回のブログでは、このツールキットの主要な機能を解説すると共に、GluonTS を時系列予測問題に応用する方法も示します。 時系列モデルのユースケース その名前が示すとおり、時系列モデルとは時刻でインデクスされたデータポイントの集合のことです。多くの多様なアプリケーションにおいて、時系列は自然と生み出されています。典型的なものとしては、基本プロセスから生じるデータを、固定的な時間間隔で測定する場合があります。 例えば、毎営業日の終わりに、小売業者は各製品が単体でいくつ売れたか計算し、記録しておくでしょう。これは、各製品の日々の販売数についての時系列データとなります。電力会社の場合なら、1時間毎など固定的な時間間隔で、各家庭が消費する電力量を測定するでしょう。これは、電力消費に関する時系列データを集めることになります。AWS のお客様であれば、ご使用のリソースやサービスに関係する複数のメトリクスを、Amazon CloudWatch を使い記録するでしょう。それは、メトリクスの時系列を集めることになります。 一般的な時系列は、次に示すように、測定された値を縦軸の目盛りに、時刻を横軸に取る形式となります。 時系列データが入手できたら、それについていくつかの論点を考えることができます。 その時系列は将来どう変わってゆくか? 予測 特定時刻における時系列の動きに変則性があるか? 異常検出 与えられた時系列はどのグループに分類されるか? 時系列の分類 いくつか欠測値があった場合、その値は何であったか? 補完 GluonTS では、時系列モデルの構築を簡素化しているので、前出のような問題に対処することが容易になります。モデルとは、時系列の基礎に存在するプロセスを数学的に記述したものです。これまで、多数の時系列モデルが提案されてきていますが、GluonTS では、これらのテクニックの中でも、機械学習を応用した特定のサブセットにフォーカスしています。 GluonTS の主要機能とコンポーネント GluonTS では、深層学習ベースの時系列モデル構築を簡素かつ効率的に行える、多数のコンポーネントが用意されています。これらのモデルには、自然言語処理や画像処理など他の領域で使われるものと同じ、多くの構成ブロックがモデルとして利用されています。 時系列モデルを処理する深層学習モデルには、Long Short-Term Memory (LSTM) セルを基本とした再帰型ニューラルネットワークや、コンボリュージョン、アテンション機構などのコンポーネントが一般的に含まれますそのため、Apache MXNet などのモダンな深層学習フレームワークが、モデルの開発と実験をするための便利な基盤として使えるようになっています。 しかし、時系列モデリングには、その応用領域に特化したコンポーネントも、しばしば必要とされます。GluonTS では、そういった時系列モデリングに独特なコンポーネントを、MXNet のための Gluon インターフェース上で提供します。GluonTS が持つ特徴としては以下が挙げられます、 新規モデル構築のための高レベルなコンポーネント。Sequence to Sequence モデルなどの一般的なニューラルネットワーク構造、モデリングや変動確率分布のためのコンポーネントを含みます […]

Read More

Bewgle が AWS を原動力にして、非構造化テキストをインサイトに変える

SAP.iO および Techstars の資金提供を受ける企業である Bewgleは、AWS のサービスを使用してユーザー側で生成されたテキストや音声ストリームからインサイトを浮上させます。同社はインサイトの生成により、美容器具や電子機器といったさまざまな製品において、顧客満足度やエンゲージメントの向上を目指すプロダクトマネージャーのサポートを行っています。  AWS の技術を原動力とする Bewgle の支援を受けて顧客の声に耳を傾けると、プロダクトマネージャーは製品の売り上げの増大が実現できるようになります。 平均的な人間が 1 分間に読める文字数は約 250 字にすぎません。そのため、1000 件のカスタマーレビューをまとめるには、8 時間あまりかかってしまいます。すると、こうしたレビューすべてに加え、フォーラム投稿やブログ投稿のようなその他のテキスト、そしてアンケート結果の逐語的記録や音声ストリームを分析することなど実行できるはずがありません。 AI、特に natural language processing (NLP) と呼ばれる機械学習 (ML) が優れているのはまさにこの分野です。Bewgle の中心的なソリューションは AWS 上ですべてが開発された AI プラットフォームで、数百万規模のコンテンツを分析し、キートピックおよびその背後に潜む感情を抽出します。Amazon Machine Learning および AWS テックスタック全体では、通常なら数年かかる作業をわずか数分で完了できます。 Bewgle のソリューションはまさに、幅広い AWS のサービスを活用しているのです。Bewgle のデータ処理パイプラインが依存する AWS Lambdaおよび Amazon DynamoDB は以下の ML タスクのコアを形成します。 大規模な分析データを保存する。 データのクリーンアップする。 さまざまな処理機能をダイナミックに活用して分析を生成する。 チームは、システムのスケーリング、大まかに結合されたさまざまなワークフローを組織するために、革新的でサーバーレスな ML ワークフローを開発しました。チームはこれにより、さまざまなアプローチを評価、選択するにあたって驚異的な俊敏性および柔軟性を得て、スピーディーなイノベーションを推進することが可能になりました。 Bewgle のワークフローは通常、大規模かつオンデマンドのデータの収集、タグ付けを行うAmazon […]

Read More