Amazon Web Services ブログ

Category: Artificial Intelligence

Amazon Rekognition Video を使用して、大規模なコンテンツを簡単に管理できる自動アラートシステムを構築する

ビデオを制作したり、ビデオを見るのに時間を費やしたり、ビデオを共有したりする人々が急激に増えつつあります。今日制作されるビデオの大半はユーザーが作成したコンテンツですが、こうしたコンテンツをそのまま公開するとリスクが生じます。不適切なコンテンツや望ましくないコンテンツを削除して、顧客にとって肯定的なウェブサイト体験を確保するために、企業はスケーラブルなコンテンツモデレーションプロセスが必要です。 このブログ記事では、Amazon Rekognition Video を使用してコンプライアンスとモデレーションを強化するために、ビデオコンテンツを評価するためのサーバーレスアーキテクチャを構築する方法を説明します。顧客 (特にメディアやエンターテインメント企業) は、対象者の年齢に応じたコンテンツを構築したり、ビデオで不適切なコンテンツを識別したりするために、ビデオを分類するという課題に直面しています。Amazon Rekognition Video は、物体の経路を追跡し、アクティビティを検出し、物体、有名人、コンテンツのタイプを認識する、深層学習による動画分析サービスです。Amazon Rekognition Video は明示的で疑わしいコンテンツを検出できるため、アプリケーションやコンプライアンスの要件に基づいてビデオをフィルタリングできます。 従来、ビデオ内でのコンプライアンスは企業にとって手作業であり、ビデオを検証するには完全に視聴する必要がありました。このプロセスは時間がかかり、スケーラビリティがなく、間違いが発生する可能性がありました。私たちが提案するソリューションは、オペレータの手作業の効率を大幅に改善し、レビューされるビデオコンテンツの量を減らし、レビュー担当者はフラグが立てられたコンテンツにのみ集中することができます。このブログ記事で使用されているサーバレスソリューションは Amazon Rekognition であり、費用対効果に優れたスケーラブルなコンテンツモデレーションプロセスを顧客に提供します。これは、企業がビデオをモニターし公開するのに役立ちながら、肯定的な顧客体験を保証し、潜在的な評価に関するリスクを限定します。 ソリューションを起動するには、次の AWS CloudFormation スクリプトを使用します。   ソリューションのアーキテクチャ概要 この例では、不要なコンテンツのフラグが設定されているビデオのコンテンツ管理者に警告する、実際のユースケースに近い例を取り上げます。コンテンツのパイプラインに統合するために、Amazon S3 イベントを使用するワークフロートリガー (新しいアセットの到着)、Amazon DynamoDB を使用するコンテンツメタデータストレージ、および Amazon Glacier を使用するデジタルアセットアーカイブで表現します。この例では、最小限のコードベースによって、Amazon Simple Notification Service(SNS)、AWS Lambda、Amazon Rekognition を使用するサーバーレスワークフローのカップリングのシンプルさを示しています。 アセットを取り込む Amazon S3 バケットにメディアをアップロードした直後に処理が開始されます。Amazon S3 イベント通知が、ビデオファイルで StartContentModeration API アクションを開始するビデオプロセッサ Lambda 関数をトリガーします。Amazon Rekognition Video によるメディア処理の完了ステータスは、Amazon SNS を介して取得され、次にコンテンツ警告 Lambda […]

Read More

身元確認に Amazon Rekognition を使うことで、これまで銀行を利用できなかった人々を自立させた Aella Credit 社

Aella Credit 社は、西アフリカに本拠を置く金融サービス会社で、生体的データおよび雇用主のデータを利用し、新興市場で証明できる収入源を持つ個人に即時融資を提供しています。 新興市場では、リテール銀行サービスに簡単にアクセスできない人々にとって、身元確認と検証は大きな課題の 1 つです。Aella Credit 社はこの問題を解決するため、深層学習を基礎とした画像およびビデオ解析サービスの Amazon Rekognition を使って、モバイルアプリケーション上で生体的身元確認を行っています。アプリケーションで Rekognition を使用することで、自身の身元確認を行い、問題を最小限に抑えて銀行サービスにアクセスすることが可能となります。 「新興市場にいる何十億人もの信用を構築する上で、ユーザーを正確に識別できないことは、とても大きな障害でした。」と、Aale Credit 社の最高技術責任者かつ共同創設者である Wale Akanbi 氏は言います。「当社のモバイルアプリケーション上で本人確認を行うのに Amazon Rekognition を使用することで、エラーが大幅に減り、ビジネスを拡大することが可能となりました。」 この機能を使って、政府発行の ID 写真をアップロードしてから、確認のために自分の写真をリアルタイムで撮影します。Aella Credit 社はまず政府発行の ID を政府のデータベースで検証した後、Amazon Rekognition を使用して、2 つの画像を比較し、一致しているかどうかを確認します。 「今では、人間が操作しなくても個人の身元をリアルタイムで検出および確認できるようになったので、当社のサービスにより早くアクセスできるようになりました。」と Akanbi 氏は言います。「 Amazon Rekognition のおかげで、当社のお客様の顔を効果的に認識できるようになりました。また、KYC (Know Your Customer 、顧客確認 ) にも有効で、重複するプロファイルやデータセットを検出できます。」  そのしくみ プロフィール写真を撮影し、申請プロセスを完了します。 顔が検出され、アプリケーション処理が完了します。 「 Amazon Rekognition を選んだのは、使いやすさと一貫した正確性のためです。」と Akanbi 氏は説明します。「よく宣伝を見る様々なソリューションを試しました。でも、いろんな肌の色合いを正しく認識できるものはありませんでした。いろんな肌の色を持つ顔の検出するのに、他のソリューションだと 40% の精度しかないのですが、ReKognition の精度は一貫して […]

Read More

Curalate は、AWS で Apache MXNet を使用して AI によるソーシャルセールを行う

Curalate は、ブランドが SNS での影響力を販売に変換するのをサポートします。フィラデルフィアにあるこのスタートアップ企業は、デジタルに精通した消費者にとって、ソーシャルチャネルで見られる製品と、まったく同じ製品を購入できる場所との関連付けを容易にします。以前は、消費者はソーシャルイメージから特定の製品を見つけるには、オンラインカタログで捜し求めなければなりませんでした。Curalate を利用すれば、購入できる場所に製品を自動的にリンクすることができます。 すべてのソーシャルメディアへの投稿は潜在的影響力を持つので、ブランドはソーシャルユーザーが生成した単語、画像、ミームを活用して、多くの声で合唱効果を生み出すことができます。 「私たちは、発見プロセスをオンラインにしています。私たちの製品は、店を歩いているときに何かを見るのと同じ方法で、インスタグラムやその他のソーシャルチャンネルでこうしたつながりを作るのに役立ちます」と、Curalate の研究エンジニアである Jesse Brizzi 氏は説明します。 Neiman Marcus や J.Crew を含む 1,000 社以上のブランド企業や小売業者、そして 1 ヶ月に 1 億人以上の消費者が Curalate を使用しています。これらのブランドは、Curalate のソーシャルコマースプラットフォームを利用して 1 回の訪問で 20〜50 % の収益増加を実現し、製品の発見を最大で 60 倍に増加させています。Karl Lagerfeld の場合、Curalate の画像認識技術を使用して写真にタグを付けることで、顧客が商品を手に入れるための最も速くて最も効果的な方法を可能にしています。 Curalate の成功の要因は、ソーシャルメディアでの製品の発見を促進する AWS の深層学習技術です。Curalate のインテリジェント製品タグ付け (IPT) サービスを使用する顧客は、ユーザーが作成したソーシャルコンテンツの収集と管理をパイプラインで自動化し、カタログ内の適切な製品に接続することができます。IPT は、Apache MXNet フレームワークを使用して開発された深層学習アルゴリズムを使用してトレーニングされており、これを使用するブランド企業は購入者に推奨する製品と画像を簡単に一致させることができます。 Brizzi 氏は次のように述べています。「当初、顧客は手作業で製品にタグを付けなければなりませんでした。アイテムをクリックする場所、タグを付ける場所、製品カタログの中に入って手作業で一致させる場所。ところが現在は深層学習で一致させることができるので、それを確認するだけです。IPT を使用することで、時間を節約し、精度を向上させ、消費者が時間を無駄にすることなく簡単に商品を見つけられるよう支援することができます。」 MXNet を使用して、Curalate は AWS で実運用モデルを迅速に構築およびデプロイすることができます—Amazon EC2 P3 […]

Read More

Amazon Translate が Memsource 翻訳管理システムで利用可能に

本記事は Memsource のソリューションアーキテクトチームのチームリードを努める Andrea Tabacchi によるゲスト投稿です。 Memsource では最先端の翻訳ソリューションを強化する注目の新統合を常に模索しています。ローカライゼーション業界では引き続き機械翻訳 (MT) が話題の中心ですが、Memsource ではお客様の増大する MT ニーズに相応しいイノベーティブな MT エンジンとの統合に重点を置いています。 特に、Memsource では Amazon Translate など、ニューラル機械翻訳 (NMT) エンジンを提供するために全力を尽くしています。NMT が大きな影響力を持つテクノロジーであることは明らかです。NMT の成果物の品質は継続的に改善され、パワフルな生産性向上ツールとなり、その結果さらに需要増につながっています。独自の深層学習メソッドを搭載した Amazon Translate は、翻訳およびローカライゼーション業界において、その足跡を残し始めました。Memsource にとって、自社の MT エンジンにこれを組み込むことが優先事項となっています。また、この製品は既存の AWS のお客様にも自然に適合するようになっています。 また、このエンジンが Memsource の事業的な対象、特に、B2C (一般消費者向けビジネス) に一致するということも魅力の 1 つです。Amazon Translate は消費者向け製品やコミュニケーション、そして、機械翻訳を使用して、同社が解決したローカリゼーション関連の問題にまつわる Amazon の専門知識に基づいて構築されています。 Memsource-Amazon Translate の統合はどのように機能するか? Memsource と Amazon Translate は Amazon Translate API を介してつながっています。 つまり、ユーザーは自分の […]

Read More

Amazon Rekognition を利用して人身売買と戦う Marinus Analytics 社

Marinus Analytics 社は女性が経営する 2014 年に創設した会社で、ビッグデータを実用的なインテリジェンスに変える AI ツールを構築しています。特に、Amazon Rekognition の顔認識機能といった人工知能の利用に積極的で、人身売買の被害者を発見し、家族と再会ができるよう取り組んでいます。 Marinus Analytics 社の社長兼共同創業者である Emily Kennedy 氏は、「人間は人工知能を恐れるべきではないと思います。人間は他の方法よりもはるかに優れた結果を出し、広域に影響を与えることができるからです。」と言います。「Marinus Analytics 社にとって、人身売買と戦っている人たちが、当初はどうにもしようのない山ほどのデータを目の当たりにしながらも、難しい課題を克服するために AI 技術を使い、命を救うことができたのは、幸運なことでした。」 Marinus Analytics 社は、Amazon Rekognition などの人工知能を利用し、Traffic Jam といった被害者の特定や発見を支援するツールを機関に提供し、人身売買の調査に携わっている人たちを支援しています。Traffic Jam は Amazon Rekognition を利用して作動し、FaceSearch と呼ばれる顔認識機能を備えています。このツールを使用すると、数百万の記録を秒単位で自動的に検索する画像解析が可能となり、貴重な時間を節約することができるのです。これで、Traffic Jam を使わずに解析する方法と比較して、著しい改善をもたらすことができます。 Kennedy 氏の説明によると、「 Traffic Jam を使わないと、何千ものオンライン広告を手作業で選別することになります。」「つまり、コンピュータに張り付いて、マッチングするかもしれないと期待しつつ、画面にある被害者の写真を、オンライン上のあらゆる写真と比較しているのです。ですが昔と違って現在では、このような重要なタスクは、Amazon Rekognition のような AI 技術を使用することで、より正確にそして数秒で行えるようになりました。被害者が次の町へと移動してしまう前に、限られた時間で彼らを見つける必要がある場合には、特に大事なことなのです。」 Marinus Analytics 社が開発のプロセスにあった頃、複数のコンピュータ・ビジョン・サービスをテストしつつ、人身売買のケースの捜査官が使うツールをテクノロジーで補完できるかどうかを調査していました。多くのサービスでデータをテストしましたが、残念ながら利用できそうなサービスは見つかりませんでした。分析に必要な画像は通常きめが粗く、顔がカメラから遠く離れたところにあるのが普通で、さらに適切な照明のもとで写真が撮影されることはあまりないからです。 しかし、2017 年に Amazon Reognognition を発見し、必要とする AI ツールの類であると分かったのです。 「 Amazon […]

Read More

Twilio が、Amazon Polly との統合で、幅広い音声選択を顧客に提供

Twilio は、コミュニケーション体験を構築するためのスケーラブルなクラウドプラットフォームを提供することにより、開発者や企業が音声、メッセージング、ビデオ用のシンプルで強力な API を使用して、あらゆる顧客関与のアプリケーションを構築することを可能にします。Morgan Stanley、Marks&Spencer、Netflix、Lyft、Airbnb やその他 5 万以上の企業が、Twilio プラットフォームを使用して顧客とコミュニケーションする方法を近代化しています。 開発者は、最新のインタラクティブな音声体験や仮想アシスタントを構築するための基盤として、Twilio の TTS (Text-to-Speech) 機能を使用しています。TTS を使うと、静的で事前に録音されたメディアファイルを再生するのではなく、動的に生成される人間の声を使用してより自然な音声による顧客体験を構築することができます。本日より、Twilio は、Amazon Polly との統合により、より素晴らしい TTS による音声選択と顧客のコントロールを提供します。 26 言語にわたる 53 種類の声で、顧客は Twilio プログラム可能音声アプリケーションの発信者とのコミュニケーションで理想的な声を選択することができます。Amazon Polly での音声合成マークアップ言語 (SSML) サポートにより、開発者は発音、イントネーション、タイミングなど合成音声出力をより詳細にコントロールすることができます。こうした SSML の機能は、音声体験を洗練し、より自然な体験を提供するのに役立ちます。 Twilio の Amazon Polly Text-To-Speech との統合の詳細については、Twilio の発表を参照してください。 今回のブログ投稿者について Binny Peh は AWS Machine Learning ソリューションのシニアプロダクトマーケティングマネージャーです。余暇にはテレビを思う存分楽しみ、美味しいものの追及に余念がありません。Binny のグラスはいつも半分だけいっぱい。これぞ、彼女の積極的な性格の表れだと、自負しています。

Read More

Amazon SageMaker MXNet 1.2 コンテナの発表

Amazon SageMaker の構築済み MXNet コンテナで、最新リリースの Apache MXNet 1.2 の使用を開始しました。  Amazon SageMaker は、開発者やデータサイエンティストが、機械学習モデルをあらゆる規模で、迅速かつ簡単に構築、トレーニング、デプロイできるようにする完全マネージド型プラットフォームです。  また、構築済み MXNet コンテナにより、深層学習スクリプトを自然に記述するのが容易になるととも、Amazon SageMaker における分散型のマネージドトレーニングやリアルタイムの製品ホスティングの活用も可能にします。 MXNet 1.2 には使いやすさ、より優れたパフォーマンス、強化された相互運用性などといった特徴があります。 また、この製品により、新しいインテル MKL-DNN との統合が追加され、コンボリューション、デコンボリューション、コンピューティングに最適化された C5 インスタンスのプールなどのニューラルネットワーク演算が高速化されます。拡張 FP16 のサポートにより、NVIDIA Volta V100 GPU 搭載の Amazon EC2 P3 インスタンスでの Tensor Core の混合精度トレーニングが高速化されます。最後に、MXNet 1.2 には、Open Neural Network Exchange の新しい形式 (ONNX) のモジュールが付属しているため、ONNX モデルを MXNet のシンボリックインターフェイスにインポートできます。 ONNX は PyTorch、Caffe2、Microsoft Cognitive Toolkit (CNTK)、Chainer、MXNet […]

Read More

自分で事前にトレーニングした MXNet または TensorFlow のモデルを Amazon SageMaker に導入する

Amazon SageMaker は、ML モデルをトレーニングおよびホストするための容易なスケーラビリティとディストリビューションを提供するだけでなく、モデルをトレーニングするプロセスとモデルのデプロイメントを分離するようにモジュール化されています。これは、Amazon SageMaker 以外でトレーニングされたモデルを SageMaker に導入してデプロイできることを意味します。すでにトレーニングを受けたモデルがあり、パイプライン全体ではなく SageMaker のホスティング部分だけを使用したい場合は、これは非常に便利です。また、これは自分のモデルをトレーニングしないが、事前にトレーニングされたモデルを購入する場合にも便利です。 このブログ記事では、TensorFlow または MXNet でトレーニングした自分のモデルを Amazon SageMaker にデプロイする方法について説明します。以下は、プロセス全体の概要です。 ステップ 1: モデル定義を、選択したフレームワークで記述します。 ステップ 2: モデルを、そのフレームワークでトレーニングします。 ステップ 3: モデルをエクスポートし、Amazon SageMaker が理解できるモデル成果物を作成します。 ステップ 4: モデル成果物を Amazon S3 バケットにアップロードします。 ステップ 5: モデル定義、モデル成果物、Amazon SageMaker Python SDK を使用して、SageMaker モデルを作成します。 ステップ 6: SageMaker モデルをエンドポイントとしてデプロイします。 モデルとは何か?、そしてどうすれば手に入るのか? トレーニングされたモデルファイルとは、単にトレーニングプロセスによって作成されたモデル成果物です。これには、モデルのすべてのパラメータの値と、モデルのアーキテクチャに関する追加のメタデータが含まれていて、これらのパラメータが互いにどのように接続されているかを示します。フレームワークが異なると、モデルファイルをエクスポートする方法も異なります。 TensorFlow TensorFlow のモデルは、トレーニングされた TensorFlow Estimator からエクスポートできます。モデルファイルは、Amazon SageMaker がそれを理解できるようにするためのプロトコルに従わなければなりません。 単純な TensorFlow Estimator […]

Read More

Thorn が児童性的虐待、児童売買との闘いで Amazon Rekognition と連携

Thorn は、児童性的虐待資料の拡散を阻止し、児童人身売買業者に立ち向かうことに尽力している非営利団体です。Thorn のツールは、2017 年には性的搾取を目的とした児童人身売買の被害者 5,894 人を割り出し、性的虐待の録画が拡散された 103 人の子どもたちを救出しました。Thorn は Amazon Rekognition のような AWS 製品を使用して、調査時間を 65% 削減しました。これで、もっと速く、もっと多くの犠牲者を探すことが可能になります。 「Amazon Rekognition は Thorn のすばらしいパートナーです。子どもたちを性的虐待から守るという私たちのミッションにおいて画像および動画分析を活用できるのは Amazon Rekognition のおかげです」と Thorn の CEO、Julie Cordua 氏は言います。「加害者たちは最先端の技術を悪用し、子どもたちを食い物にしています。性的な目的で子どもたちをオンラインで売り、虐待の画像と動画を流通させ、虐待をライブストリーミングで配信しているのです。AWS は、この問題解決の一翼を担うことを決めました。パートナーとなってその製品を活用することで、食い物にされている子どもたちの早期発見と虐待撲滅に協力しています。AWS のように先端技術を持つ企業とのコラボレーションは、そうした子どもたちをいち早く見つけ、児童性的虐待資料の拡散に終止符を打つために必要なツールを作り上げるうえで非常に重要です」 性的搾取を目的とした児童売買に関する数千におよぶ広告を調査員がより効率的に、より早く鑑別できるように、Thorn は Amazon Rekognition を使用して Spotlight ツールを強化しています。インターネットに掲載されるこの種の広告は毎日およそ 150,000 にのぼるため、このツールの存在は児童売買との闘いにおいては欠かせません。 そうした広告から検出された情報は Spotlight に送られ、立件、被害者の身元特定、そして最終的にはその子どもの奪還に必要な情報を調査員に提供します。 「いくつかの重要な機能で Amazon Rekognition に依存している Spotlight は、決定的なツールと言えます。これにより、児童売買との闘いに尽力している人たちは、虐待や売買の膨大な資料を鑑別できるようになりました」と、Cordua は述べます。「とにかく、被害者の子どもが最優先です。調査時間が 65% 削減されたことで、さらに多くの被害者をさらに早く発見していきます」 Amazon Rekognition の詳細: […]

Read More

教師あり学習に Amazon SageMaker の Amazon Mechanical Turk を使用する

教師付き学習には、プロジェクトのトレーニング段階で、何が正しい答えかをアルゴリズムに教えるラベルまたはアノテーションが必要です。事実、MXNet 、TensorFlow 、および PyTorch を使った例の多くは、これらのフレームワークが持ついろんな機能を調べるのに利用するアノテーション付きデータセットから始めています。しかし残念ながら、例からアプリケーションに移行する際に、完全なアノテーションが付随するデータセットを簡単に入手できることはまずありません。このチュートリアルでは、Amazon SageMaker ノートブックの中から Amazon Mechanical Turk (MTurk) を使って、データセットのアノテーションを取得し、トレーニングに使用する方法を解説します。 TensorFlow では、ニューラルネットワーク識別子を使ってアイリス ( アヤメ ) を識別するのに、エスティメーターを利用するという例があります。この例も、SageMaker サンプルノートブックライブラリ、または GitHub の SageMaker Examples プロジェクトの中にあります。チュートリアルとサンプルノートの両方でアイリスデータセットを使用しています。これには、3 つの関連するアイリス種および関連する種の測定が含まれます。これらのデータポイントは、4 つの測定値に基づいてアイリスの種を予測するモデルをトレーニングするのに使用します。 左から右へ、Iris setosa ( 画像は Radomil 氏、CC BY-SA 3.0) 、Iris versicolor ( 画像は Dlanglois 氏、CC BY-SA 3.0) 、および Iris virginica ( 画像は Frank Mayfield 氏、CC BY-SA 2.0) 。 これは TensorFlow […]

Read More