深層学習とは

深層学習は、人間の脳の働きを模した方法でデータを処理するようにコンピュータに教える人工知能 (AI) の一手法です。深層学習モデルは、画像、テキスト、音声、その他のデータにおける複雑なパターン認識によって、正確なインサイトや予測を生成できます。深層学習手法を使用すると、画像の説明や音声ファイルのテキストの書き起こしなど、一般的に人間の知能を必要とするタスクを自動化できます。 

深層学習が重要なのはなぜですか?

人工知能 (AI) は、人間と同じように考えて学ぶようにコンピュータをトレーニングしようとします。深層学習テクノロジーは、次のような日常的な製品で使用される多くの AI アプリケーションを促進します。

  • デジタルアシスタント
  • 音声で起動するテレビのリモコン
  • 不正検出
  • 自動顔認識

また、自動運転車、バーチャルリアリティなどの新しいテクノロジーの重要なコンポーネントでもあります。 

深層学習モデルは、データサイエンティストがアルゴリズムまたは事前定義された一連のステップを使用してタスクを実行するようにトレーニングしたコンピュータファイルです。企業は深層学習モデルを使用してデータを分析し、さまざまなアプリケーションで予測を行います。

深層学習の用途は何ですか?

深層学習には、自動車、航空宇宙、製造、エレクトロニクス、医学研究、その他の分野でいくつかのユースケースがあります。深層学習の例をいくつか挙げます。

  • 自動運転車は、深層学習モデルを使用して道路標識や歩行者を自動的に検出します。
  • 防衛システムは、深層学習を使用して、衛星画像内の対象地域に自動的にフラグを付けます。
  • 医療用画像解析では、深層学習を使用し、医療診断のためにがん細胞を自動的に検出します。
  • 工場では、深層学習アプリケーションを使用して、人や物が機械から安全ではない距離内に入った場合に自動的に検出します。

深層学習のこれらのさまざまなユースケースは、コンピュータビジョン、音声認識、自然言語処理 (NLP)、およびレコメンデーションエンジンの 4 つのカテゴリに分類できます。

コンピュータビジョン

コンピュータビジョンは、画像や動画から情報やインサイトを抽出するコンピュータの機能です。コンピュータは、深層学習技術を使用して、人間と同じように画像を理解できます。コンピュータビジョンには、次のような用途がいくつもあります。

  • 画像や動画のアーカイブから安全でないコンテンツや不適切なコンテンツを自動的に削除するコンテンツのモデレーション
  • 顔を識別し、開いた目、眼鏡、顔の毛などの属性を認識する顔認識
  • ブランドロゴ、衣類、安全装備、その他の画像の詳細を識別するための画像分類

音声認識

深層学習モデルは、さまざまな音声パターン、ピッチ、トーン、言語、およびアクセントにもかかわらず、人間の音声を分析できます。Amazon Alexa や自動トランスクリプションソフトウェアなどの仮想アシスタントは、音声認識を使用して次のようなタスクを実行します。

  • コールセンターエージェントを支援し、通話を自動的に分類
  • リアルタイムで臨床会話をドキュメントへ変換
  • コンテンツのリーチを広げるための正確な字幕付きビデオと会議の記録

自然言語処理

コンピュータは、深層学習アルゴリズムを使用して、テキストデータとドキュメントからインサイトと意味を収集します。自然な、人間が作成したテキストを処理するこの機能には、次のような機能を含むいくつかのユースケースがあります。

  • 自動化された仮想エージェントとチャットボット
  • 文書やニュース記事の自動要約
  • E メールやフォームなどの長文形式のドキュメントのビジネスインテリジェンス分析
  • ソーシャルメディアでの肯定的なコメントや否定的なコメントなど、感情を示すキーフレーズのインデックス作成

レコメンデーションエンジン

アプリケーションは、深層学習手法を使用してユーザーのアクティビティを追跡し、パーソナライズされたレコメンデーションを作成できます。さまざまなユーザーの行動を分析し、新しい製品やサービスを発見するのに役立てることができます。例えば、Netflix、Fox、Peacockなどの多くのメディアおよびエンターテインメント企業は、深層学習を使用してパーソナライズされた動画のレコメンデーションを提供しています。

深層学習はどのように機能しますか?

深層学習アルゴリズムは、人間の脳をモデルにしたニューラルネットワークです。例えば、人間の脳には、情報を学習して処理するために連携して働く何百万もの相互接続されたニューロンがあります。同様に、深層学習ニューラルネットワーク (または人工ニューラルネットワーク) は、コンピュータ内で連携して働く人工ニューロンの多くのレイヤー構成されています。

人工ニューロンはノードと呼ばれるソフトウェアモジュールであり、数学的計算を使用してデータを処理します。人工ニューラルネットワークは、これらのノードを使用して複雑な問題を解決する深層学習アルゴリズムです。

深層学習ネットワークの構成要素は何ですか?

深層学習ニューラルネットワークの構成要素は次のとおりです。

入力レイヤー

人工ニューラルネットワークには、データを入力する複数のノードがあります。これらのノードは、システムの入力レイヤーを構成します。

非表示レイヤー

入力レイヤーはデータを処理し、ニューラルネットワーク内の後続のレイヤーに渡します。これらの非表示レイヤーは、情報をさまざまなレベルで処理し、新しい情報を受け取ったときに動作を適応させます。深層学習ネットワークには、さまざまな角度から問題を分析するために使用できる数百の非表示レイヤーがあります。

例えば、分類する必要がある未知の動物の画像が与えられた場合、それをすでに知っている動物と比較します。例えば、目と耳の形、大きさ、脚の数、毛皮のパターンを調べます。次のようなパターンの特定を試みる場合があります。

  • その動物にひづめがあるので、牛または鹿の可能性があります。
  • その動物に猫のような目があるので、野生の猫の一種の可能性があります。

深層学習ニューラルネットワークの非表示レイヤーも同じように機能します。深層学習アルゴリズムが動物画像の分類を試みる場合、それぞれの非表示レイヤーが動物の異なる特徴を処理して、正確な分類を試みます。

出力レイヤー

出力レイヤーは、データを出力するノードで構成されます。「はい」または「いいえ」の回答を出力する深層学習モデルの出力レイヤーには 2 つのノードしかありません。これに対し、より広い範囲の回答を出力するレイヤーには、より多くのノードがあります。 

機械学習のコンテキストでの深層学習とは?

深層学習は機械学習のサブセットです。深層学習アルゴリズムは、従来の機械学習手法の効率を向上させる取り組みの中で登場しました。従来の機械学習手法では、ソフトウェアをトレーニングするために多大な人間の努力が必要です。例えば、動物画像の認識では、次の操作を行う必要があります。

  • 何十万もの動物画像に手動でラベルを付けます。
  • 機械学習アルゴリズムにそれらの画像を処理させます。
  • これらのアルゴリズムを不明な画像のセットでテストします。
  • 一部の結果が不正確である理由を特定します。
  • 新しい画像にラベルを付けてデータセットを改善し、結果の精度を向上させます。

このプロセスは、教師あり学習と呼ばれます。教師あり学習では、広範囲で十分に多様なデータセットがある場合にのみ、結果の精度が向上します。例えば、トレーニングデータセットに黒猫の画像が多かったために、アルゴリズムが黒猫を正確に識別できても、白猫は識別できない場合があります。その場合は、より多くの白猫の画像にラベルを付け、機械学習モデルをもう一度トレーニングする必要があります。

機械学習に勝る深層学習のメリットは何ですか?

深層学習ネットワークには、従来の機械学習に比べて次のようなメリットがあります。 

非構造化データの効率的な処理 

機械学習の手法では、トレーニングデータセットに無限のバリエーションがあるため、テキストドキュメントなどの非構造化データが見つかると処理が困難になります。一方、深層学習モデルは、非構造化データを理解し、手動で特徴を抽出しなくとも一般的な観測を行うことができます。例えば、ニューラルネットワークは、次の 2 つの異なる入力文が同じ意味を持っていることを認識できます。

  • 支払い方法を教えてもらえませんか?
  • 送金するにはどうすればよいですか? 

隠された関係とパターンを明らかにする

深層学習アプリケーションは、大量のデータをより詳しく分析し、トレーニングされていない可能性がある新しいインサイトを明らかにすることができます。例えば、消費者の購買を分析するようにトレーニングされた深層学習モデルを考えてみましょう。このモデルには、すでに購入した商品のデータのみが含まれています。ただし、人工ニューラルネットワークは、購入パターンを他の類似した顧客の購入パターンと比較することで、まだ購入していない新しい商品を提案できます。

教師なし学習

深層学習モデルは、ユーザーの行動に基づいて時間の経過とともに学習し、改善することができます。ラベル付けされたデータセットの多くのバリエーションは必要ありません。例えば、タイピング動作を分析することで単語を自動的に修正または提案するニューラルネットワークについて考えてみます。英語でトレーニングされており、英語の単語のスペルチェックが可能であると仮定します。ただし、danke などの英語以外の単語を頻繁に入力すると、ニューラルネットワークはこれらの単語も自動的に学習して自動修正します。

変動が激しいデータの処理

変動が激しいデータセットにはさまざまなバリエーションがあります。一例として、銀行のローン返済額があります。深層学習ニューラルネットワークは、金融取引を分析して不正検出のためにそれらのいくつかにフラグを立てるなどして、そのデータを分類してソートすることもできます。

深層学習の課題は何ですか?

深層学習は比較的新しいテクノロジーであるため、実際の実装には特定の課題が伴います。

高品質の大量のデータ

深層学習アルゴリズムは、高品質の大量のデータでトレーニングすると、より良い結果が得られます。入力データセットに異常値や誤りがあると、深層学習プロセスに大きな影響を与える可能性があります。例えば、私たちの動物画像の例では、動物以外の画像が誤ってデータセットに導入された場合、深層学習モデルが飛行機をカメとして分類することがあります。

このような不正確さを回避するには、深層学習モデルをトレーニングする前に、大量のデータをクリーンアップして処理する必要があります。入力データの前処理には、大量のデータストレージ容量が必要です。

大きな処理能力 

深層学習アルゴリズムは、演算集約型であり、適切に機能するには十分な計算能力を備えたインフラストラクチャが必要です。そうでない場合、結果の処理に時間がかかります。 

クラウドでの深層学習のメリットは何ですか?

クラウドインフラストラクチャで深層学習アルゴリズムを実行すると、これらの課題の多くを克服できます。クラウドで深層学習を使用して、深層学習アプリケーションの設計、開発、トレーニングを迅速に行うことができます。 

スピード

GPU と CPU のクラスターを使用してニューラルネットワークに必要な複雑な数学演算を実行することで、深層学習モデルのトレーニングを迅速に実行できます。次に、構築したモデルをデプロイして大量のデータを処理することで、さらに精度の高い結果を出すこともできます。

スケーラビリティ

クラウドでは幅広いリソースをオンデマンドで利用できるため、あらゆる規模の深層学習モデルに、事実上無制限のハードウェアリソースにアクセスできます。ニューラルネットワークは、複数のプロセッサを利用して、種類や数の異なるプロセッサ間でワークロードをシームレスかつ効率的に分散できます。

AWS 深層学習とは

AWS 深層学習サービスは、クラウドコンピューティングのパワーを活用して、深層学習ニューラルネットワークを低コストで拡張し、いち早く最適化できるようにします。次のような AWS のサービスを利用して、特定の深層学習アプリケーションを完全に管理することもできます。

  • Amazon Rekognition は、事前にトレーニングされた、またはカスタマイズ可能なコンピュータビジョン機能をアプリケーションに追加します
  • Amazon Transcribe は、音声を自動的に認識して正確に書き起こします
  • Amazon Lex は、多くの言語にわたって意図を理解し、会話のコンテキストを保ち、単純なタスクを自動化するインテリジェントなチャットボットを構築します

Amazon SageMaker で AWS で深層学習を使用開始し、ニューラルネットワークをすばやく簡単に構築およびトレーニングし、大規模にデプロイしましょう。AWS Deep Learning AMI を使用して、深層学習用のカスタム環境とワークフローを構築することもできます。無料の AWS アカウントを作成して、今すぐ使用開始しましょう。

AWS での深層学習の次のステップ

追加の製品関連リソースを確認する
深層学習サービスの詳細 
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
コンソールで構築を開始する

AWS マネジメントコンソールで構築を始めましょう。

サインイン