メインコンテンツに移動

AI エージェントとは?

人工知能(AI)エージェントは、環境と対話してデータを収集し、そのデータを使用して所定の目標を達成する自主的なタスクを実行できるソフトウェアプログラムです。目標は人間が設定しますが、その目標を達成するために実行する必要がある最適なアクションは AI エージェントが独自に選択します。たとえば、顧客の問い合わせを解決したいコンタクトセンターの AI エージェントを考えてみましょう。エージェントは自動的に顧客にさまざまな質問をし、内部文書で情報を調べ、回答でソリューションを提示します。顧客の応答に基づいて、クエリ自体を解決できるのか、それとも人間に渡すのかを判断します。

複数のAIエージェントが連携して複雑なワークフローを自動化でき、エージェントAIシステムでも使用できます。これらは互いにデータを交換し、システム全体が連携して共通の目標を達成できるようにします。個々の AI エージェントは、特定のサブタスクを正確に実行するように特化できます。オーケストレータエージェントは、さまざまなスペシャリストエージェントのアクティビティを調整して、より大規模で複雑なタスクを完了します。

人工知能 (AI) とは何かについてさらに詳しく

AI エージェントを定義する主な原則は何ですか?

すべてのソフトウェアは、ソフトウェア開発者の指定したさまざまなルーチンタスクを自律的に実行します。では、AI エージェントが特別な理由は何でしょうか?

自律性

AI エージェントは、絶え間ない人間の介入なしに自律的に行動します。従来のソフトウェアはハードコードされた指示に従いますが、AIエージェントは過去のデータに基づいて次の適切なアクションを特定し、継続的な人間の監視なしに実行します。

たとえば、簿記担当者は、購入時に不足している請求書データに自動的にフラグを付けて要求します。

目標指向の行動

AI エージェントは目標によって動かされます。彼らの行動は、効用関数またはパフォーマンス指標で定義されている成功を最大化することを目的としています。単にタスクを完了するだけの従来のプログラムとは異なり、インテリジェントエージェントは目標を追求し、その目標に関連して自分の行動の結果を評価します。

たとえば、AIロジスティクスシステムは、配送ルートを最適化して速度、コスト、燃料消費量のバランスを同時に取り、複数の目標のバランスを取ります。

パーセプション

AIエージェントは、センサーまたはデジタル入力を通じてデータを収集することにより、環境と相互作用します。APIを介して外部のシステムやツールからデータを収集できます。このデータにより、周囲の世界を認識し、変化を認識し、それに応じて内部の状態を更新することができます。

たとえば、サイバーセキュリティエージェントは、最新のセキュリティインシデントを常に把握するために、サードパーティのデータベースからデータを収集します。

合理性

AI エージェントは、推論能力を持つ合理的なエンティティです。環境内のデータをドメイン知識や過去のコンテキストと組み合わせて、情報に基づいた意思決定を行い、最適なパフォーマンスと結果を達成します。

たとえば、ロボットエージェントがセンサーデータを収集し、チャットボットが顧客のクエリを入力として使用します。AI エージェントはデータを適用して情報に基づいた決定を下します。収集されたデータを分析して、あらかじめ決められた目標をサポートする最良の結果を予測します。また、エージェントはその結果を使用して、次に実行すべきアクションを策定します。例えば、自動運転車は、複数のセンサーからのデータに基づいて道路上の障害物を回避します。

プロアクティビティ

AIエージェントは、将来の状態の予測とモデルに基づいて主導権を握ることができます。単にインプットに反応するのではなく、イベントを予測し、それに応じて準備します。

たとえば、AIベースのカスタマーサービスエージェントは、不満を示唆する行動をしているユーザーに連絡して、サポートチケットが提出される前に支援を提供する場合があります。自律型倉庫ロボットは、今後の交通量の多い作業を見越して位置を変える可能性があります。

継続的な学習

AI エージェントは過去のインタラクションから学習することで、時間が経つにつれて改善されていきます。パターン、フィードバック、結果を特定して、行動と意思決定を改善します。これにより、新しい入力があっても常に同じように動作する静的プログラムとは異なります。

たとえば、予知保全担当者は過去の機器故障から学習して、将来の問題をより正確に予測します。

適応性

AI エージェントは、新しい状況に応じて戦略を調整します。この柔軟性により、不確実性、新しい状況、不完全な情報を処理できます。

たとえば、株取引ボットは市場の暴落時に戦略を調整しますが、AlphaZeroのようなゲームプレイエージェントは、事前の人間による戦略がなくても、セルフプレイを通じて新しい戦術を発見します。

コラボレーション

AI エージェントは、他のエージェントや人間のエージェントと協力して、共通の目標を達成できます。彼らはコミュニケーション、調整、協力してタスクを一緒に実行することができます。彼らの共同行動には、交渉、情報の共有、タスクの割り当て、他者の行動への適応が含まれることがよくあります。

たとえば、医療におけるマルチエージェントシステムでは、診断、予防医療、投薬スケジュールなどの特定のタスクに特化したエージェントを配置して、全体的な患者ケアの自動化を実現できます。

AI エージェントの使用にはどのようなメリットがありますか?

AI エージェントは、事業運営と顧客体験を向上させることができます。

生産性の向上

ビジネスチームは、反復的なタスクを AI エージェントに委任すると、生産性が向上します。そうすれば、ミッションクリティカルな活動やクリエイティブな活動に注意を向けることができ、組織にさらに価値をもたらすことができます。

シンプルなダウンスケーリング機能を提供することで

企業はインテリジェントエージェントを活用して、プロセスの非効率性、人為的ミス、手動プロセスに起因する不要なコストを最小限に抑えることができます。自律型エージェントは変化する環境に適応する一貫したモデルに従うため、複雑なタスクに自信を持って取り組むことができます。ビジネスプロセスを自動化するエージェントテクノロジーは、大幅なコスト削減につながります。

情報に基づく意思決定

高度なインテリジェントエージェントには予測機能があり、大量のリアルタイムデータを収集して処理できます。これにより、ビジネスマネージャーは、次の行動の戦略を立てる際に、より多くの情報に基づいた予測を迅速に行うことができます。例えば、広告キャンペーンを実施する際に、AI エージェントを使用してさまざまな市場セグメントの製品需要を分析できます。

カスタマーエクスペリエンスの改善

お客様は、企業とやり取りする際に、魅力的でパーソナライズされた体験を求めます。AI エージェントを統合することで、企業は製品の推奨事項をパーソナライズし、迅速な対応を行い、顧客エンゲージメント、コンバージョン、ロイヤルティを向上させるための革新を行うことができます。AIエージェントは、顧客の複雑な質問に詳細に回答し、課題をより効率的に解決できます。

AI エージェントアーキテクチャの主要なコンポーネントは何ですか?

AI エージェントアーキテクチャには、以下の主要コンポーネントが含まれます。

ファンデーションモデル

AIエージェントの中核には、GPTやClaudeなどの基盤または大規模言語モデル(LLM)があります。これにより、エージェントは自然言語入力を解釈し、人間のような応答を生成し、複雑な命令を推論することができます。LLMはエージェントの推論エンジンとして機能し、プロンプトを処理し、それらをアクション、決定、または他のコンポーネント(メモリやツールなど)へのクエリに変換します。デフォルトではセッション間でいくらかのメモリが保持され、外部システムと組み合わせて継続性とコンテキスト認識をシミュレートできます。

プランニングモジュール

計画モジュールを使用すると、エージェントは目標をより小さく管理しやすいステップに分解し、論理的に順序付けることができます。このモジュールでは、シンボリック推論、デシジョンツリー、またはアルゴリズム戦略を使用して、望ましい結果を達成するための最も効果的なアプローチを決定します。プロンプト主導型のタスク分解として実装することも、階層型タスクネットワーク(HTN)や従来の計画アルゴリズムなどのより形式化されたアプローチとして実装することもできます。計画を立てることで、エージェントはタスク間の依存関係や不測の事態を考慮して、より長い期間にわたって業務を遂行できます。

メモリモジュール

メモリモジュールにより、エージェントはインタラクション、セッション、またはタスクにわたって情報を保持できます。これには、チャット履歴や最近のセンサー入力などの短期記憶と、顧客データ、以前の行動、または蓄積された知識などの長期記憶の両方が含まれます。メモリは、エージェントのパーソナライゼーション、一貫性、およびコンテキスト認識を強化します。AIエージェントを構築する場合、開発者はベクターデータベースまたはナレッジグラフを使用して、意味的に意味のあるコンテンツを保存および取得します。

ツール統合

AI エージェントは多くの場合、外部のソフトウェア、API、またはデバイスに接続することで機能を拡張します。これにより、データの取得、電子メールの送信、コードの実行、データベースのクエリ、ハードウェアの制御など、現実世界のタスクを実行して、自然言語を超えた行動をとることができます。エージェントは、タスクにツールが必要な場合を識別し、それに応じて操作を委任します。ツールの使用は通常、LLMが計画および解析モジュールを通じて導き、ツール呼び出しをフォーマットし、その出力を解釈します。

学習と反省

反射は複数の形で発生する可能性があります。

  • エージェントは、自身のアウトプットの品質を評価します(たとえば、問題を正しく解決したかどうか)。
  • 人間のユーザーまたは自動システムが修正を行います。
  • エージェントは、学習能力を向上させるために、不確かな例や有益な例を選択します。

強化学習 (RL) は重要な学習パラダイムです。エージェントは環境と対話し、報酬またはペナルティという形でフィードバックを受け取り、累積報酬を最大化するために状態をアクションにマッピングするポリシーを学習します。RLは、ロボット工学、ゲーム、金融取引など、明示的なトレーニングデータがまばらな環境で特に役立ちます。エージェントは、探索(新しいアクションを試す)と搾取(既知のベストアクションを使用する)のバランスを取り、時間の経過とともに戦略を改善します。

AI エージェントの仕組みを教えてください。

AI エージェントは、複雑なタスクを簡素化および自動化することで機能します。ほとんどの自律型エージェントは、割り当てられたタスクを実行する際に特定のワークフローに従います。

目標を決定する

AI エージェントは、ユーザーから特定の指示または目標を受け取ります。目標を使用して、最終結果をユーザーにとって関連性が高く有用なものにするためのタスクを計画します。次に、エージェントは目標をいくつかの小さくて実行可能なタスクに分割します。目標を達成するために、エージェントは特定の順序または条件に基づいてそれらのタスクを実行します。

情報を取得する

AI エージェントは、計画したタスクを正常に実行するために情報を必要とします。例えば、エージェントは顧客の感情を分析するために会話ログを抽出する必要があります。そのため、AI エージェントはインターネットにアクセスして、必要な情報を検索して取得する可能性があります。アプリケーションによっては、インテリジェントエージェントが他のエージェントや機械学習モデルと対話して情報にアクセスしたり、情報を交換したりできます。

タスクを実装する

十分なデータがあれば、AI エージェントは目前のタスクを系統立てて実行します。タスクが完了すると、エージェントはそのタスクをリストから削除し、次のタスクに進みます。タスクが完了するまでの間に、エージェントは外部からのフィードバックを求め、自身のログを調べることで、指定された目標を達成したかどうかを評価します。このプロセス中に、エージェントは最終結果を達成するために追加のタスクを作成して実行することがあります。 

AI エージェントのタイプにはどのようなものがありますか?

組織は、さまざまな種類やタスクにわたって AI エージェントを作成し、導入しています。いくつかの例を以下に示します。

シンプルなリフレックスエージェント

シンプルなリフレックスエージェントは、事前に定義されたルールとその即時データに厳密に基づいて動作します。特定のイベント、条件、アクションルールを超える状況には対応しません。したがって、同エージェントは、広範なトレーニングを必要としない単純なタスクに適しています。例えば、シンプルなリフレックスエージェントを使用して、ユーザーの会話に含まれる特定のキーワードを検出してパスワードをリセットできます。

モデルベースのリフレックスエージェント

モデルベースのエージェントは、より高度な意思決定メカニズムを備えていることを除けば、単純な反射エージェントに似ています。モデルベースのエージェントは、単に特定のルールに従うのではなく、決定を下す前に起こりそうな結果と結果を評価します。裏付けとなるデータを利用して、認識している世界の内部モデルを構築し、それを意思決定に活用します。

目標ベースのエージェント

目標ベースのエージェントは、ルールベースのエージェントとも呼ばれ、より強力な推論機能を備えた AI エージェントです。エージェントは、環境データを評価するだけでなく、さまざまなアプローチを比較して、望ましい結果を達成できるよう支援します。目標ベースのエージェントは、常に最も効率的な方法を選択します。自然言語処理 (NLP) やロボット工学アプリケーションなどの複雑なタスクを実行するのに適しています。

ユーティリティベースのエージェント

ユーティリティベースのエージェントは、複雑な推論アルゴリズムを採用して、ユーザーが望む結果を最大化できるよう支援します。エージェントは、さまざまなシナリオとそれぞれの効用価値または利点を比較します。次に、ユーザーに最も多くの報酬を提供するものを選択します。たとえば、顧客はユーティリティベースのエージェントを使用して、価格に関係なく、移動時間が最短の航空券を検索できます。

学習エージェント

学習エージェントは、過去の経験から継続的に学習してパフォーマンスを向上させます。エージェントは、感覚入力とフィードバックのメカニズムを使用して、特定の基準を満たすように学習要素を経時的に適応させます。さらに、問題ジェネレーターを利用して新しいタスクを設計し、収集したデータと過去の結果を使用して自動的にトレーニングします。

階層型エージェント

階層型エージェントは、階層状に配置されたインテリジェントエージェントの組織化されたグループです。上位レベルのエージェントは、複雑なタスクをより小さなタスクに分解し、下位レベルのエージェントに割り当てます。各エージェントは独立して動作し、進捗レポートをスーパーバイジングエージェントに送信します。上位レベルのエージェントは結果を収集し、下位のエージェントが集合的に目標を達成できるように調整します。

マルチエージェントシステム

マルチエージェントシステム(MAS)は、問題を解決したり共通の目標を達成したりするために相互に作用する複数のエージェントで構成されます。これらのエージェントは、同種(デザインが似ている)でも異質(構造や機能が異なる)でもよく、状況に応じて協力、調整、さらには競合することもあります。MASは、集中管理が現実的でない複雑な分散環境で特に効果的です。

たとえば、自動運転車では、各車両が独立したエージェントとして機能しますが、他の車両と連携して交通渋滞を回避し、衝突を防止することで、交通の流れをスムーズにします。

AI エージェントの使用にはどのような課題がありますか?

AIエージェントは、ビジネスワークフローを自動化してより良い成果を達成する便利なソフトウェアテクノロジーです。そうは言っても、組織は自律型 AI エージェントをビジネスユースケースにデプロイする場合、以下の懸念事項に対処する必要があります。

データプライバシーに関する懸念

高度な AI エージェントを開発して運用するには、大量のデータを取得、保存、移動する必要があります。組織はデータプライバシー要件を認識し、データセキュリティ体制を改善するために必要な対策を講じる必要があります。

倫理的課題

状況によっては、AI モデルの結果に偏りがあったり、不正確になったりすることがあります。人間によるレビューなどの保護手段を適用することで、配置されたエージェントから顧客が有益で公正な回答を受けられるようになります。

技術的な複雑さ

高度な AI エージェントを実装するには、機械学習技術に関する専門的な経験と知識が必要です。デベロッパーは、機械学習ライブラリをソフトウェアアプリケーションと統合し、企業固有のデータでエージェントをトレーニングできなければなりません。

限られたコンピュートリソース

ディープラーニング AI エージェントのトレーニングとデプロイには、かなりのコンピューティングリソースが必要です。組織がこれらのエージェントをオンプレミスで実装する場合、簡単にスケールできない高価なインフラストラクチャに投資して維持する必要があります。

AWS は AI エージェントの要件にどのように役立ちますか?

Amazon Bedrockはフルマネージド型のサービスで、Claude、Llama 2、Amazon Titanなどの業界をリードするジェネレーティブ AI モデルに簡単にアクセスできるほか、ジェネレーティブ AI アプリケーションの構築に必要なさまざまな機能も利用できます。

Amazon Bedrock エージェントは、FM、API、およびデータの推論を使用してユーザーのリクエストを分類し、関連情報を収集し、タスクを効率的に完了します。エージェントの作成は簡単かつ迅速で、セットアップはわずか数ステップで完了します。Amazon Bedrockは以下をサポートしています。

  • メモリ保持によるシームレスなタスク継続
  • スーパーバイザーエージェントの調整のもとで複数の専門エージェントを構築するためのマルチエージェントコラボレーション
  • Amazon Bedrock ガードレールは、組み込みのセキュリティと信頼性を実現します。

AWS は、ヘルスケアやライフサイエンスのユースケース向けに構築された、増え続けるスターターエージェントのカタログを含むオープンソースツールキットを導入しました

AWS Transform は、.NET、メインフレーム、VMware ワークロードを変革するための、初のエージェンティック AI サービスです。19 年にわたる移行経験に基づいて構築されたこのサービスは、専用の AI エージェントをデプロイすることで、評価、コード分析、リファクタリング、分解、依存関係マッピング、検証、変換のプランニングなどの複雑なタスクを自動化します。これは、組織が質とコントロールを維持しながら、数百のアプリケーションを同時にモダナイズするのに役立ちます。

Amazon Q Business は、仕事で情報を見つけ、洞察を得て、行動を起こすのに役立つように設計された、人工知能を活用したジェネレーティブアシスタントです。これにより、AI エージェント作成の力はすべての従業員の手に委ねられます。誰でもこれを使用して、一般的なエンタープライズソフトウェアとインタラクションし、反復的なタスクを自動化する、軽量のエージェンティック AI アプリケーションを作成できます。

今すぐ無料アカウントを作成して、AWS で AI エージェントを使い始めましょう。