Amazon Web Services ブログ
AWS AI League: モデルカスタマイゼーションとエージェント対決
本稿は 2025 年 12 月 23 日に AWS Machine Learning Blog で公開された “AWS AI League: Model customization and agentic showdown” を翻訳したものです。
複雑な実務タスクに対応できるインテリジェントな AI エージェントを構築するのは、容易なことではありません。また、大規模な事前学習済み基盤モデルだけに頼るのではなく、企業は自社の特定ユースケースでより高いパフォーマンスを発揮できるよう、小規模で専門性の高いモデルをファインチューニングし、カスタマイズする必要がある場合も多いです。AWS AI League は、エージェンティック AI とモデルカスタマイゼーションの分野でイノベーションを促進する、エキサイティングなコンペティションを通じて、企業が高度な AI 能力を構築する際の課題を克服できるよう支援する革新的なプログラムを提供しています。
2025 年、初回の AWS AI League コンペティションは、世界中の開発者、データサイエンティスト、ビジネスリーダーの注目を集めました。彼らは最新の AI ツールとテクニックを使用して喫緊の課題解決に取り組みました。AWS re:Invent 2025 のグランドフィナーレは、参加者たちの創意工夫とスキルを披露する、エキサイティングなイベントとなりました。主要企業の部門横断チームが直接対決し、効果的なプロンプトの作成、モデルのファインチューニング、そして強力な AI エージェントの構築能力を実証しました。
2025 年 AWS AI League チャンピオンの皆様、おめでとうございます!激戦の末、これら 3 名の優秀な構築者が勝利を収め、総額 $25,000 の賞金を分け合いました:
- 1 位:Cisco 所属の Hemanth Vediyera
- 2 位:Aqfer 所属の Ross Williams
- 3 位:Capital One 所属の Deepesh Khanna
図1: 左から順に Ross, Hemanth, Deepesh
この記事では、AWS AI League プログラムを使用して AI コンペティションを開催する方法について説明します。 このプログラムにより、参加者はモデルカスタマイゼーションやエージェント構築の概念を体験し、それらを実際のビジネス課題解決に応用し、ゲーム形式の魅力的なフォーマットで革新的なソリューションを披露することができます。新たに導入されたエージェンティック AI とモデルカスタマイゼーションのチャレンジでは、企業が AWS クレジットを利用して社内トーナメントを主催したり、開発者が AWS イベントで競い合うことが可能です。
開始するには、AWS AI League 製品ページをご覧ください。
AWS AI League は、AWS エキスパートが主導する 2 時間のハンズオンワークショップから始まり、その後自分のペースでの実験が続きます。この旅路は、緊急のビジネス課題に対処する AI 作品とソリューションを披露する、魅力的なゲームショースタイルのグランドフィナーレで頂点に達します。以下の図は、これら 3 つのステップを示しています。
図2: AWS AI League チャンピオンシップのステップ
2025 年プログラムの成功を基盤として、AWS AI League 2026 チャンピオンシップの開始を発表できることを嬉しく思います。今年のコンペティションでは、参加者がAIスキルを真に試せる、2つの新しいチャレンジが導入されます。
- エージェンティック AI チャレンジでは、Amazon Bedrock AgentCore を使用してインテリジェントエージェントを構築します。競技者は実世界のビジネス問題に取り組むためにカスタマイズされたエージェントアーキテクチャを作成します。
- モデルカスタマイゼーションチャレンジはエージェンティック AI チャレンジを補完し、SageMaker Studio の最新のファインチューニングレシピを使用して特定のユースケース向けにモデルをカスタマイズします。
2026 AI League チャンピオンシップでは、賞金総額が $50,000 に倍増し、初心者から上級実践者まで、異なるスキルレベルの開発者に対応するトラックが用意されています。
AWS AI League には、Amazon Bedrock AgentCore を使用してインテリジェントなエージェントを構築し、ダイナミックなゲーム形式の競技で複雑な問題を解決する、エキサイティングなエージェンティック AI チャレンジが新たに加わりました。このチャレンジでは、エージェントが迷路のようなグリッド環境を進み、宝箱を目指しながら様々な課題に遭遇します。これらの課題は実際のユースケースを反映しており、不適切なコンテンツへの対処、コード実行、ブラウザ操作など、エージェントの能力が試されます。
エージェントには制限時間が設けられており、その間にマップを移動し、ポイントを集め、障害物を乗り越えて宝箱に到達しなければなりません。獲得ポイントが多いほど、リーダーボードでの順位が上がります。Amazon Bedrock AgentCore のプリミティブを使用してエージェントを完全にカスタマイズできるため、本番レベルのエージェントをより安全に拡張・管理することが可能です。また、スーパーバイザーやサブエージェントに特定のモデルを選択したり、Bedrock Guardrails、AgentCore Memory、AWS Lambda 関数などのカスタムツールを作成して、エージェントが課題を乗り越えるのを支援できます。以下の図は、エージェントが宝箱に到達するまでに克服しなければならない障害物を示しています。
図3: AWS AI League エージェンティック AI チャレンジ
AWS AI League は、ユーザーがインテリジェントなエージェントソリューションを構築するための完全な UI (ユーザーインターフェース)を提供しています。このノーコード UI を使用して、マルチエージェントアーキテクチャやツールを構築し、カスタム Lambda 関数やツールをインタラクティブにコーディングするための Amazon SageMaker Studio CodeEditor などの様々なコンポーネントを統合できます。これにより、環境を離れることなく、AWS AI League のウェブサイト内でエージェントベースのソリューションを完全に開発・カスタマイズすることが可能です。
以下のスクリーンショットは、AWS AI League のウェブサイト内で完結するエージェント構築体験を示しています。
図4: AWS AI League エージェントツール
図5: AWS AI League マルチエージェントアーキテクチャ
競技中、ユーザーはエージェントのパフォーマンスに関するリアルタイムフィードバックを受け取ります。LLM (大規模言語モデル)による評価システムが客観的な評価を提供し、改善のための反復作業を支援します。以下の画像は、チャレンジ中にエージェントがどのように評価されるかを示しています。
図6: AWS AI League エージェントチャレンジにおける評価
グランドフィナーレでは、上位のファイナリストがステージに上がり、ライブのゲームショー形式でエージェントの能力を披露します。これにより、複雑なマルチステップ問題を解決するエージェンティック AI の強力さと汎用性が実証されます。評価基準には、時間効率、チャレンジの解決精度、エージェントの計画能力、そしてトークン消費効率が含まれます。以下のスナップショットは、re:Invent 2025 でのグランドフィナーレ最終ラウンドの様子を示しています。
図7: AWS AI League re:Invent 2025 グランドフィナーレ
AWS AI League のモデルカスタマイゼーションチャレンジでは対象範囲が拡大され、 最新のファインチューニング技術を活用できるようになりました。
Amazon SageMaker Studio 内で新しいモデルカスタマイゼーション体験にアクセスでき、強力な新しいトレーニングレシピを使用できます。目標は、より大規模な参照モデルのパフォーマンスを上回る、高度に効果的でドメイン特化型のモデルを開発することです。
チャレンジは、モデルカスタマイゼーションスキルを磨くことから始まります。学習したツールやテクニックを使用して、高度なファインチューニング手法を適用し、モデルのパフォーマンス向上を目指します。モデルのカスタマイズが完了すると、真の試練が始まります。カスタマイズしたモデルはリーダーボードに提出され、参照モデルと比較してパフォーマンスが評価されます。自動評価システムが、あなたのカスタマイズモデルの応答が参照モデルの出力よりも正確で包括的であると判断するたびに、ポイントが獲得できます。高度なスキルを披露し、リーダーボードのトップに上り詰め、組織にとって新たな機会を切り開く可能性があります。
チャレンジ中、リーダーボードに提出すると、自動評価システムからモデルのパフォーマンスに関するリアルタイムフィードバックを受け取ります。リーダーボードは競技期間を通じて、参照データセットに対して提出物を評価し、精度に関する即座のフィードバックを提供することで、ソリューションの反復改善を支援します。以下の画像は、カスタマイズされたモデルを評価するために AI による評価がどのように使用されるかを示しています。
図8: AWS AI League モデルカスタマイゼーションの評価
グランドフィナーレでは、上位のファイナリストがライブのゲームショー形式でモデルの能力を実証し、プロンプトエンジニアリングのスキルを披露します。ゲームショーでは、ドメインエキスパートとライブ観客がリアルタイム投票に参加し、どの AI ソリューションが実際のビジネス課題を最もよく解決するかを判断する専門家評価が得点に含まれます。以下の画像は、グランドフィナーレ中の参加者のプロンプトエンジニアリング画面を示しています。
図9: AWS AI League モデルカスタマイゼーショングランドフィナーレ参加者ビュー
本記事では、新しい AWS AI League のチャレンジと、それが組織の AI 開発アプローチをどのように変革しているかを紹介しました。AWS では、イノベーションを促進する最も効果的な方法は競争であることを学んできました。AWS AI League により、開発者は AI スキルを披露し、競い合い、イノベーションを解き放つことができるようになりました。
組織内で AWS AI League を開催する方法について詳しく知りたい場合は AWS AI League をご覧ください。また、インテリジェントなエージェントの構築や AI モデルのカスタマイゼーションについてより深く学ぶには、AWS Skill Builder の AWS AIトレーニングカタログをご活用ください。
本記事の翻訳はソリューションアーキテクトの大前遼が担当しました。
Marc Karp は、Amazon SageMaker Serviceチームの MLアーキテクトです。彼は、お客様が大規模なMLワークロードの設計、デプロイ、管理を支援することに重点を置いています。余暇には、旅行や新しい場所の探索を楽しんでいます。
Natasya K. Idriesは、AWS AI/MLゲーミフィケーション学習プログラムのプロダクトマーケティングマネージャーです。彼女は、先進技術と実用的なビジネス実装の間のギャップを埋める魅力的で実践的な教育イニシアチブを通じて、AI/MLスキルの民主化に情熱を注いでいます。学習コミュニティの構築とデジタルイノベーションの推進における彼女の専門知識は、インパクトのあるAI教育プログラムの作成へのアプローチを形作り続けています。仕事以外では、Natasyaは旅行、東南アジア料理の調理、自然散策路の探索を楽しんでいます。