Amazon Web Services ブログ

週刊生成AI with AWS – 2025/9/15週

みなさん、こんにちは。AWS ソリューションアーキテクトの三厨です。朝晩の暑さが和らいで秋が近づいてきているのをひしひしと感じていますが、生成 AI 系のアップデートは多数のモデル追加や現場課題に特化したワークショップ開催などアツい話題が盛りだくさんです。

また、来る9/24 には「AWS Amazon Nova Ignite」 が開催されます(申し込みはこちら)。多彩な目的に利用可能な Amazon Nova の実際のお客様活用事例やデモンストレーションが予定されておりますので、ぜひご参加ください。

先日 2つの新しいプランを追加した「AWS ジャパン生成 AI 実用化推進プログラム」も非常に多くの申し込みをいただいています。引き続き募集中ですのでよろしくお願いします。

それでは、9 月 15 日週の生成 AI with AWS界隈のニュースを見ていきましょう。

さまざまなニュース

    • ブログ記事「【開催報告】店舗業務にフォーカス!小売業界向け AI エージェント活⽤ワークショップ」を公開
      小売業界の現場課題に特化したAIエージェント活用ワークショップが開催されました。本ワークショップでは、在庫管理の自動化、顧客対応チャットボットの構築、売上予測システムの実装など、店舗運営に直結する実践的なユースケースが紹介されました。参加いただいたお客様からは「店長エージェントの実装を検討する中で、自社ソリューションの組み合わせなど、試したいアイデアが出ました」、「他社の方の事例を聞いたり、小売業界ならではの共通した課題への気づきを得られてかなり勉強になりました」といったお声をいただきました。また、小売業界特有のデータプライバシー要件やリアルタイム処理の必要性についても詳しく解説されており、業界特化型AI導入の実践的なガイドとして価値の高い内容となっています。
    • ブログ記事「SAP 対応エージェンティック AI アシスタントを AWS の生成 AI サービスで実現」を公開
      SAPシステムと連携するエージェンティックAIアシスタントの構築方法について解説した記事です。Amazon Bedrock、Amazon Q Business、AWS Lambdaを組み合わせて、SAP内のデータを自然言語で照会・操作できるエージェンティックAIアシスタントの構築方法を詳細に解説しています。従来のSAP操作では専門知識が必要でしたが、このソリューションにより「今月の売上を教えて」「在庫が少ない商品をリストアップして」といった自然な会話でSAPデータにアクセスできるようになります。セキュリティ面では、SAP側の権限管理と連携したアクセス制御も実装されており、企業の機密情報を適切に保護しながらAIの恩恵を受けられる設計となっています。
    • ブログ記事「新しい料金プランと新エージェント「Auto」の発表」を公開
      Kiro に新しい料金プランと新エージェント「Auto」が発表されました。この記事では、より柔軟な料金体系と、自動化されたコード生成機能を提供する新しいエージェント機能について詳しく解説しています。各タスクにおいて性能・効率・出力品質を最適化することで、開発者の生産性向上に貢献する機能です。

サービスアップデート

    • Amazon Q Developer が リモート MCP サーバーをサポート
      Amazon Q Developer がリモート Model Context Protocol (MCP) サーバーをサポートするようになりました。これにより一元化されたサーバーへの移行でコンピューティングリソースの使用量削減とアクセス・セキュリティの適切な管理が可能になります。HTTP対応で、OAuth認証をサポートするAtlassianやGitHubなどのMCPサーバーとの統合も実現しました。
    • Amazon Lex で生成AI による自然言語処理が8言語で利用可能に
      Amazon Lex の生成AI機能が日本語を含む8つの言語で新たに利用できるようになりました。多言語対応により、グローバルなチャットボットやボイスアシスタントの構築がより容易になります。この機能はAmazon Connectが利用可能な10のAWSリージョン(欧州、米国、アジアパシフィック、カナダ)で提供されています。
    • AWS SiteWise で MCP サーバーモデリング機能を提供開始
      AWS SiteWise に Model Context Protocol (MCP) サーバーモデリング機能が追加されました。このサーバーは組み込みのドメイン検証機能と自動モデリング機能を備え、APIの詳細知識なしで産業データモデリングを簡素化します。既存のAWS IoT SiteWise機能をサポートしながら、新しい会話型インターフェースも追加しています。産業知識とベストプラクティスが組み込まれており、適切な単位、データタイプ、品質指標が自動適用されるため、産業モデルが最初から生産準備が整い、時間とリソースを節約できます。異常検出や資産オンボーディングの合理化などの高度な機能も容易に実装可能です。AWS Labs MCPオープンソースリポジトリからダウンロードできます。
    • Amazon Bedrock で OpenAI のオープンウェイトモデルが新しいリージョンで利用可能に
      OpenAI のオープンウェイトモデルを8つの新リージョンに拡張しました。従来の米国西部(オレゴン)に加え、米国東部(バージニア北部)、アジアパシフィック(東京・ムンバイ)、欧州(ストックホルム・アイルランド・ロンドン・ミラノ)、南米(サンパウロ)で利用可能になりました。この拡張により、世界中の顧客はAIモデルへのアクセス性が向上し、レイテンシー短縮とパフォーマンス向上が実現します。
    • Amazon Bedrock で Qwen3 モデルがフルマネージドサービスとして利用可能に
      Alibaba Cloud の Qwen3 モデルファミリーが Amazon Bedrock でフルマネージドサービスとして提供開始されました。新モデルには、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507、Qwen3-32Bが含まれます。これらは高密度アーキテクチャと専門家混合アーキテクチャを特徴とし、インフラ管理不要で高度なAIアプリケーション構築が可能です。Coderモデルはエージェントコーディングや複雑なソフトウェアエンジニアリングに優れ、235Bモデルは一般的推論に効率的、32Bモデルは幅広い計算タスクに適しています。これらのモデルは米国、アジアパシフィック(東京含む)、欧州、南米の複数のAWSリージョンで利用可能です。
    • Amazon Bedrock で DeepSeek v3.1 モデルがフルマネージドサービスとして利用可能に
      DeepSeek v3.1 モデルが Amazon Bedrock で利用できるようになりました。このオープンウェイトモデルは、詳細な思考モードと迅速な非思考モードの切り替え機能を備え、多言語サポートにより精度向上と幻覚軽減を実現しています。
    • Amazon Bedrock で Stability AI Image Services が一般提供開始
      Stability AI Image Services が Amazon Bedrock で一般提供開始されました。このサービスは9つの専用画像編集ツールを含み、アイデアから完成品まで正確かつ柔軟に実現できます。編集ツール(背景削除、オブジェクト消去、検索と置換、色変更)とコントロールツール(構造、スケッチ、スタイルガイド、スタイル転送)の2種類の機能があり、画像の特定部分の編集や既存画像に基づくバリエーション生成が可能です。このサービスは米国西部(オレゴン)、米国東部(バージニア北部、オハイオ)で利用できます。
    • Meta Llama モデルのオンデマンドデプロイメントが Amazon Bedrock で利用可能に
      カスタム Meta Llama モデルのオンデマンドデプロイメント機能が追加されました。これにより、特定の用途に最適化されたモデルを事前にコンピューティングリソースをプロビジョニングする必要がなく、使用分のみの支払いでリアルタイム処理が可能となり、コスト削減につながります。
    • Amazon OpenSearch Serverless でディスク最適化ベクトル機能を提供開始
      Amazon OpenSearch Serverless にディスク最適化ベクトル機能が追加されました。この機能により、精度やリコール率を維持しながら、ベクター検索の費用対効果の高いソリューションが提供できるようになります。ユーザーはメモリ最適化とディスク最適化のベクターストレージから選択できるようになり、ディスク最適化オプションでは若干のレイテンシー増加と引き換えに低コストで高品質な検索が可能です。これはミリ秒未満の応答時間が重要でないセマンティック検索やレコメンデーションシステムなどに最適です。
    • AWS Neuron 2.26 を発表
      AWS Neuron の最新バージョン 2.26 がリリースされました。Inferentia および Trainium チップでの機械学習推論とトレーニングの性能がさらに向上しています。新バージョンでは、Flux.1-dev画像生成モデルやLlama 4のバリアントをTrainium2インスタンスにデプロイ可能になり、エキスパート並列処理サポート(ベータ)も導入されました。
    • Amazon SageMaker HyperPod でオートスケーリング機能を提供開始
      Amazon SageMaker HyperPod にKarpenter を利用したオートスケーリング機能が追加されました。機械学習ワークロードの需要に応じて自動的にリソースを調整することで、コスト効率と性能の最適化が実現されます。
    • Amazon SageMaker HyperPod で Slurm 対応のヘルスモニタリングエージェントを提供開始
      Slurmクラスターのジョブ自動再開機能と連携し、障害発生時も最後のチェックポイントから処理を継続できるため、大規模モデルのトレーニングを中断なく何週間も実行可能です。このハンズフリーリカバリー機能により、障害による時間とコストのロスを防ぎます。SageMaker HyperPod を利用可能なすべてのリージョンで利用可能です。

今週は以上です。それでは、また来週お会いしましょう!

著者について

Wataru Mikuriya

三厨 航  (Wataru MIKURIYA)

AWS Japan のソリューションアーキテクト (SA) として、ヘルスケア・ハイテク製造業のお客様のクラウド活用を技術的な側面・ビジネス的な側面の双方から支援しています。クラウドガバナンスや IaC 分野に興味があり、最近はそれらの分野の生成 AI 応用にも興味があります。最近感動したものは帯広の豚丼です。