Amazon Web Services ブログ

Qwen モデルが Amazon Bedrock で利用可能に

9 月 18 日、Alibaba の Qwen モデルAmazon Bedrock に追加されました。今回のリリースにより、Amazon Bedrock は、フルマネージドかつサーバーレスな態様で Qwen3 オープンウェイトの基盤モデル (FM) へのアクセスを追加することで、モデルの選択肢を拡大し続けます。このリリースには、Qwen3-Coder-480B-A35B-InstructQwen3-Coder-30B-A3B-InstructQwen3-235B-A22B-Instruct-2507Qwen3-32B (Dense) の 4 つのモデルが含まれています。一体的に、これらのモデルは Mixture-of-Experts (MoE) と高密度アーキテクチャの両方を特徴としており、さまざまなアプリケーション要件に柔軟に対応できます。

Amazon Bedrock は、インフラストラクチャ管理を必要とせずに、統合 API を通じて業界をリードする FM へのアクセスを提供します。複数のモデルプロバイダーのモデルにアクセスし、モデルをアプリケーションに統合して、ワークロード要件に基づいて使用量をスケールできます。Amazon Bedrock では、基盤となるモデルのトレーニングにお客様のデータが利用されることは決してありません。Qwen3 モデルが追加されたことで、Amazon Bedrock は次のようなユースケース向けにさらに多くのオプションを提供します:

  • 拡張コンテキスト理解によるコード生成とリポジトリ分析
  • ビジネスオートメーションのための複数のツールと API をオーケストレートするエージェンティックワークフローの構築
  • 適応型推論のためのハイブリッド思考モードを使用した、AI のコストとパフォーマンスのバランスの実現

Amazon Bedrock の Qwen3 モデル
Amazon Bedrock では現在、次の 4 つの Qwen3 モデルが利用可能です。それぞれ異なるパフォーマンスとコスト要件に合わせて最適化されています:

  • Qwen3-Coder-480B-A35B-Instruct – これは、合計 480B のパラメータと 35B のアクティブパラメータを備えた Mixture-of-Experts (MoE) モデルです。コーディングとエージェンティックタスク向けに最適化されており、エージェンティックコーディング、ブラウザ使用、ツール使用などのベンチマークで優れた結果を達成しています。これらの機能があるため、リポジトリ規模のコード解析やマルチステップワークフローオートメーションに適しています。
  • Qwen3-Coder-30B-A3B-Instruct – これは、合計 30B のパラメータと 3B のアクティブパラメータを備えた MoE モデルです。コーディングタスクと Instruction Following のシナリオに特化して最適化されたこのモデルは、複数のプログラミング言語にわたるコード生成、解析、デバッグにおいて優れたパフォーマンスを発揮します。
  • Qwen3-235B-A22B-Instruct-2507 – これは、合計 235B のパラメータと 22B のアクティブパラメータを備えた、Instruction Tuning された MoE モデルです。コーディング、数学、一般的な推論タスク全体で競争力のあるパフォーマンスを提供し、機能と効率のバランスをとっています。
  • Qwen3-32B (Dense) – これは、32B のパラメータを備えた Dense モデルです。モバイルデバイスやエッジコンピューティングのデプロイなど、一貫したパフォーマンスが重要なリアルタイム環境やリソース制約のある環境に適しています。

Qwen3 のアーキテクチャおよび機能面の特徴
Qwen3 モデルには、アーキテクチャおよび機能面で、いくつかの特徴が導入されています。

MoE と Dense アーキテクチャの比較 – Qwen3-Coder-480B-A35B、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 などの MoE モデルは、リクエストごとにパラメータの一部のみをアクティブ化することで、効率的な推論で高いパフォーマンスを実現します。Dense Qwen3-32B はすべてのパラメータをアクティブ化することで、より一貫性があり予測可能なパフォーマンスを実現します。

エージェンティック機能 – Qwen3 モデルは、1 回のモデル呼び出しでマルチステップの推論と構造化プランニングを処理できます。エージェントフレームワークに統合すると、外部ツールや API を呼び出す出力を生成できます。また、これらのモデルは、長時間のセッションにわたって拡張コンテキストを維持します。さらに、外部環境との標準化された通信を可能にするために、ツール呼び出しをサポートしています。

ハイブリッド思考モード – Qwen3 は、思考モードと非思考モードという 2 つのモードをサポートするハイブリッドな問題解決アプローチを導入しています。思考モードでは、ステップバイステップの推論を適用して、最終的な答えを出します。これは、より深い思考を必要とする複雑な問題に最適です。一方、非思考モードでは、深さよりもスピードが重視される、それほど複雑ではないタスクについて、迅速かつほぼ瞬時の応答を提供します。これは、デベロッパーがパフォーマンスとコストのトレードオフをより効果的に管理するのに役立ちます。

ロングコンテキスト処理 – Qwen3-Coder モデルは、ネイティブに最大 256K トークン、外挿法を使用する場合には最大 100 万トークンの拡張コンテキストウィンドウをサポートしています。これにより、モデルはリポジトリ全体、大規模な技術ドキュメント、または長い会話履歴を単一のタスク内で処理できます。

各モデルを使用すべき場合
4 つの Qwen3 モデルは、それぞれ異なるユースケースに対応します。Qwen3-Coder-480B-A35B-Instruct は、複雑なソフトウェアエンジニアリングシナリオ向けに設計されています。高度なコード生成、リポジトリレベルの分析などのロングコンテキスト処理、外部ツールとの統合に適しています。Qwen3-Coder-30B-A3B-Instruct は、コード補完、リファクタリング、プログラミング関連のクエリへの回答などのタスクに特に効果的です。複数のドメインにわたる汎用的なパフォーマンスが必要な場合は、Qwen3-235B-A22B-Instruct-2507 が適しています。MoE アーキテクチャの効率性の利点を活用しながら、強力な汎用推論機能と Instruction Following 機能を提供します。Qwen3-32B (Dense) は、一貫したパフォーマンス、低レイテンシー、コスト最適化が重要なシナリオに適しています。

Amazon Bedrock での Qwen モデルの開始方法
Qwen モデルの使用を開始するには、Amazon Bedrock コンソールで、ナビゲーションペインの [設定と学習] セクションから [モデルアクセス] を選択します。その後、Qwen モデルに移動してアクセスをリクエストします。ナビゲーションペインの [チャット/テキストプレイグラウンド] セクションでは、プロンプトを使用して新しい Qwen モデルを迅速にテストできます。

Qwen3 モデルをアプリケーションに統合するために、任意の AWS SDK を使用できます。AWS SDK には、Amazon Bedrock の InvokeModel および Converse API へのアクセスが含まれています。また、これらのモデルは、Amazon Bedrock をサポートする任意のエージェンティックフレームワークで使用でき、Amazon Bedrock AgentCore を利用してエージェントをデプロイできます。例えば、Strands Agents を使用して構築された、ツールアクセスを備えたシンプルなエージェントの Python コードを次に示します:

from strands import Agent
from strands_tools import calculator

agent = Agent(
    model="qwen.qwen3-coder-480b-instruct-v1:0",
    tools=[calculator]
)

agent("Tell me the square root of 42 ^ 9")

with open("function.py", 'r') as f:
    my_function_code = f.read()

agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")

今すぐご利用いただけます
Qwen モデルは現在、次の AWS リージョンでご利用いただけます:

  • Qwen3-Coder-480B-A35B-Instruct は、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、東京)、および欧州 (ロンドン、ストックホルム) リージョンでご利用いただけます。
  • Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507、and Qwen3-32B は、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、東京)、欧州 (アイルランド、ロンドン、ミラノ、ストックホルム)、南米 (サンパウロ) の各リージョンでご利用いただけます。

今後のアップデートについては、詳細なリージョンリストをご確認ください。インフラストラクチャのセットアップやキャパシティプランニングは不要で、すぐにテストと構築を開始できます。詳細については、Amazon Bedrock の製品ページの Qwen と Amazon Bedrock の料金ページにアクセスしてください。

今すぐ Amazon Bedrock コンソールで Qwen モデルをお試しいただき、AWS re:Post for Amazon Bedrock または通常の AWS サポートチャネルを通じてフィードバックをお寄せください。

Danilo

原文はこちらです。