Amazon Web Services ブログ

Anthropic の Claude 3.7 Sonnet ハイブリッド推論モデルが Amazon Bedrock で利用可能に

Amazon Bedrock は、生成 AI 分野の進化に伴い、基盤モデル (FM) の提供を拡大しています。2 月 24 日、Amazon Bedrock で Anthropic の Claude 3.7 Sonnet 基盤モデルが利用可能になったことを発表しました。Anthropic のこれまでで最もインテリジェントなモデルである Claude 3.7 Sonnet は、迅速な応答や拡張的な思考を生み出すことができる最初のハイブリッド推論モデルとして際立っています。つまり、慎重で段階的な推論を使用して難しい問題を解決できるということです。さらに、2 月 24 日、Amazon Q Developer が使用するモデルのリストに Claude 3.7 Sonnet が加わります。Amazon Q は Bedrock をベースに構築されています。Amazon Q では、Claude 3.7 Sonnet などの特定のタスクに最も適したモデルを利用して、より高度なコーディングワークフローを実現できます。これにより、デベロッパーはソフトウェア開発ライフサイクル全体にわたって開発を迅速に行えます。

Claude 3.7 Sonnet の主なハイライト
Amazon Bedrock における Claude 3.7 Sonnet の注目すべき特徴と機能をいくつかご紹介します。

ハイブリッド推論を採用した最初の Claude モデル – Claude 3.7 Sonnet は、モデルの考え方に対して異なるアプローチを取ります。Claude 3.7 Sonnet では、素早い回答用と複雑な問題の解決用に別々のモデルを使用するのではなく、1 つのモデル内のコア機能として推論を統合しています。この組み合わせは、人間の脳の働きによく似ています。結局のところ、私たちは単純な質問に答えるときも、難しいパズルを解くときも、私たちは同じ脳を使っています。

このモデルには、標準モードと拡張思考モードの 2 つのモードがあり、Amazon Bedrock で切り替えることができます。標準モードでは、Claude 3.7 Sonnet は Claude 3.5 Sonnet の改良版です。拡張思考モードでは、Claude 3.7 Sonnet はさらに時間をかけて問題を詳細に分析し、解決策を計画し、複数の視点を検討してから回答を提供するため、パフォーマンスをさらに向上させることができます。推論機能をいつ使用するかを選択することで、速度とコストをコントロールできます。拡張思考トークンはコンテキストウィンドウにカウントされ、出力トークンとして請求されます。

Anthropic の最も強力なコーディングモデル – Claude 3.7 Sonnet は、コーディングの最先端であり、コンテキストの理解と創造的な問題解決に優れています。Anthropic によると、SWE-Bench Verified標準モードで業界トップの 70.3% を達成しています。また、Claude 3.7 Sonnet は、大部分のベンチマークで Claude 3.5 Sonnet よりも優れています。これらの強化された機能により、Claude 3.7 Sonnet は AI エージェントや複雑なワークフローを強化するのに理想的です。

Claude 3.7 Sonnet のベンチマーク

ソース: https://www.anthropic.com/news/claude-3-7-sonnet

前モデルの 15 倍以上の出力容量Claude 3.5 Sonnet と比較して、このモデルは出力長が大幅に延長されています。この拡張された容量は、詳細を明示的に要求したり、複数の例を要求したり、追加のコンテキストや背景情報を要求したりする場合に特に役立ちます。長い出力を実現するには、詳細なアウトラインを求めてみてください (ユースケースを書く場合は、アウトラインの詳細を段落レベルまで指定し、単語数のターゲットを含めることができます)。次に、回答に対してその段落をアウトラインに索引付けし、単語数を繰り返すように求めます。Claude 3.7 Sonnet は、最大 128K トークンの長さの出力をサポートしています (一般に利用可能な場合は最大 64K、ベータ版では最大 128K)。

調整可能な推論予算 – Amazon Bedrock で Claude 3.7 Sonnet を使用すると、思考用の予算を管理できます。この柔軟性は、スピード、コスト、パフォーマンスのトレードオフを比較検討するのに役立ちます。複雑な問題の推論により多くのトークンを割り当てたり、応答時間を短縮するためにトークンを制限したりすることで、特定のユースケースに合わせてパフォーマンスを最適化できます。

Claude 3.7 Sonnet の動作
新しいモデルについては、Amazon Bedrock コンソールでアクセスをリクエストする必要があります。ナビゲーションペインの Bedrock 設定で [Model access] (モデルアクセス) を選択します。次に、[Modify model access] (モデルアクセスを変更) を選択して Claude 3.7 Sonnet へのアクセスをリクエストします。

Amazon Bedrock でのモデルアクセス

Claude 3.7 Sonnet を試すには、ナビゲーションペインの [Playgrounds] (プレイグラウンド) で [Chat / Text] (チャット / テキスト) を選択します。次に、[Select model] (モデルを選択) を選択し、[Categories] (カテゴリー) で [Anthropic] を選択し、[Models] (モデル) で [Claude 3.7 Sonnet] を選択します。拡張思考モードを有効にするには、[Configurations] (設定) で [Model reasoning] (モデル推論) を切り替えます。次のプロンプトを入力して、[Run] (実行) を選択します。

あなたは小さなレストランのマネージャーで、次のような課題に直面しているとします。

3 人のスタッフが病気で夜勤に出られないと電話をかけてきました
店は満員 (80 席) になると予想しています
午後 7 時に 20 人の大規模な宴会があります
メインシェフは出勤できますが、2 人のキッチンヘルパーは病気で休む旨を伝えてきた人たちです
2 名のホールスタッフと 1 名の見習いがいます
あなたなら:

状況に対応できるよう、どのように出勤しているスタッフを再編成しますか
タスクとサービスをどのように優先順位付けしますか
予約を調整する必要があるかどうかをどう判断しますか
どうサービス品質を維持しながら大規模な宴会にも対応しますか
カスタマーエクスペリエンスへの悪影響を最小限に抑えますか
各決定の理由を説明し、潜在的なトレードオフについて話し合いましょう
Plain text


チャット / テキストプレイグラウンド

これは、モデルの推論プロセスを示すアニメーション画像を使用した結果です。

Claude 3.7 Sonnet 推論のテスト

画像からテキストへのビジョン機能をテストするために、Amazon Bedrock を使用して作成された詳細な建築用地計画の画像をアップロードします。この用地計画の詳細な分析と合理的なインサイトを受け取ります。

Claude 3.7 Sonnet には、Amazon Bedrock API を使用して AWS SDK からアクセスすることもできます。Claude 3.7 Sonnet の特徴と機能の詳細については、「Anthropic’s Claude in Amazon Bedrock」の製品詳細ページをご覧ください。

Claude 3.7 Sonnet を今すぐ使い始めましょう
Claude 3.7 Sonnet の強化された機能は、さまざまな業界のユースケースに役立ちます。企業は、顧客と直接対話する高度な AI アシスタントやエージェントを作成できます。ヘルスケアなどの分野では、医療画像分析や研究のまとめに役立ち、金融サービスは複雑な金融モデリングの問題を解決できるというメリットがあります。デベロッパーにとっては、コードをレビューしたり、技術概念を説明したり、さまざまな言語で改善を提案したりできるコーディングコンパニオンとして機能します。

Anthropic’s Claude 3.7 Sonnet は現在、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)の リージョンでご利用頂けます。今後の更新については、全リージョンのリストを確認してください。

Claude 3.7 Sonnet は競争力のある料金で、Claude 3.5 Sonnet の料金と同等です。料金の詳細については、Amazon Bedrock の料金ページをご覧ください。

Amazon Bedrock で Claude 3.7 Sonnet の使用を開始するには、Amazon Bedrock コンソールにアクセスし、Amazon Bedrock ドキュメントを参照してください。

– Esra

原文はこちらです。