Amazon Web Services ブログ

Anthropic の Claude 3.5 Sonnet モデルが Amazon Bedrock で利用可能に: Claude 3 Opus よりもさらにインテリジェンスが強化され、コストは 5 分の 1 に

Anthropic が Claude 3 をリリースしてからまだ 3 か月ばかりです。Claude 3 は最先端の人工知能 (AI) モデルファミリーであり、ニーズに合ったインテリジェンス、速度、コストの適切な組み合わせを選択することを可能にします。

6月20日、Anthropic は、近日リリース予定の Claude 3.5 モデルファミリーの最初のリリースである Claude 3.5 Sonnet を発表しました。Amazon BedrockClaude 3.5 Sonnet が利用可能になったことをお知らせいたします。

Claude 3.5 Sonnet は、インテリジェンスに関する業界の水準を引き上げ、幅広い評価で他の生成 AI モデルを上回るパフォーマンスを発揮しています。これには、Anthropic のこれまで最もインテリジェントなモデルであった Claude 3 Opus が含まれます。Claude 3.5 Sonnet は、オリジナルの Claude 3 Sonnet モデルと同じ速度とコストで利用できます。実際、Claude 3.5 Sonnet は Opus よりも 80% 低コストであるため、Claude 3 Opus よりも優れたインテリジェンスとスピードを 5 分の 1 の料金で利用できます。

Anthropic Claude 3.5 Sonnet ファミリー

Claude 3.5 Sonnet が示す最先端のインテリジェンスとコスト効率の高い料金により、このモデルは、コンテキストに応じたカスタマーサポート、複数ステップのワークフローのオーケストレーション、コード変換の合理化などの複雑なタスクに最適です。

Claude 3.5 Sonnet は、学部レベルの専門的な知識 (MMLU)、大学院レベルの専門的な推論 (GPQA)、コード (HumanEval) などの新しい業界ベンチマークを達成しています。次の表に示すように、Anthropic によると、Claude 3.5 Sonnet はほぼすべてのベンチマークで OpenAI の GPT-4o と Google の Gemini 1.5 Pro を上回るパフォーマンスを発揮します。

Anthropic Claude 3.5 Sonnet のベンチマーク

また、Claude 3.5 Sonnet は、Anthropic のこれまでで最も強力なビジョンモデルでもあり、ほとんどのビジョンベンチマークで Claude 3 Opus よりも平均 10% 優れたパフォーマンスを発揮します。さらに、Anthropic によると、Claude 3.5 Sonnet は、ほぼすべてのカテゴリで他の生成 AI モデルを上回るパフォーマンスを発揮します。

Anthropic Claude 3.5 Sonnet のビジョンベンチマーク

Anthropic の Claude 3.5 Sonnet の主な改善点
Claude 3.5 Sonnet のリリースにより、複数の領域で大幅な改善がもたらされ、ソフトウェアデベロッパーや企業は生成 AI を活用した新しい機能を利用できます。この新しいモデルのいくつかの主な強みを次に示します。

視覚処理と理解 – Claude 3.5 Sonnet は、画像の処理、特にチャートとグラフの解釈において優れた機能を発揮します。不完全な画像からテキストを正確に書き起こします。これは、小売、物流、金融サービスなどの業界の中核的な機能であり、テキストのみの場合と比較して、グラフィックやイラストからより多くのインサイトを得られるようにします。Claude 3.5 Sonnet を使用すると、視覚データ処理タスクを自動化し、貴重な情報を抽出して、データ分析パイプラインを強化できます。

ライティングとコンテンツ生成 – Claude 3.5 Sonnet では、ニュアンスとユーモアを理解する能力が飛躍的に高まっています。このモデルは、より自然かつ人間味のあるトーンで、より本物らしく、親しみやすい、質の高い書面コンテンツを生成します。このモデルを使用すると、魅力的で説得力のあるコンテンツを生成し、ライティングワークフローを合理化して、ストーリーテリング機能を強化できます。

カスタマーサポートと自然言語処理 – コンテキストの理解度が高まり、ワークフローのマルチステップオーケストレーションが可能な Claude 3.5 Sonnet は、顧客からの複雑な問い合わせの処理に優れています。この機能により、24 時間体制のサポート、応答時間の短縮、より自然なやり取りが可能になり、最終的には顧客満足度を高めることができます。このモデルを使用すると、カスタマーサポートプロセスを自動化および強化し、エンドユーザーのためにシームレスなエクスペリエンスを提供できます。類似の実装の例については、Amazon Bedrock で Anthropic の Claude 3 モデルを使用して、DoorDash が生成 AI によるセルフサービスコンタクトセンターソリューションを構築した方法をご覧ください。

分析とインサイト – Claude 3.5 Sonnet は、非構造化データを簡単に操作し、複数のツールを使用してインサイトを生成することで、データサイエンスの領域における人間の専門知識を強化します。ビジネス戦略からリアルタイムの製品トレンドに至るまで、質の高い統計ビジュアライゼーションと実用的な予測を生成します。Claude 3.5 Sonnet を使用すると、データ分析ワークフローを簡素化し、有益なインサイトを明らかにして、データ駆動型の意思決定を推進できます。

コーディングとソフトウェア開発 – Claude 3.5 Sonnet は、関連ツールが提供されている場合、高度な推論機能とトラブルシューティング機能を使用して、コードを独自に記述、編集、実行できます。Claude 3.5 Sonnet を使用すると、デベロッパーのワークフローを合理化し、コーディングタスクを高速化するとともに、手作業を減らして、全体的な生産性を高めることができます。

Amazon Bedrock コンソールでの Anthropic の Claude 3.5 Sonnet の使用
これは新しいモデルなので、Amazon Bedrock コンソールに移動し、ナビゲーションペインから [モデルアクセス] を選択して、Claude 3.5 Sonnet へのアクセスを有効にします。

コンソールのスクリーンショット。

モデルにアクセスできるようになったので、Our World in Data ウェブサイトの次の画像から情報を抽出するためにモデルを使用します。

Primary energy consumption from hydropower, 2022

ナビゲーションペインの [プレイグラウンド] セクションで [チャット] を選択し、モデルとして [Anthropic][Claude 3.5 Sonnet] を選択します。その後、[画像] アップロードボタンを選択して前の画像をアップロードし、次のプロンプトを入力して、[実行] を選択します。

Which countries consume more than 1000 TWh from hydropower? Think step by step and look at all regions.Output in JSON.

結果と、私が実行したことをまとめたアニメーション画像を次に示します。

To determine which countries consume more than 1,000 TWh from hydropower in 2022, I need to carefully examine the map and color-coding.The scale at the bottom shows that dark blue represents consumption between 1,000 TWh and 2,000 TWh.

Let's look at each region systematically:

1.North America: Canada is dark blue, indicating it consumes between 1,000-2,000 TWh from hydropower.
2.South America: Brazil is dark blue, also consuming between 1,000-2,000 TWh.
3.Europe: No country is dark blue; all are light green or have no data.
4.Africa: No data available for any country.
5.Asia: China is dark blue, indicating consumption between 1,000-2,000 TWh.
6.Oceania: No country is dark blue; Australia is light green.

In summary, there are three countries that consume more than 1,000 TWh from hydropower in 2022:
1.Canada (North America)
2.Brazil (South America)
3.China (Asia)

Here's the response in JSON format:

```json
{
  "countries_consuming_over_1000TWh_hydropower": [
    {
      "name": "Canada",
      "region": "North America",
      "consumption_range": "1,000-2,000 TWh"
    },
    {
      "name": "Brazil",
      "region": "South America",
      "consumption_range": "1,000-2,000 TWh"
    },
    {
      "name": "China",
      "region": "Asia",
      "consumption_range": "1,000-2,000 TWh"
    }
  ]
}
```

These three countries stand out as the highest consumers of hydropower energy, each using between 1,000 and 2,000 terawatt-hours in 2022.

Amazon Bedrock コンソールでの Anthropic の Claude 3.5 Sonnet のデモ。

画像などの非構造化データから情報を確実に抽出するこのモデルの機能は、新しい可能性の世界を切り開きます。

プレイグラウンドウィンドウの隅にある 3 つの小さなドットを選択し、[API リクエストを表示] を選択して、AWS コマンドラインインターフェイス (AWS CLI) および AWS SDK でモデルを使用したコード例を表示します。コード構文を詳しく見てみましょう。

AWS SDK での Claude 3.5 Sonnet の使用
新しい Amazon Bedrock Converse API または Anthropic Claude Messages API を使用して、任意の AWS SDK で Claude 3.5 Sonnet を使用できます。

既に Claude 3 モデルを使用しているコードを更新するために必要なのは、モデル ID を次のように置き換えることだけです。

anthropic.claude-3-5-sonnet-20240620-v1:0

Converse API で画像とテキストを使用する方法を示すために、以前と同じ画像を使用した AWS SDK for Python (Boto3) のサンプル実装を次に示します。

import boto3
from botocore.exceptions import ClientError

MODEL_ID = "anthropic.claude-3-5-sonnet-20240620-v1:0"

IMAGE_NAME = "primary-energy-hydro.png"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-east-1")

with open(IMAGE_NAME, "rb") as f:
    image = f.read()

user_message = "Which countries consume more than 1000 TWh from hydropower? Think step by step and look at all regions.Output in JSON."

messages = [
    {
        "role": "user",
        "content": [
            {"image": {"format": "png", "source": {"bytes": image}}},
            {"text": user_message},
        ],
    }
]

response = bedrock_runtime.converse(
    modelId=MODEL_ID,
    messages=messages,
)
response_text = response["output"]["message"]["content"][0]["text"]
print(response_text)

実行すると、コンソールにおけるのと類似の出力が表示されます。

Let's approach this step-by-step:

1.First, I'll examine the color scale at the bottom of the map.The darkest blue color represents consumption of 2,000 TWh or more.

2.Now, I'll scan the map region by region:

   North America: Canada is dark blue, indicating over 1,000 TWh.
   South America: Brazil is also dark blue, over 1,000 TWh.
   Europe: No country appears to be dark blue.
   Africa: No country appears to be dark blue.
   Asia: China stands out as dark blue, indicating over 1,000 TWh.
   Oceania: No country appears to be dark blue.

3.To be thorough, I'll double-check for any medium blue countries that might be close to or over 1,000 TWh, but I don't see any that appear to reach that threshold.

4.Based on this analysis, there are three countries that clearly consume more than 1,000 TWh from hydropower.

Now, I'll format the answer in JSON:

```json
{
  "countries_consuming_over_1000TWh_hydropower": [
    "Canada",
    "Brazil",
    "China"
  ]
}
```

This JSON output lists the three countries that visually appear to consume more than 1,000 TWh of primary energy from hydropower according to the 2022 data presented in the map.

JSON 構文を指定しなかったため、2 つの回答は異なる形式を使用しています。アプリケーションでは、プロンプトで必要な JSON プロパティを記述するか、または出力で標準形式を取得するためのサンプルを提供できます。

その他の例については、「Amazon Bedrock ユーザーガイド」のコードサンプルをご覧ください。より高度なユースケースについては、生成 AI モデルをカスタムツールまたは API に接続する方法を示す、完全に機能するツール使用デモをご覧ください。

AWS CLI での Claude 3.5 Sonnet の使用
コマンドラインが最も速い場合があります。新しいモデルで AWS CLI を使用する方法は次のとおりです。

aws bedrock-runtime converse \
    --model-id anthropic.claude-3-5-sonnet-20240620-v1:0 \
    --messages '{"role": "user", "content": [{"text": "Alice has N brothers and she also has M sisters.How many sisters does Alice’s brother have?"}]}' \
    --region us-east-1
    --query output.message.content

出力では、クエリオプションを使用して出力メッセージの内容のみを取得します。

[
    {
        "text": "Let's approach this step-by-step:\n\n1.First, we need to understand the relationships:\n   - Alice has N brothers\n   - Alice has M sisters\n\n2.Now, let's consider Alice's brother:\n   - He is one of Alice's N brothers\n   - He has the same parents as Alice\n\n3.This means that Alice's brother has:\n   - The same sisters as Alice\n   - One sister more than Alice (because Alice herself is his sister)\n\n4.Therefore, the number of sisters Alice's brother has is:\n   M + 1\n\n   Where M is the number of sisters Alice has.\n\nSo, the answer is: Alice's brother has M + 1 sisters."
    }
]

text を小さな Python プログラムにコピーして、複数行に出力されているのを確認します。

print("Let's approach this step-by-step:\n\n1.First, we need to understand the relationships:\n   - Alice has N brothers\n   - Alice has M sisters\n\n2.Now, let's consider Alice's brother:\n   - He is one of Alice's N brothers\n   - He has the same parents as Alice\n\n3.This means that Alice's brother has:\n   - The same sisters as Alice\n   - One sister more than Alice (because Alice herself is his sister)\n\n4.Therefore, the number of sisters Alice's brother has is:\n   M + 1\n\n   Where M is the number of sisters Alice has.\n\nSo, the answer is: Alice's brother has M + 1 sisters.")
Let's approach this step-by-step:

1.First, we need to understand the relationships:
   - Alice has N brothers
   - Alice has M sisters

2.Now, let's consider Alice's brother:
   - He is one of Alice's N brothers
   - He has the same parents as Alice

3.This means that Alice's brother has:
   - The same sisters as Alice
   - One sister more than Alice (because Alice herself is his sister)

4.Therefore, the number of sisters Alice's brother has is:
   M + 1

   Where M is the number of sisters Alice has.

So, the answer is: Alice's brother has M + 1 sisters.

これは非常に繊細な理解を要する質問でしたが、Claude 3.5 Sonnet はそれを正しく理解し、その推論をステップバイステップで説明しました。

知っておくべきこと
Anthropic の Claude 3.5 Sonnet は、米国東部 (バージニア北部) AWS リージョンにおいて、Amazon Bedrock で本日からご利用いただけます。リージョン別の Amazon Bedrock モデルのサポートの詳細については、ドキュメントをご覧ください。 Amazon Bedrock の料金ページでは、特定のユースケースのコストをご確認いただけます。

Claude 3.5 Sonnet は、より高速かつ強力なモデルへのアクセスをより低コストで提供することで、次のような多くの業界で生成 AI をより簡単かつ効果的に使用できるようにします。

ヘルスケアとライフサイエンス – 医療分野では、Claude 3.5 Sonnet における画像分析の強化、患者のトリアージのための診断アシスタントとしての機能、最新の研究結果を簡単に理解できる形式で要約する機能に期待が寄せられています。

金融サービス – このモデルは、金融トレンドの特定や、クライアントの独自の状況に合わせてカスタマイズおよびパーソナライズされた債務返済計画の作成において、有益なサポートを提供できます。

法律 – 法律事務所は、このモデルを使用して、関連する裁判例や法令を迅速に表示することで、法律関連の調査を加速できます。さらに、このモデルは、契約分析を通じてパラリーガルの効率を高め、標準的な法律文書の草案作成をサポートできます。

メディアとエンターテインメント – このモデルは、ジャーナリストの調査を迅速化し、脚本執筆やキャラクターの確立といったクリエイティブなプロセスをサポートするとともに、有益なオーディエンス感情分析を提供できます。

テクノロジー – ソフトウェアデベロッパーにとって、Claude 3.5 Sonnet は、アプリケーションの迅速なプロトタイピング、レガシーコードの移行、革新的な機能の着想、ユーザーエクスペリエンスの最適化、およびフリクションポイントの特定における機会を提供します。

教育 – 教育機関は、このモデルを使用して助成金申請書の作成を効率化し、新しいトレンドを取り入れた包括的なカリキュラムを策定するとともに、データベースクエリとインサイトの生成を通じて研究支援を受けることができます。

今は生成 AI にとってエキサイティングな時期です。この新しいモデルの使用を開始するには、「Amazon Bedrock ユーザーガイド」の Anthropic Claude モデルのセクションをご覧ください。また、community.aws サイトにアクセスして、詳細な技術コンテンツを検索したり、ビルダーコミュニティが自らのソリューションで Amazon Bedrock をどのように利用しているかを学んだりすることもできます。これらの強化された機能で何を実行しているのか、ぜひお知らせください!

Danilo

原文はこちらです。