Amazon Bedrock での Meta Llama

Llama で AI の未来を築く

Llama 3.2 のご紹介

Meta の Llama 3.2 をご紹介します。これは、エッジデバイスでの利用に適しており、よりパーソナライズされた AI エクスペリエンスを実現する新世代のビジョンおよび軽量モデルです。Llama 3.2 には、画像推論とデバイス上のユースケースをサポートする、小規模および中規模のビジョン LLM (11B および 90B) と、軽量のテキストのみのモデル (1B および 3B) が含まれています。新しいモデルは、責任あるイノベーションとシステムレベルの安全性に重点を置きながら、よりアクセスしやすく効率的になるように設計されています。

Llama 3.2 90B は Meta の最も高度なモデルであり、エンタープライズレベルのアプリケーションに最適です。Llama 3.2 は、画像エンコーダー表現を言語モデルに統合する新しいモデルアーキテクチャを備えた、ビジョンタスクをサポートする最初の Llama モデルです。このモデルは、一般知識、長文テキスト生成、多言語翻訳、コーディング、数学、高度な推論で優れたパフォーマンスを発揮します。また、画像推論機能も導入されており、高度な画像理解と視覚的推論が可能です。このモデルは、画像のキャプション作成、画像テキスト検索、ビジュアルグラウンディング、視覚的質疑応答および視覚的推論、ドキュメントの視覚的質疑応答などのユースケースに最適です。

Llama 3.2 11B は、コンテンツ作成、会話型 AI、言語理解、および視覚推論を必要とするエンタープライズアプリケーションに最適です。このモデルは、テキスト要約、感情分析、コード生成、および指示の遵守において優れたパフォーマンスを発揮し、画像について推論する機能も備えています。このモデルは、画像のキャプション作成、画像テキスト検索、ビジュアルグラウンディング、視覚的質疑応答および視覚的推論、ドキュメントの視覚的質疑応答などのユースケースに最適です。

Llama 3.2 3B は、デバイス上の処理により、よりパーソナライズされた AI エクスペリエンスを提供します。Llama 3.2 3B は、低レイテンシーの推論と限られたコンピューティングリソースを必要とするアプリケーション向けに設計されています。テキストの要約、分類、言語翻訳タスクに優れています。このモデルは、モバイル AI を利用した文章作成アシスタントやカスタマーサービスアプリケーションなどのユースケースに最適です。

Llama 3.2 1B は、Llama 3.2 モデルコレクションの中で最も軽量なモデルであり、エッジデバイスやモバイルアプリでの検索と要約に最適です。ユーザーのプライバシーを保護し、レイテンシーを最小限に抑えながら、デバイス上の AI 機能を有効にします。このモデルは、個人情報管理や多言語での知識検索などのユースケースに最適です。

利点

Llama 3.2 は、デバイス上での処理により、よりパーソナライズされた AI エクスペリエンスを提供します。Llama 3.2 モデルは、レイテンシーの低減とパフォーマンスの改善により、さらに効率的になるように設計されています。これにより、幅広いアプリケーションに適したものとなっています。
128K のコンテキスト長により、Llama はデータ内のさらに微妙な関係を把握できます。
Llama モデルは、言語の複雑さをよりよく理解するために、オンラインのパブリックデータソースからの 15 兆のトークンでトレーニングされています。
Llama 3.2 は多言語対応で、英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語を含む 8 つの言語をサポートしています。
Amazon Bedrock のマネージド API により、Llama モデルの使用がこれまでになく簡単になりました。あらゆる規模の組織が、基盤となるインフラストラクチャを気にすることなく Llama の機能を活用できます。Amazon Bedrock はサーバーレスであるため、インフラストラクチャを管理する必要がありません。また、使い慣れた AWS サービスを使用して、Llama の生成 AI 機能をアプリケーションに安全に統合してデプロイできます。これは、AI アプリケーションの構築という、お客様が非常に得意なことに注力できることを意味します。

Llama を知る

過去 10 年以上にわたり、Meta はツールをデベロッパーの手に渡し、デベロッパー、研究者、組織間の協業と進歩を後押しすることに力を入れてきました。Llama モデルにはさまざまなパラメータサイズがあり、デベロッパーはニーズと推論の予算に最適なモデルを選ぶことができます。Amazon Bedrock の Llama モデルは、デベロッパーがスケーラビリティやインフラストラクチャの管理について心配する必要がないため、可能性の世界が拓きます。Amazon Bedrock は、デベロッパーがターンキーで Llama を使い始められる非常にシンプルな方法です。

ユースケース

Llama モデルは、画像理解と視覚的推論、言語のニュアンス、コンテキスト理解、および視覚データ分析、画像のキャプション作成、ダイアログ生成、翻訳およびダイアログ生成などの複雑なタスクで優れたパフォーマンスを発揮し、複数ステップのタスクを簡単に処理できます。Llama モデルが最適な他のユースケースには、高度な視覚的推論と理解、画像テキスト検索、視覚的グラウンディング、ドキュメントの視覚的質疑応答、テキスト要約と精度、テキスト分類、感情分析とニュアンス推論、言語モデリング、ダイアログシステム、コード生成、指示の遵守が含まれます。

モデルバージョン

Llama 3.2 90B

テキストと画像の両方の入出力を受け取るマルチモーダルモデル。画像分析、文書処理、マルチモーダルチャットボット、自律システムなど、高度なビジュアルインテリジェンスを必要とするアプリケーションに最適です。

最大トークン: 128,000

言語: 英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: いいえ

サポートされているユースケース: ビジュアルおよびテキスト入力から推論して結論を導き出す独自の機能を使用した画像理解、視覚的推論、マルチモーダルインタラクション、および画像キャプション作成、画像テキスト検索、視覚グラウンディング、視覚的質問応答、文書視覚的質問応答などの高度なアプリケーションの実現。

ブログを読む

Llama 3.2 11B

テキストと画像の両方の入出力を受け取るマルチモーダルモデル。画像分析、文書処理、マルチモーダルチャットボットなど、高度なビジュアルインテリジェンスを必要とするアプリケーションに最適です。

最大トークン: 128,000

言語: 英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: いいえ

サポートされているユースケース: 画像理解、視覚的推論、マルチモーダルインタラクション、および画像キャプション作成、画像テキスト検索、視覚グラウンディング、視覚的質問応答、文書視覚的質問応答などの高度なアプリケーションの実現。

ブログを読む

Llama 3.2 3B

非常に正確で、関連性の高い結果を提供するために構築されたテキストのみの軽量モデル。低レイテンシーの推論と限定的な計算リソースを使用するアプリケーション向けに設計されています。クエリやプロンプトの書き換え、モバイル AI を活用した文章作成アシスタント、カスタマーサービスアプリケーションに最適です。特にエッジデバイスでは、その効率性と低レイテンシーにより、モバイル AI を活用した文章作成アシスタントやカスタマーサービスチャットボットなどのさまざまなアプリケーションへのシームレスな統合が可能です。

最大トークン: 128,000

言語: 英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: いいえ

サポートされているユースケース: 高度なテキスト生成、要約、感情分析、エモーショナルインテリジェンス、文脈理解、常識推論。

ブログを読む

Llama 3.2 1B

迅速かつ正確な応答を提供するために構築された、テキストのみの軽量モデル。エッジデバイスやモバイルアプリケーションに最適です。このモデルは、デバイス上の AI 機能を実現しつつ、ユーザーのプライバシーを保護し、レイテンシーを最小限に抑えます。

最大トークン: 128,000

言語: 英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: いいえ

サポートされているユースケース: 個人情報管理、多言語知識検索、書き換えタスクなどの多言語対話ユースケース。

ブログを読む

Llama 3.1 8B

限られた計算能力とリソース、より速いトレーニング時間、エッジデバイスに最適です。

最大トークン: 12.8 万

言語:英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: はい

サポートされているユースケース: テキストの要約、テキストの分類、感情分析、および言語翻訳。

ブログを読む

Llama 3.1 70B

コンテンツ制作、会話型 AI、言語理解、研究開発、エンタープライズアプリケーションに最適です。 

最大トークン: 12.8 万

言語:英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: はい

サポートされているユースケース: テキストの要約、テキストの分類、感情分析、および言語翻訳。

ブログを読む

Llama 3.1 405B

エンタープライズレベルのアプリケーション、研究開発、合成データ生成、モデル抽出に最適です。

最大トークン: 12.8 万

言語:英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。

微調整対応: 近日公開予定

サポート対象のユースケース: 一般知識、長文テキスト生成、機械翻訳、強化された文脈理解、高度な推論と意思決定、曖昧さと不確実性のより優れた処理、創造性と多様性の向上、操作性、数学、ツールの使用、多言語翻訳、コーディング。

ブログを読む

Lama 3 8B

限られた計算能力とリソース、より速いトレーニング時間、エッジデバイスに最適です。

最大トークン: 8,000

言語: 英語

微調整対応: いいえ

サポート対象のユースケース:: テキストの要約、テキストの分類、感情分析、および言語翻訳

ブログを読む

Llama 3 70B

コンテンツ制作、会話型 AI、言語理解、研究開発、エンタープライズアプリケーションに最適です。 

最大トークン: 8,000

言語: 英語

微調整対応: いいえ

サポートされているユースケース: テキストの要約と正確さ、テキストの分類とニュアンス、感情分析とニュアンス推論、言語モデリング、対話システム、コード生成、指示の実行。

ブログを読む

Llama 2 13B

パラメータサイズが 13B の微調整済みモデル。テキスト分類、感情分析、言語翻訳などの小規模なタスクに適しています。

最大トークン: 4,000

言語: 英語

微調整対応: はい

サポートされているユースケース: アシスタントのようなチャット

ブログを読む

Llama 2 70B

パラメータサイズが 70B の微調整済みモデル。言語モデリング、テキスト生成、対話システムなどの大規模なタスクに適しています。

最大トークン: 4,000

言語: 英語

微調整対応: はい

サポートされているユースケース: アシスタントのようなチャット

ブログを読む