生成 AI の機能をもつチャットアプリケーションを AWS で実現する際の
構成例とその概算料金をご紹介します
この構成例のクラウドレベル:
基礎編
入門編:該当するユースケースの知識が全くない方が対象
基礎編:該当するユースケースの入門知識がある方が対象
応用編:該当するユースケースにある程度精通している方が対象
この構成例で解決できる課題・困りごと:
- 社内に蓄積された多くのデータの中から適切な情報へのアクセスが難しいと感じている
- 社内のデータと生成 AI を掛け合わせたチャットアプリケーションで素早く適切な情報や支援を取得したい
- 参考例1)営業職の方は生成 AI チャットアプリケーションに質問して、社内のデータに基づいた回答にたどり着けます
- 参考例2)技術職でプログラムを開発する方は、既存のコーディングの解説、機能を追加する際のコード生成、効率的な SQL クエリーを組み立てるアドバイスなどの支援が得られます
この構成例の概算料金:
285.69 ドル (月額)
この構成例のメリット:
- Amazon Bedrock で提供されている基盤モデルと、Bedrock Knowledge Bases を連携させた、生成 AI の RAG チャットアプリケーションを素早く構築可能です
- Amazon S3 に社内のデータを格納することで、Bedrock Knowledge Bases にデータを取り込みができ、社内のデータに基づいた回答を生成できます
- GitHub で公開されている Generative AI Use Cases JP を活用することで、素早く環境を構築できます
- Generative AI Use Cases JP の構築手順は GitHub 上に公開されており、こちらを参照してお手元の AWS アカウントにすぐに構築可能です
- Generative AI Use Cases JP は、RAG ユースケースだけではなく、文章生成、要約、文章校正、画像生成、音声認識、などよくあるユースケースを素早く試すことができます
この構成例で使用したサービスと概算料金内訳:
サービス | 項目 | 数量 | 単価 | 料金 (USD) |
Amazon Bedrock | Claude 3.5 Sonnet 入力トークン | 11,000,000 トークン | 0.003 USD/1,000 トークンあたり | 33 |
Claude 3.5 Sonnet 出力トークン | 4,400,000 トークン | 0.015 USD/1,000 トークンあたり | 66 | |
OpenSearch Serverless (Knowledge Bases 用ベクトルデータストア) |
OpenSearch Compute Unit : 書き込み用 |
0.5 OCU |
0.24 USD/OCU-時間あたり |
87.6 |
OpenSearch Compute Unit : 読み取り用 |
0.5 OCU |
0.24 USD/OCU-時間あたり |
87.6 | |
Managed Storage |
10 GB |
0.024 USD/GB |
0.24 | |
Amazon CloudFront | データ転送 (OUT) | 1 GB | 0.114 USD/時間 | 0.11 |
HTTPS リクエスト | 30,000 リクエスト | 0.012 USD/1 万リクエスト | 0.04 | |
Amazon S3 | ストレージ容量 | 0.01 GB | 0.025 USD/GB | 0 |
GET、SELECT リクエスト数 | 1,000 リクエスト | 0.00037 USD/1,000 リクエスト | 0 | |
Amazon API Gateway | REST API リクエスト数 | 15,000 リクエスト | 4.25 USD/100 万リクエスト | 0.06 |
Amazon Cognito | アクティブユーザー数 | 50 ユーザー | 0.0055 USD/ユーザー | 0.28 |
AWS Lambda | 割り当てたメモリと実行時間 | 37,500 GB-秒 | 0.000016667 USD/GB-秒あたり | 0.63 |
Lambda HTTP 応答ストリーム処理バイト | 1 GB | 0.008 USD/GB | 0.01 | |
Amazon DynamoDB | オンデマンド 書き込み要求単位 (WRU) | 1,000,000 WRU | 1.4269 USD/100 万 | 1.43 |
オンデマンド 読み出し要求単位 (RRU) | 200,000 RRU | 0.285 USD/100 万 | 0.06 | |
ストレージ容量 | 5 GB | 0.285 USD/GB | 1.43 | |
Amazon Transcribe | スタンダードバッチ文字起こし 分数 | 300 分 | 0.024 USD/分 | 7.2 |
月額合計料金:285.69 (USD)
※ 2024 年 9 月 10 日時点での試算です。
- この構成例で紹介するアプリケーションは、aws-samples で公開されている Generative AI Use Cases JP を使用しています。
- Generative AI Use Cases JP は、複数の機能が存在しており、各機能ごとに有効 or 無効を指定できます。この試算例では、RAG チャット (Knowledge Bases 版) の機能を有効化している構成です。RAG 以外の セキュリティ設定 (AWS WAF)、ファイルアップロード、検索エージェント、Amazon Kendra、モニタリング用ダッシュボードは試算に含まれていません。
- この試算は、東京リージョンの料金単価を基に計算しています。一部の例外として、Amazon Bedrock は北部バージニアリージョンの料金単価で計算しています。
- 1ヶ月を 730 時間として計算しています。
- 試算に伴うトークンの消費量は以下のように計算をしています。環境や使い方に応じて変動するため、参考値としてご利用ください。
- 利用ユーザー数 50 人、利用頻度 1 日 10 回質問、1 質問あたり 1000 入力トークン、1 回答あたり 400 出力トークン、1 カ月に 22 日利用する試算です。
- Bedrock Knowledge Bases 自体には料金がかかりません。このサービスによって作成- 利用される Amazon OpenSearch Serverless や Bedrock が課金対象となります。
- Amazon OpenSearch Serverless は クラスターのコンピュート層がデータ量や負荷に応じて自動的に伸縮します。本試算では最も小さい 0.5 OCU を前提としています。利用シーンによって OCU の値は変動する点にご注意ください。
- AWS で提供しているサービスの一部で無料利用枠が提供されています。本試算では無料利用枠を考慮せずに試算を行っており、実際にはより安価にご利用頂ける場合があります。以下に該当する無料利用枠を一部抜粋します。
- AWS リージョンからインターネット方向のデータ転送 (アウト) : 100 GB/月
- AWS Lambda :
- リクエスト回数 1,000,000 件/月
- コンピューティング時間 400,000 GB-秒/月
- Amazon CloudFront :
- データ転送 (アウト) 1 TB /月
- HTTP/S リクエスト回数 10,000,000 回/月
- Amazon DynamoDB :
- ストレージ容量 25 GB/月
- Amazon Cognito : 50,000 アクティブユーザー/月
この AWS サービスに関する参考情報
[Kendra と Bedrock Knowledge Bases の違い]
Kendra はフルマネージドなエンタープライズ検索サービスです。データを投入するだけで、自然言語により検索が可能になります。
Bedrock Knowledge Bases は RAG 用のフルマネージドなベクトル検索サービスです。検索時やデータ格納時に利用する基盤モデルやチャンク戦略を細かく指定することができるだけでなく、ベクトルストアに Open Search を利用することでスケーラビリティの高い構成を利用可能です。
GenU では、ベクターストアに利用する OpenSearch に kuromoji を利用し、ハイブリッド検索をサポートするように構成されているため、日本語データでも不自由なくご利用いただけます。
[RAG チャットのイメージ]
最新の料金やサービスのスペックを変更した場合の料金を知りたい場合は AWS Pricing Calculator を使って想定利用金額を算出してみましょう
- アマゾン ウェブ サービス(AWS)の利用をご検討中の皆様に向けて、無料個別相談会を実施いたします。
今後 AWS の導入に向けて、サービス詳細や特定の業界・サービスを活用した事例の紹介をご希望の皆様、料金関連(支払方法やお見積り、課金体系)に関するご相談、具体的な構成等の技術に関するご相談等を希望される皆様は、是非ご参加ください。
無料個別相談会に申し込む »
- お客様のビジネスニーズに合わせて AWS が提供できるサービスと提供内容についてご説明させていただきます。
フォームにご記入いただき、AWS 日本担当チームまでお問い合わせください。
フォームで日本担当チームに問い合わせる »
今日から AWS を始めましょう!
コンピューティング、データベース、ストレージ、コンテンツ配信、機械学習、IoT をはじめ、
AWS では、柔軟性、スケーラビリティ、信頼性の高いアプリケーションの構築を支援するサービスをご用意しています。