社内知識を活用した生成 AI チャットボットを構築したい

生成 AI の機能をもつチャットアプリケーションを AWS で実現する際の
構成例とその概算料金をご紹介します

この構成例のクラウドレベル:

基礎

入門編:該当するユースケースの知識が全くない方が対象
基礎編:該当するユースケースの入門知識がある方が対象
応用編:該当するユースケースにある程度精通している方が対象

この構成例で解決できる課題・困りごと:

  • 社内に蓄積された多くのデータの中から適切な情報へのアクセスが難しいと感じている
  • 社内のデータと生成 AI を掛け合わせたチャットアプリケーションで素早く適切な情報や支援を取得したい
  • 参考例1)営業職の方は生成 AI チャットアプリケーションに質問して、社内のデータに基づいた回答にたどり着けます
  • 参考例2)技術職でプログラムを開発する方は、既存のコーディングの解説、機能を追加する際のコード生成、効率的な SQL クエリーを組み立てるアドバイスなどの支援が得られます

この構成例の概算料金:

942.21 ドル (月額)

この構成例のメリット:

  • Amazon Bedrock で提供されている基盤モデルと、Amazon Kendra と連携させた、生成 AI の RAG チャットアプリケーションを素早く構築可能
    例えば、Amazon S3 に社内のデータを格納することで、Amazon Kendra にデータを取り込みができ、社内のデータに基づいた回答を生成できる
  • GitHub で公開されている Generative AI Use Cases JP を活用することで、素早く環境を構築出来る。
  • Generative AI Use Cases JP の構築手順は GitHub 上に公開されており、こちらを参照してお手元の AWS アカウントにすぐに構築可能
  • Generative AI Use Cases JP は、RAG ユースケースだけではなく、文章生成、要約、文章校正、画像生成、音声認識、などよくあるユースケースを素早く試すことができる

この構成例で使用したサービスと概算料金内訳:

サービス 項目 数量 単価 料金 (USD)
Amazon Bedrock Claude 3 Sonnet 入力トークン 11,000,000 トークン 0.003 USD/1000 トークンあたり 33
  Claude 3 Sonnet 出力トークン 4,400,000 トークン 0.015 USD/1000 トークンあたり 66
Amazon Kendra Developer Edition 時間当たりの料金 730 時間 1.125 USD/時間 821.25
  Connector でスキャンしたドキュメント数 5,000 ドキュメント 0.000001 USD/ドキュメント 0.01
  Connector でスキャンした時間 30 時間 0.35 USD/時間 10.50
Amazon CloudFront データ転送 (OUT) 1 GB 0.114 USD/時間 0.11
  HTTPS リクエスト 30,000 リクエスト 0.012 USD/1万リクエスト 0.04
Amazon S3 ストレージ容量 0.01 GB 0.025 USD/GB 0
  GET、SELECT リクエスト数 1,000 リクエスト 0.00037 USD/1000 リクエスト 0
Amazon API Gateway REST API リクエスト数 15,000 リクエスト 4.25 USD/100 万リクエスト 0.06
Amazon Cognito アクティブユーザー数 50 ユーザー 0.0055 USD/ユーザー 0.28
AWS Lambda 割り当てたメモリと実行時間 37,500 GB-秒 0.000016667 USD/GB-秒あたり 0.63
  Lambda HTTP 応答ストリーム処理バイト 1 GB 0.008 USD/GB 0.01
Amazon DynamoDB オンデマンド 書き込み要求単位 (WRU) 1,000,000 WRU 1.4269 USD/100 万 1.43
  オンデマンド 読み出し要求単位 (RRU) 200,000 RRU 0.285 USD/100 万 0.06
  ストレージ容量 5 GB 0.285 USD/GB 1.43
Amazon Transcribe スタンダードバッチ文字起こし 分数 300 分 0.024 USD/分 7.20

月額合計料金:941.99 (USD)

※ 2024 年 3 月 15 日時点での試算です。

  • この構成例で紹介するアプリケーションは、aws-samples で公開されている Generative AI Use Cases JP を使用しています。
  • Generative AI Use Cases JP は、複数の機能が存在しており、各機能ごとに有効 or 無効を指定できます。この試算例では、RAG チャットの機能を有効化している構成です。RAG 以外の セキュリティ設定 (AWS WAF)、ファイルアップロード、検索エージェント、Knowledge base エージェント、モニタリング用ダッシュボードは試算に含まれていません。
  • この試算は、東京リージョンの料金単価を基に計算しています。一部の例外として、Amazon Bedrock は北部バージニアリージョンの料金単価で計算しています。Claude 3 Sonnet は 2024 年 3 月 15 日現在、東京リージョンで提供されていないためです。
  • 1ヶ月を 730 時間として計算しています。
  • 試算に伴うトークンの消費量は以下のように計算をしています。環境や使い方に応じて変わってくるので、参考値としてご利用ください。
    • 利用ユーザー数 50 人、利用頻度 1 日 10 回質問、1 質問あたり 1000 入力トークン、1 回答あたり 400 出力トークン、1 カ月 22 日計算。
  • Amazon Kendra は料金面を考慮して、比較して安価な Developer Edition を前提に試算をしています。本番環境では Enterprise Edition の採用もご検討ください。Enterprise Edition と Developer Edition の違いはこちらを参照ください。Developer Edition は無償枠の利用や単価が比較して安価なメリットがある一方、可用性の観点では Single-AZ で構成されています。
  • AWS で提供しているサービスの一部で無料利用枠が提供されています。本試算では無料利用枠を考慮せずに試算を行っており、実際にはより安価にご利用頂ける場合があります。以下に該当する無料利用枠を一部抜粋します。
    • AWS リージョンからインターネット方向のデータ転送 (アウト) : 100 GB/月
    • AWS Lambda :
        - リクエスト回数 1,000,000 件/月
        - コンピューティング時間 400,000 GB-秒/月
    • Amazon CloudFront :
        - データ転送 (アウト) 1 TB /月
        - HTTP/S リクエスト回数 10,000,000 回/月
    • Amazon DynamoDB :
        - ストレージ容量 25 GB/月
    • Amazon Kendra : Developer Edition を初回利用するとき、30 日間で 750 時間の利用
    • Amazon Cognito : 50,000 アクティブユーザー/月

この AWS サービスに関する参考情報

最新の料金やサービスのスペックを変更した場合の料金を知りたい場合は AWS Pricing Calculator を使って想定利用金額を算出してみましょう

AWS Pricing Calculator の使い方 (基礎編 - 1 つのサービスを見積もる方法 )
AWS Pricing Calculator の使い方(応用編 - 複数のサービスの組み合わせを見積もる方法)
  • アマゾン ウェブ サービス(AWS)の利用をご検討中の皆様に向けて、無料個別相談会を実施いたします。
    今後 AWS の導入に向けて、サービス詳細や特定の業界・サービスを活用した事例の紹介をご希望の皆様、料金関連(支払方法やお見積り、課金体系)に関するご相談、具体的な構成等の技術に関するご相談等を希望される皆様は、是非ご参加ください。
    無料個別相談会に申し込む »

  • お客様のビジネスニーズに合わせて AWS が提供できるサービスと提供内容についてご説明させていただきます。
    フォームにご記入いただき、AWS 日本担当チームまでお問い合わせください。
    フォームで日本担当チームに問い合わせる »

今日から AWS を始めましょう!

コンピューティング、データベース、ストレージ、コンテンツ配信、機械学習、IoT をはじめ、
AWS では、柔軟性、スケーラビリティ、信頼性の高いアプリケーションの構築を支援するサービスをご用意しています。