builders.flash

デベロッパーのためのクラウド活用方法

生成 AI を用いたヘルプソリューションを作成する

2024-03-04 | Author : 川島拓海

はじめに

ゲームなみなさんこんにちは！Game Solutions Architect の川島です。

この記事は、2024 年 2 月の builders.flash 記事「品質管理に生成 AI は使えるのか！？テキストチェックを生成 AI にやらせてみた」(以下「前回の記事」) に続く内容となっています。まだの方は是非そちらの記事も併せてご覧ください。

前回の記事では、生成 AI を用いた QA (品質管理) をテーマに、生成 AI に誤字・脱字・衍字を校正してもらうプロンプトを紹介しました。この記事では、生成 AI を用いた QA (品質管理) をツール化・ソリューション化していきます。また、より発展的なソリューションとして、ヘルプの作成も紹介していきます。これにより、社内の様々な業務に携わるメンバーが、API 経由で生成 AI による支援を受けられるようになります。

今回特に主題となる技術は、RAG (Retrieval Augmented Generation) と呼ばれる、ドキュメントに書かれた内容をもとにして生成 AI がユーザーの質問に回答を返すソリューションです。

X ポスト » | Facebook シェア » | はてブ »

builders.flash メールメンバー登録

毎月提供されるクラウドレシピのアップデート情報とともに、クレジットコードを受け取ることができます。

今すぐ特典を受け取る »

AWS for Games

AWS for Games はより早い開発、よりスマートな運営、そしてより楽しいゲームへの成長という Build、 Run、 Grow の 3 つの柱に沿ってサポートします。今回は Build の柱、「クラウドゲーム開発」の分野で生成 AI を利用したものになります。

Diagram illustrating the cloud game development lifecycle in Japanese, featuring stages for Build (クラウドゲーム開発), Run (ゲームサーバー, ゲームセキュリティ, ゲーム向けデータベース), and Grow (LiveOps, ゲーム分析, AI & ML), with icons representing each stage.

生成 AI を用いたソリューション

前回の記事の内容をソリューション化するための構成として、まずは Amazon Bedrock を用いた基本的な構成を考えてみます。

下の図で、Amazon API Gateway がユーザーが入力したプロンプトを受け取り、AWS Lambda がそのプロンプトを整形します。そのあと、AWS Lambda は Amazon Bedrock がホストする生成 AI モデルにプロンプトを投げます。

今回は、前回の記事と同様に生成 AI のモデルとして Claude 2.1 を利用します。

Architecture diagram showing the integration flow from a user to Amazon API Gateway, AWS Lambda, and Amazon Bedrock.

プロンプトの整形

ここで、AWS Lambda が行うプロンプトの整形の役割を確認します。

エンドユーザーがある文章を校正してほしいとき、AWS Lambda はそれ以外の文章を補完して、前回の記事で見たようなプロンプトに変えます。これにより、エンドユーザーは校正してほしい文章を入力するだけで校正案を得られます。

AWS Lambda が変形したあとの文章例は下のようになります。詳細は前回の記事をご覧ください。

あなたはゲーム開発会社のバグチェッカーで優秀な校正チェッカーです。会話文の誤字や脱字や衍字や文章全体の表記揺れをすべて見つけて指摘することが仕事です。以下はあなたがこのタスクで使用する文章(<dialogue>)です。文章は日本語の会話文です。<dialogue>（エンドユーザーの入力した文章はここに入る）</dialogue>以下は指摘する際に使用するルールです。しっかり覚えて理解して下さい。<rule>（省略）</rule>Human:<dialogue>内には誤字、脱字、衍字、表記揺れが含まれています。<rule>内の内容すべてに従い、<dialogue>内の文章の文脈と意味の理解を深め、文字や単語のレベルでも注意深くチェックし可能な限りすべての誤字、脱字、衍字、表記揺れを指摘して下さい。Assistant:

また、社内や社外の一部ユーザーのみにアクセスを絞る場合は、Amazon API Gateway の前段に認可・認証を挿入することもできます。Amazon Cognito や AWS IAM Identity Center を利用すれば実現できますが、今回は詳しくは扱いません。

RAG を用いた社内ナレッジを活用するソリューション

上の章で紹介した校正作業は、決まったプロンプトさえ入力すれば、生成 AI が自身の持つ知識を利用して回答してくれるものでした。一方で、ゲーム業界であるユースケースを考えると、必ずしも生成 AI が持つ知識だけで回答できる問題ばかりとは限りません。例えば、あるゲームのヘルプを生成 AI で作成する場合、そのゲームの仕様を生成 AI は知らないので、何かしらの方法で伝える必要があります。

そんなときに使えるのが、この章で紹介する RAG (Retrieval Augmented Generation) と呼ばれるソリューションです。

RAG は日本語で「検索拡張生成」と呼ばれる技術で、ドキュメントの検索と生成 AI による回答生成を組み合わせたものです。AWS 上でよく構成される RAG の例を下の図に示しました。ここで登場する Amazon Kendra は、ドキュメントを検索するサービスです。

ユーザーがプロンプトを入力すると、アプリケーションは Amazon Kendra の API を実行して、プロンプトの内容に関連するドキュメントを検索します。そして Amazon Kendra により検索されたドキュメントの結果をもとに、アプリケーションは Amazon Bedrock の API を実行して生成 AI モデルから回答を受け取ります。これにより、生成 AI モデルはドキュメントの内容をもとに回答を返せるようになります。

また、アプリケーションが生成するプロンプト内で、ドキュメントに含まれていない内容は回答に含まないよう生成 AI に指示することで、一般に「ハルシネーション」と呼ばれる生成 AI が虚偽の回答をする現象が起こる可能性を逓減できます。

ゲームのヘルプを作りたい場合は、Amazon Kendra が検索する対象のドキュメントにゲームの仕様書を含めればいいだけです。使い方によっては、内部の開発者向けの確認のツールにも、ユーザー向けのヘルプにも利用できます。

この構成はよく使われるものですが、Amazon Kendra と Amazon Bedrock を独自のアプリケーションで繋げる必要があります。しかし、その RAG を簡単に構成するための 1 つの方法として、AWS の提供するサンプルの利用があります。また、もう 1 つの RAG を簡単に始める方法として、Amazon Bedrock Knowledge Base という Amazon Bedrock の持つ機能を利用する方法もあります。今回は、特に後者の Amazon Bedrock Knowledge Base を主眼に置いてご説明します。

次の章では、Amazon Bedrock Knowledge Base の特徴を、Amazon Kendra を用いた RAG と比較しながら確認していきます。

A diagram showing the integration workflow from a User through Amazon API Gateway and AWS Lambda to Amazon Bedrock, with AWS Lambda also connecting to Amazon Kendra. This illustrates a cloud architecture using AWS services for API management, serverless compute, generative AI, and enterprise search.

Amazon Bedrock Knowledge Base とは

Amazon Bedrock Knowledge Base は、Amazon Bedrock が提供する RAG を構成するための機能です。検索の対象として読み込ませるドキュメントさえ用意すれば、簡単に始められます。裏側では、あらかじめドキュメントをベクトル化してデータベースに保存することで、プロンプトに対応するドキュメントをベクトル空間で検索しています。したがって、ドキュメントを同期する際には、テキストをベクトル化するための生成 AI が Amazon Bedrock 内で用いられます。

埋め込みモデルのフロー

一方、ユーザーがプロンプトを入力した際には、従来通りテキスト入力に対してテキストを出力する生成 AI が用いられます。2 種類の生成 AI モデルが活躍するためわかりにくいので、こちらの図にその様子をまとめます。

ドキュメントを読み込んでデータベースに格納する流れがこちらの図です。入力する際の生成 AI モデルは、埋め込みモデルと呼ばれます。なお、このベクトルデータベースの選択肢としては、Amazon OpenSearch Serverless、Amazon Aurora、Pinecone、Redis Enterprise Cloud があります。

Workflow diagram in Japanese showing the embedding process using Amazon Bedrock, including data placement in Amazon S3, chunking documents, generating embeddings with an embedding model, and storing results in a vector database.

回答生成のフロー

一方で、ユーザーからの質問に回答する際は、ベクトルデータベースとの照合で検索が行われます。実際に回答を生成する際に使われるのは、テキストを出力するモデルです。

Japanese-language diagram illustrating the response flow from a vector database and large language model (LLM). The image shows a user query, document search in a vector database, and answer generation using an LLM.

機能比較

Amazon Bedrock Knowledge Base の対応するリージョンやモデルを、Amazon Bedrock と Amazon Kendra を組み合わせた場合と比較しながら下記に紹介します。ただし、仕様は 2024 年 2 月時点のものです。

対応しているリージョンやモデルなどは、今後追加される可能性もあります。詳しくはこちらのドキュメントをご覧ください。

Amazon Bedrock Knowledge Base	Amazon Bedrock + Amazon Kendra
読み込めるファイル	プレーンテキスト (.txt) Markdown (.md) HyperText マークアップ言語 (.html) Microsoft Word ドキュメント (.doc または .docx) カンマ区切り値 (.csv) Microsoft Excel スプレッドシート (.xls または .xlsx) ポータブルドキュメント形式 (.pdf)	Amazon Kendra が対応しているすべてのファイルおよびデータソース
リージョン	北バージニア・オレゴンのみ	Amazon Bedrock: 東京含む 6 リージョン Amazon Kendra: 東京含む 11 リージョン
日本語で使える埋め込みモデル (※)	Amazon Titan Embeddings G1 - Text	Amazon Kendra 内部の検索アルゴリズムに依存
プロンプトへの回答に使えるモデル	Anthropic Claude (Instant v1, v2.0, v2.1)	Amazon Bedrock がホストするすべてのモデル (ただし日本語に対応しているのは Anthropic Claude 系のモデルのみである点に注意)

※ Amazon Titan Embeddings は正式には日本語対応が発表されていませんが、現状でも一定の性能でご利用いただけます。

Amazon Bedrock Knowledge Base の大きな制約の 1 つに、使えるリージョンが限られている点が挙げられます。また、Amazon Kendra はネイティブコネクタによりクローリングをはじめとした外部データソースの読み込みができますが、Amazon Bedrock Knowledge Base では一度ファイル化して Amazon S3 に格納しないとデータソースとして扱えません。それ以外にも、Amazon Bedrock Knowledge Base はプロンプトへの回答に使えるモデルも限られていますが、日本語で利用する場合は Amazon Bedrock と Amazon Kendra を組み合わせる場合と差異はありません。

一方で、埋め込みモデルの選択肢を考えると、Amazon Bedrock Knowledge Base は複数のモデルから選択できます。検索の精度がモデルによって変わる状況では、検索に使うモデルやサービスを基準にソリューションを選定してもいいかもしれません。そして Amazon Bedrock Knowledge Base の何よりの魅力は、その構築の簡単さです。ですので、複数のソリューションで精度を確認する際でも、まずは Amazon Bedrock Knowledge Base を利用して精度を確認してみるというのも 1 つの手です。次の章からは、Amazon Bedrock Knowledge Base のマネジメントコンソール上での構築方法を紹介していきます。

Amazon Bedrock Knowledge Base の利用開始方法

注意点

繰り返しになりますが、2024 年 2 月時点で Amazon Bedrock Knowledge Base が利用可能なリージョンは北バージニアとオレゴンのみです。本章の作業は、すべて北バージニアリージョンで行います。もし作業の途中で、作ったリソースが存在しないなどの問題が発生した場合は、リージョンが正しいか確認してください。

本章の流れに沿ってリソースを構築する場合は、AWS のサービス料金がかかる場合のあることにご注意ください。builders.flash のメールメンバーに登録いただくと毎月抽選で 300 名の方にハンズオンをお試しいただくための無料クーポンを差し上げておりますので、登録いただき、抽選にご応募いただくと良いでしょう。

リソースを削除する場合は、「リソースの削除」の章をご確認ください。

Amazon S3 バケットの準備

Amazon Bedrock Knowledge Base を利用するためには、まずは Amazon S3 でバケットを用意します。バケットのリージョンは Amazon Bedrock Knowledge Base を利用するリージョンと同一であるよう確認してください。

バケットが作成できたら、そのバケットの中に検索対象とするドキュメントをアップロードします。Amazon Bedrock Knowledge Base が取り込み対象としてサポートしているファイルの拡張子は、こちらのドキュメントにまとまっています。

今回は、ゲーム業界で使われることの多い Excel ファイルを使ってみます。Excel ファイルの中身は、今回独自に作ったゲーム内のモンスターの仕様書です。詳しい内容は後段の章で紹介します。

Amazon Bedrock のモデルアクセス設定

Amazon Bedrock を利用を開始するには、利用するモデルのアクセス設定が必要です。

マネジメントコンソールで Amazon Bedrock のページに遷移し、左側のペインで「モデルアクセス」を選択します。それから、右上の「モデルアクセスを管理」をクリックしてください。ここで、利用したいモデルにアクセスできるようにします。

Amazon Bedrock Knowledge Base を利用する場合は、テキストのベクトル化とプロンプト生成のそれぞれで 1 つずつ、少なくとも 2 つのモデルのアクセスが必要です。本ブログでは、テキストをベクトル化する埋め込みモデルとして「Amazon Titan Embeddings G1 - Text」を、プロンプトに回答するモデルとして「Anthropic Claude」を利用します。

Amazon Bedrockの管理コンソールで『モデルアクセス』ページが表示されているスクリーンショット。利用可能なAI基盤モデルリストとアクセス設定管理ボタンが強調表示されている。

Amazon Bedrock Knowledge Base の設定

ここからは、いよいよ Amazon Bedrock Knowledge Base の設定です。

マネジメントコンソールの Amazon Bedrock のページにおいて、左側のペインから「ナレッジベース」をクリックし、「ナレッジベースを作成」をクリックしてください。

Amazon Bedrockのナレッジベース作成画面を示すスクリーンショット。日本語インターフェイスで、左側のメニューには『ナレッジベース』が強調表示されており、『ナレッジベースを作成』ボタンが右上にオレンジ色で表示されている。

ナレッジベースの詳細設定

ここから、ナレッジベースの設定を決めていきます。

まずはナレッジベースの詳細を決定します。ナレッジベース名はご自身の分かりやすいものにし、必要に応じてナレッジベースの説明も入力してください。

その下の IAM 許可では、特に設定にこだわりがなければ「新しいサービスロールを作成して使用」のままにしておきます。この場合、自動で IAM ロールが作成されます。必要に応じて分かりやすいロール名を設定してください。もし、自身の作った IAM ロールを利用したい場合は、「既存のサービスロールを使用」から対象のロールを選択してください。

データソースの設定

続いて、データソースの設定です。

データソース名を決めたあと、データを保存した Amazon S3 バケットの S3 URI を入力します。直接 URI を文字列で入力してもいいですが、右側の「S3 を参照」のボタンを押すと、バケットの一覧を表示して選択できます。

ここまで入力したら、また右下の「次へ」をクリックします。

Amazon Bedrockのナレッジベース作成プロセスで、S3データソースを設定する日本語ユーザーインターフェース画面。S3ロケーションの選択やカスタムKMSキーの追加オプションなどが表示されています。

埋め込みモデルの設定

続いて、埋め込みモデルとベクトルストアの設定です。埋め込みモデルは、自身の好きなものを選んでください。

埋め込みモデルの選択画面。Amazon Titan Embeddings G1 - Text v1.2、Cohere Embed English v3、Cohere Embed Multilingual v3 の各モデルが表示され、切り替えが可能なインターフェース。

ベクトルストアの設定

ベクトルデータベースは、そのまま「新しいベクトルストアをクイック作成」を選択すれば、Amazon OpenSearch Serverless でベクトルストアが作成されます。このベクトルストアは別途料金がかかり、削除の際は Amazon Bedrock Knowledge Base のリソースの削除とは別に削除する必要がある点に注意してください。

なお、既にベクトルストアを用意している場合は「作成したベクトルストアを選択」から既存のベクトルストアを選びます。設定したら「次へ」をクリックします。

最後のページで設定が正しいことを確認したら、右下の「ナレッジベースを作成」をクリックしてください。すると、ベクトルストアのセットアップが開始されます。この設定には数分ほどかかります。

Amazon Bedrockで新しいベクトルストアを作成または既存のストアを選択する設定画面のスクリーンショット。日本語インターフェースで、Amazon OpenSearch Serverless等のオプションが表示されている。

データソースの同期

モデルの準備ができたら、作成した Amazon Bedrock Knowledge Base の詳細画面に自動で遷移します。

この画面で、右側にある「モデルを選択」をクリックして、プロンプトの回答に利用するモデルを選択します。今回は、Claude Anthropic v2.1 を利用します。

そのあと、「データソースを同期」のボタンをクリックします。このステップで初めて、Amazon S3 バケット内にあるデータが Amazon Bedrock Knowledge Base から参照されるようになります。データソースの同期が完了するまでには時間がかかります。

Screenshot of the Amazon Bedrock knowledge base interface in Japanese, showing knowledge base overview information, sync data source, and model selection options.

Amazon Bedrock Knowledge Base を使ってみる

用意するデータ

今回 Amazon Bedrock Knowledge Base に取り込むデータとして、架空のモンスターの仕様書を用いました。この画像は、モンスターの仕様書の例です。

このような仕様書が Excel 形式で、複数シートおよび複数ファイルにわたり格納されています。

A Japanese game specification sheet displaying a cartoon skeleton character holding a spear, with detailed attributes, weaknesses, and strategies written in Japanese. The layout resembles a spreadsheet, with an illustration of the skeleton character at the top left.

実際に質問してみる

マネジメントコンソール上で質問してどのような回答が返ってくるか試すことができます。特に上のシートの内容について質問した場合の回答を、下の表にいくつかまとめてみました。記載されている内容が適切にまとめられていることが分かります.。

また、Excel シートはすべて日本語で書かれていますが、英語での質問にも回答してくれます。これは、生成 AI モデルが複数言語に対応しているためです。

質問	回答	実際の記載
スケルトンはどのように戦うモンスターですか？	ガイコツは近距離主体のモンスターで、手に持った槍を使ってプレイヤーを攻撃します。プレイヤーを見つけるとまっすぐに槍を持って突き進んできます。	ガイコツは近距離主体のモンスターです。手に持った槍を使ってプレイヤーを攻撃します。（中略）プレイヤーを見つけるとまっすぐに槍を持って突き進んできます。
スケルトンに攻撃されたときにはどのような効果が発生しますか。	ガイコツの槍で攻撃された時、プレイヤーの防御力が10%下がる効果があります。	槍は闇の魔力をまとっており、槍で攻撃されたプレイヤーは防御力が 10% 下がります。
What is the weak point of skeletons?	The skeleton monster's weak point is wind. Attacking it with wind attacks will do extra damage. The skeleton can be broken apart with enough damage. When broken apart, it cannot attack but will revive after some time. It is important to defeat it while broken apart.	弱点風（中略）一定以上のダメージを与えれば、バラバラになります。（中略）バラバラになったガイコツは攻撃ができなくなりますが、一定時間経つとまた復活します。バラバラになっている間に攻撃して倒すことが重要です。

リソースの削除

最後に、Amazon Bedrock Knowledge Base の構築のために作成したリソースを削除する流れを説明します。やるべきことは、大きく 3 つです。

Amazon Bedrock Knowledge Base の削除
Amazon S3 バケットの削除
ベクトルデータベースの削除

この記事では、Amazon Bedrock Knowledge Base の削除方法とベクトルデータベースの削除方法のみをご紹介します。Amazon S3 バケットの削除が必要な場合は、そちらも忘れずに削除してください。

Amazon Bedrock Knowledge Base の削除

Amazon Bedrockのナレッジベース管理画面のスクリーンショット。ナレッジベースの一覧、状態（Ready）、編集・削除ボタン、および日本語のUI要素が表示されている。

マネジメントコンソールの Amazon Bedrock の画面で、左側のペイン「ナレッジベース」をクリックし、Knowledge Base の一覧を表示します。そのあと、削除したい Knowledge Base の左側のラジオボタンをクリックしてから、「削除」ボタンをクリックします。

Amazon Bedrockのコンソールでナレッジベースを削除する際の日本語確認ダイアログ。削除を防ぐために確認文字列の入力を促し、注意事項が記載されている画面。

するとポップアップが表示されます。「delete」と入力してから「削除」ボタンをクリックすれば、該当の Amazon Bedrock Knowledge Base リソースが削除されます。

ベクトルデータベースの削除

Screenshot of the Amazon OpenSearch Serverless dashboard showing collection management in the Japanese language. The interface displays a list of collections, their statuses, and options to create or delete collections.

最後に、ベクトルデータベースを削除します。今回は Amazon OpenSearch Serverless で作成したので、マネジメントコンソールの Amazon OpenSearch Service のページに遷移します。

左側のペインで「サーバーレス」の下にある「ダッシュボード」をクリックすると、今ある Amazon OpenSearch Serverless のリソース一覧が表示されます。ここで、削除したいリソースを選択したうえで、「削除」をクリックしてください。

そのあとに表示されるポップアップ内で、「確認」と入力したあと「削除」ボタンをクリックすればリソースの削除が開始されます。

最後に

今回は生成 AI を利用したヘルプを構成するためのソリューションを取り上げました。また、後半では、Amazon Bedrock Knowledge Base を利用して、ゲームの仕様書からどのような回答が得られるのかを簡単に試しました。

RAG は、社内ナレッジの集約として社内外の人が検索する際に役立つとして今非常に注目されている技術です。Amazon Bedrock Knowledge Base なら、RAG の利用を簡単に始められます。皆様も、ご興味があればぜひお手元の環境で試してみてください。本記事が、皆様のナレッジ整理の一助になれば幸いです。

筆者プロフィール

川島拓海
アマゾンウェブサービスジャパン合同会社
ソリューションアーキテクト

2022 年 4 月に入社したソリューションアーキテクトです。食べることが大好きです。あと、ちょっとだけお笑いが好きです。

Portrait of a man with black hair wearing glasses and a beige blazer over a black T-shirt, standing against a light background.