教育における生成系 AI: 授業コンテンツを活用した AI ソリューションの構築

教育業界は、ここ数年で革新的な技術変化を遂げました。まず、パンデミックにより e ラーニングソリューションが増加しました。教師と生徒がコミュニケーション、教育、学習、および学術情報の管理にデジタルプラットフォームを採用したためです。これらのソリューションは、世界中の生徒たちがインターネットを通じて質の高い教育を受けることができることを表しています。デジタルプラットフォームの使いやすさとアクセスの容易さにより、教師と生徒の考え方が変化し、オフラインの授業とともにオンライン学習を引き続き活用するようになりました。

さらに最近では、人工知能（AI）の分野におけるイノベーション、つまり生成系 AI が、教育者や教育技術企業（EdTech）に対し、このテクノロジーがどのように生徒の成功を促進し、教職員の生産性を向上させるかといったことを再考する新たな機会をもたらしています。

このブログ記事では、自動化・個別最適化された教育用ツールを用いて生徒の体験を支援する目的で、 Amazon Web Services (AWS) で録画済みの授業動画を使った複数の生成系 AI ソリューションの作り方を学べます。例としては、動画からテキストへの文字起こし、授業の要約や宿題・問題の生成、教材の地域ごとの言語への翻訳、問題解決のために個別最適化された授業用チャットボットの作成などがあります。

ソリューションの概要: 授業コンテンツを用いた教育向け生成系 AI ソリューションの構築

Amazon Interactive Video Service (Amazon IVS) などのライブストリーミングビデオサービスを使用すると、教師はリモートの生徒と教室での授業をリアルタイムで共有できます。ライブストリーミングを使えば、遠隔地の生徒は、対面での環境と同じように質問をしたり、教師とやり取りしたりできます。その後、教育者はストリーミングされた授業内容
を録画してテキストに変換することができ、こうした文字起こしは、生成系 AI ソリューションにおいてさまざまな用途で利用可能です。

このブログ記事では、AWS 上の AI サービスを使ったハイレベルのソリューションアーキテクチャと、事前トレーニング済みの大規模言語モデル (LLM) について説明します。こうしたモデルは、Amazon や主要な AI スタートアップが開発した基盤モデル (FM) を API 経由で利用できるフルマネージドサービスの Amazon Bedrock や、機械学習 (ML) への取り組みを加速させるのに役立つ ML ハブである Amazon SageMaker JumpStart から利用可能です。

ソリューションの基礎: 授業のストリーミング、録画、文字起こし

教師や生徒を支援する上で AI ソリューションが授業内容を扱えるようにするために、その内容を録画し文字起こしをする必要があります。Amazon IVS を使用すると、教師は実際の教室から授業を行い、その授業をリモートで同時に視聴可能にできます。

Amazon IVS はフルマネージドのライブストリーミングソリューションです。コンテンツを Amazon IVS にストリーミングするだけで、世界中のあらゆる視聴者が低遅延のライブ動画を閲覧できるようになります。Amazon IVS は、Twitch と同じテクノロジーを使用して、ライブコンテンツの取り込み、トランスコーディング、パッケージ化、配信を行います。

ライブビデオを Amazon Simple Storage Service (Amazon S3) バケットに保存するように Amazon IVS を設定できます。ビデオストリームはビデオファイルとして保存され、Amazon Transcribe に送信することで音声をテキストに変換できます。Amazon Transcribe では授業の音声や動画を、授業中リアルタイムにあるいは授業後にまとめて、テキストに変換できます。

その後、授業の文字起こしも Amazon S3 に保存でき、それを Amazon Bedrock や Amazon SageMaker JumpStart を使用するさまざまな生成系 AI のユースケースに利用できます。

さらに、生徒の宿題のような他のテキストベースのコンテンツも Amazon S3 に保存し、授業の文字起こしと一緒に使用することで、より生徒にとってパーソナライズされた体験を構築できます。

図 1.このブログ記事の基礎となるソリューションのアーキテクチャ図。まず、教育者は Amazon IVS を使用してコンテンツをストリーミングおよび録画し、生徒がリモートで視聴できるようにします。その後、録画した授業ビデオが Amazon Transcribe で処理され、ビデオ内の音声が自動的にテキストに変換されます。次に、Amazon Transcribe は文字起こしを Amazon S3 バケットにアップロードします。Amazon Bedrock や Amazon SageMaker などの AI サービスでは、文字起こしを様々な目的で活用できます。例えば、SMS、電子メール、ソーシャルメディアを通じて学習者にメッセージを送信するコンテンツの生成、授業の概要の生成、授業教材に基づいて生徒の質問に回答できるパーソナライズされたチャットボットの作成、関連画像の生成、生徒の評価などが可能です。Amazon Translate では、Amazon S3 から取得した文字起こしを地域ごとの言語に翻訳できます。また Amazon Kendra を使えば、生徒が授業コンテンツを効果的に検索して利用する検索ソリューションを作成できます。

授業の要約と検索可能な授業内容インデックスの生成

一度授業の文字起こしを行えば、教育者は授業の要約生成ソリューションを構築できます。生徒は授業の要約を短時間で読むことができ、授業を通して教わる重要な概念を学べます。

図 2 は、AWS におけるこのモデルのハイレベルなアーキテクチャの構築方法を示しています。AI ソリューションでは、Amazon Bedrock や Amazon SageMaker JumpStart で利用可能なテキスト要約ができるさまざまなモデルを使用して、授業内容全体をほんの数段落に要約します。要約されたテキストは、深層学習により人間の自然な音声を合成できるサービスである Amazon Polly を使用して音声に変換され、生徒は授業の要約を聞くこともできます。コンテンツをさまざまな地域の生徒にローカライズするために、元の文字起こしと要約のテキストを Amazon Translate でサポートしている言語に翻訳できます。

教育者は、生徒が特定の授業コンテンツにすばやくアクセスできるように、録画した授業や文字起こし、要約を章立ててまとめることもできます。その後、教育者は ML を活用したインテリジェントな検索サービスである Amazon Kendra を使用して、授業内容の検索可能なインデックスを作成でき、生徒は自分が必要とする内容を検索できるようになります。Amazon Kendra で構築されたアプリケーションでは、生徒は自然言語で質問し、教材から非常に正確な回答を得ることができます。たとえば、化学の授業を受講している生徒が、Amazon Kendra に保存されている授業内容を検索して、「酸とは何か？」といった質問をすることができます。Amazon Kendra は授業の文字起こしから利用可能なコンテンツを取得します。統合された大規模言語モデル (LLM) は内容を要約し、自然言語として回答を示します。

図 2. 授業の文字起こしから授業の要約を生成するアーキテクチャ図。文字起こしが Amazon S3 バケットにアップロードされると、Amazon Bedrock または Amazon SageMaker JumpStart が事前に訓練されたモデルを使用して、文字起こしされたコンテンツを要約します。この要約されたコンテンツを、Amazon Translate に送信すれば複数の言語に翻訳できたり、Amazon Polly に送信すれば要約を音声に変換できたりします。また Amazon Kendra に送信すれば、すべての授業内容をインテリジェントに検索できるインデックスを作成できます。

問題や学習資料の作成

教師は、文字起こしした授業内容に生成系 AI を用いることで、特定の授業や授業に基づいた問題と解答の組み合わせを素早く生成できます。教育者はこれらの問題を使って、宿題やフラッシュカード、小テスト、試験問題の準備を行えます。Amazon Bedrock と Amazon SageMaker JumpStart で利用できるテキスト生成モデルでは、文字起こしした授業内容からこのタイプの教材を生成できます。その後、Amazon Kendra を使って、こうした評価や学習のための教材をインデックス化し検索できるようにできます。

図 3. 問題生成のアーキテクチャ図。主要なコンポーネントは Amazon Bedrock や Amazon SageMaker JumpStart です。

パーソナライズされた授業用チャットボットを作成して、教材に関する質問に回答する

授業の文脈における生徒からの質問に自動的に回答できるチャットボットを作成できれば、生徒の体験向上につながります。図 4 は、このソリューションを AWS で設計する方法を表したハイレベルなアーキテクチャを示しています。

Amazon Lex は、高度な自然言語モデルを備えたフルマネージド AI サービスで、アプリケーション (チャットボットなど) の会話型インターフェイスを設計、構築、テスト、デプロイできます。その後、生徒は音声またはテキストでこのチャットボットとやり取りできます。

生徒が授業用チャットボットに授業に関する質問をすると、Amazon Lex は Amazon Kendra から回答を取得します。Amazon Kendra はテキスト生成 LLM にコンテキストを与え、自然言語でレスポンスが返されます。その後、Amazon Lex はこのレスポンスをユーザーに返します。外部のデータベースからコンテキスト情報を取得して LLM の知識を拡張するこのプロセスは、検索拡張生成（RAG）と呼ばれます。Amazon Lex が、Amazon Kendra インデックス用の LangChain リトリーバーを用いるような AWS Lambda 関数を呼び出すことで、RAG ワークフローを実装してます。ここで LangChain は、LLM を外部の情報源と統合できるようにするフレームワークです。

さらに、授業の音声やビデオの中で特定の概念が説明されている正確な時間を提供することでも生徒の学習体験はより良くなります。GitHub で利用可能な MediaSearch ソリューションを使用すると、Amazon Kendra 内でオーディオコンテンツとビデオコンテンツを検索できるようになります。

図 4. Amazon Kendra でインデックス化された質問および回答を使用した、自動で疑問を解決するソリューションのアーキテクチャ図。主なコンポーネントは、Amazon Bedrock あるいは Amazon SageMaker JumpStart、また、Amazon Kendra と Amazon Lexです。

生徒の試験などの自動採点

AI ソリューションは生徒の試験を採点するのにも役立ちます。これにより、教師は日々の採点に費やす時間を減らし、複雑なトピックや生徒への個人的な指導に専念できます。さらに、生徒は自分の解答に対して即座にフィードバックを得ることができるため、授業の理解と進度が早まります。

図 5 は、このソリューションのハイレベルなアーキテクチャの例を示しています。試験の解答を確認するために、生徒の解答と、 Amazon DynamoDB などのデータベースから取得した正解として期待される解答がテキストプロンプトとしてテキスト生成の LLM に送信されます。Amazon Bedrock や Amazon SageMaker JumpStart で利用できる LLM に、生徒の解答と期待される解答を照らし合わせてチェックするよう依頼します。このアーキテクチャを基礎とすることで、生徒が自身の解答が正しいのか、部分的に正しいのか、あるいは間違えているのかを説明付きですばやく判断できるようなシステムを設計できます。また、このアーキテクチャは、教師が生徒たちの解答を最初にまとめて自動採点できるようにも拡張可能です。

図 5. 生徒の解答採点のアーキテクチャ図。主なコンポーネントは Amazon Bedrock や Amazon SageMaker JumpStart 、Amazon Lex です。

画像を生成して情報をより明確で説得力のあるものにする

画像生成モデルを使用すると、教師は自分の持つイメージを魅力的な絵に変え、ストーリーを語るように概念を説明できます。たとえば、拡散モデルを使用して授業の文字起こしからイラストを生成し、概念を明確にする、あるいは単にコンテンツをより楽しく魅力的なものにすることができます。元となるテキストに加えて、サンプルイメージも組み合わせることで stability.ai の Stable Diffusion モデルを使い目的通りの画像を生成できます。これらのモデルは Amazon Bedrock や Amazon SageMaker JumpStart ですぐに利用可能です。

図 6. 画像生成のアーキテクチャ図。主なコンポーネントは Amazon Bedrock や Amazon SageMaker JumpStart です。

まとめ

授業の要約、採点、生徒の質疑への回答（Q&A）、テキストや画像の生成は、教育者にとって時間を要する作業です。AWS で利用できる AI ソリューションでは、新しい生成系 AI の機能を使ってこれらのタスクをシンプルに実行できます。そして教育者は面倒な作業に割く時間を減らし、生徒の体験を豊かにすることにもっと集中できます。

AWS における生成系 AI 使用に関する詳細については、「AWS で生成系 AI を使用した構築のための新ツールを発表」を参照してください。

本ブログはソリューションアーキテクトの田村健祐が翻訳しました。原文はこちらです。

Amazon Web Services ブログ