AWS Startup ブログ

サービスに蓄積されたデータと生成系 AI で、新しい体験を創る方法 ~AWS で利用可能な基盤モデルの紹介と Amazon SageMaker JumpStart を用いたカスタマイズ~

アマゾン ウェブ サービス ジャパンは 2023 年 5 月 30 日、オンラインイベント「サービスに蓄積されたデータと生成系 AI で、新しい体験を創る方法 ~AWS で利用可能な基盤モデルの紹介と Amazon SageMaker JumpStart を用いたカスタマイズ~」を開催しました。

動画の視聴はこちら

最近、ChatGPTStable Diffusion のように、非常に高い精度でテキストや画像を生成できる生成系 AI が話題になっています。本セミナーでは AWS でお客さまの機械学習活用を支援するエキスパートが、生成系 AI をサービス改善に結びつける手法について解説しました。

前半パートでは、お客さまが自社プロダクトに蓄積しているデータを用いて生成系 AI を活用する方法について事例を交えて紹介。後半パートでは、API や Prompt による利用だけでなく、プロダクトの差別化につながる一歩進んだ生成系 AI の活用方法と AWS での実現方法を紹介しました。


プロダクトの成長をリードする生成系 AI の活用戦略

セッション前半ではアマゾン ウェブ サービス ジャパン Machine Learning Developer Relations 久保 隆宏が、生成系 AI をビジネスに活かすための戦略立案の方法を解説しました。

生成系 AI とは、テラバイト規模のデータで学習させた数十億規模のパラメーターを持つ「基盤モデル」によって、追加学習なしに高精度の成果物を生み出すことができる技術です。

生成系 AI がこれまでの機械学習と異なる点として

「追加学習をほとんど必要としないこと」
「簡単な指示(Prompt)で多様なタスクを解けること」
「追加学習なし、簡単な指示にも関わらず高精度であること」

が挙げられます。生成系 AI は文章や画像、音声、動画などさまざまなデータの生成に利用できるため、ユースケースは多岐にわたります。

生成系 AI を用いた事業の戦略立案は大きく分けて

  • 「Biz:生成系 AI の役割を決める」
  • 「Dev:生成系 AI を活用する」
  • 「ML:生成系 AI を差別化につなげる」

という 3 つのステップから構成されています。

セッションでは「Biz:生成系 AI の役割を決める」から解説。下図の「ビジネスモデルキャンバス」を用いて、各社がどのような顧客にどのような価値を提供するために生成系 AI を用いているかという事例を説明しました。

まずは、ロゴやチラシ、バナーなどをデザインできる SaaS 型のサービス「Canva」の事例。「Canva」は生成系 AI を用いて、AI イラスト生成の機能を提供しています。この機能は無料で利用可能であることから、新規ユーザーの拡大を企図していると推察されます。

また、仕事に必要なアプリケーションをワンストップで提供する SaaS 型のサービス「Notion」では、文章の編集や要約が行える Notion AI を公開しています。この機能は有料プランの場合に使用できることから、顧客単価の向上を企図していると推察されます。

このように、ひとくちに「生成系 AI を用いて機能を提供する」と言っても、ビジネスモデル上の役割に応じて顧客や価値、売り方などが変化するのです。セッション内では他にも、飲食店検索・予約サービス「食べログ」やアクセンチュア社の事例が解説されました。

これらの事例が示すように、ビジネスモデル上の役割に応じて顧客は変わります。そして顧客が変われば、生成系 AI のユースケースや価格プラン、営業方法も変わってきます。生成系 AI の役割を決めるうえで最も重要なのは「お客さまは誰なのか?」を考えること。これは、Amazon や AWS が実践する Working Backwards(お客さまから逆算して、モノやサービスを作るための考え方)にも通じる概念です。

次に「Dev:生成系 AI を活用する」についても解説。生成系 AI の登場によって生じたプロダクト開発の変化として、「事前準備なしに機械学習を試せるようになったこと」が挙げられます。そして、生成系 AI の活用パターンには大きく分けて以下の 4 つがあります。

生成系 AI は便利である一方で、「基盤モデルの推論にコストがかかる」「目的に合致した最適な指示(Prompt)を特定するのが困難である」「生成結果のコントロールが困難である」といった欠点があります。これらの欠点を解消するためには、サービス提供者が適切なコントロールを行う必要があるのです。ここからは、各社がどのような方法でコントロールを行っているのかという事例を紹介しました。

まずは、さまざまな開発環境でさまざまなプログラミング言語の開発を支援する Amazon CodeWhisperer の、生成系 AI によるソースコード自動生成機能。この機能は、前述の生成系 AI の活用パターンの「①商用の生成系 AI サービスを利用」のケースです。Amazon CodeWhisperer では、提案したコードの出典の追跡とセキュリティスキャンを行うことで、生成結果のコントロールを可能にしています。

また他の事例として、生成したテキストの正確性を担保するために、検索エンジンと組み合わせる方法もあります。

久保は各社の事例を踏まえ、生成系 AI を活用するポイントとして「すぐに試せるメリットを活かし、企画の仮説検証を迅速に行う」「生成系 AI の難点、特に生成結果の不確実性について対策する」「ユーザーがどのような機能を好んで使用するのか、生成系 AI の活用状況をテストする」などを挙げました。

最後に「ML:生成系 AI を差別化につなげる」についても述べていきます。機械学習を用いたビジネスを成功させるには、以下の勝ちパターンの流れを構築することが重要です。

1. 機械学習が Customer Experience(CX:顧客体験)を改善する。

2. ユーザー数や Traffic が増える。

3. Traffic が増えると Data が増える。

4. Data が増えるとモデルが改善されて 1 に戻る。

この好循環を実現するには、前述の生成系 AI 活用パターンのなかの「③生成系 AI モデルをチューニング」「④生成系 AI モデルを独自開発」を行うことが重要になります。その体制を実現した事例として、OpenAI が GPT-3 から ChatGPT のベースとなった InstructGPT を構築したプロセスについて解説しました。

この事例では、はじめに GPT-3 をリリースしました。そして、GPT-3 の API 利用データを蓄積していき、そのデータをベースに学習をして InstructGPT のモデルを構築したのです。現在では、 AI21LabCohereAnthropic など様々なスタートアップが大規模言語モデルの勝ちパターン構築に取り組んでおり、その性能を高めています。それらはHELMなど大規模言語モデルのベンチマーク性能にも表れています。

今回のセッションで解説した「Biz: 生成系 AI の役割を決める」「Dev: 生成系 AI を活用する」「ML: 生成系 AI を差別化につなげる」それぞれの戦略を立案したうえで、プロダクト開発のロードマップを設計していくことが重要です。

戦略立案の流れを習得するには、AWS の提供する ML Enablement Workshop に参加することも効果的です。これは、プロダクトマネージャーと開発者、データサイエンティストの 3 者が組織横断的なチームを組成して、機械学習の勝ちパターンを実現するロードマップの作成を行うワークショップです。ML Enablement Workshop 以外にも、AWS ではさまざまな機械学習の活用検討や実装支援のためのプログラムを用意しています。


生成系 AI の活用を AWS のサービスで加速するアイディア

セッション後半ではアマゾン ウェブ サービス ジャパン シニア スタートアップ 機械学習 ソリューションアーキテクト針原 佳貴が、AWS のサービスを用いて生成系 AI を活用する方法を解説しました。

AWS には現在 3 種類の生成系 AI のサービスが存在しています。まず、主要な AI スタートアップや AWS の基盤モデル(FM)を API 経由で利用可能にするフルマネージド型サービス Amazon Bedrock*。次に、生成系 AI モデルのハイパフォーマンス深層学習トレーニング専用に構築された Amazon EC2 Trn1nAmazon EC2 Inf2 インスタンス。そして、AI コーディング支援サービス Amazon CodeWhisperer です。

*…Amazon Bedrock は本セミナーが実施された 2023 年 5 月 30 日時点では Limited Preview です。

Amazon Bedrock は幅広い基盤モデルをサポートしています。AWS が提供する Amazon Titan や、AI21 Labs 社の Jurassic-2Anthropic 社の ClaudeStability AI 社の Stable Diffusion です。

Amazon Titan は Amazon が開発した高性能な基盤モデルです。Amazon が 20 年以上にわたって蓄積した機械学習の経験に基づいて構築されています。Titan Text は、文章の要約やテキスト生成のような言語タスクを自動化します。Titan Embeddings は検索精度の向上やパーソナライズされたレコメンデーションの改善などを行います。不適切・有害なコンテンツを削減して、生成結果を適切にコントロールできることが特徴です。Amazon Bedrock では、お客さまが自社データを使用して基盤モデルを独自にカスタマイズできます。

Amazon EC2 Trn1/Trn1n と Amazon EC2 Inf1/Inf2 は、クラウド上の学習・推論を最も良いパフォーマンス・価格で実現するインスタンスです。これらのインスタンスには、AWS InferentiaAWS Trainium などの目的に特化した ML アクセラレータ (専用チップ) が搭載されています。

AWS Inferentia は推論用の第 1 世代のチップです。同等の性能の Amazon EC2 インスタンスと比較して、推論コストを最大で 70% 削減できます。AWS Trainium はコスト効率とパフォーマンスが最も良い深層学習トレーニング専用のチップです。同等の性能の Amazon EC2 インスタンスと比較して、学習コストを最大で 50% 節約できます。

AWS Inferentia2 という Inferentia の第 2 世代のチップも発表されています。これは初代の Inferentia と比べて、さらに大きなモデルの推論を効率的に行えることが特徴です。それぞれのチップは、Amazon EC2 の Inf1、Trn1、Inf2 インスタンスに搭載されています。他にも Trn1 インスタンスのネットワーク帯域幅を2倍にして 1600 Gbps の Elastic Fabric Adapter (EFAv2) に強化した Trn1n インスタンスも発表されています。

Amazon CodeWhisperer は AI コーディング支援サービスで、自然言語 (プロンプト) 行全体および全関数のコードの提案を IDE で生成する開発者の作業を手助けしてくれます。

生成系 AI のサービスを利用し始める第一歩として、針原は Amazon SageMaker JumpStart を推奨しました。これは Amazon SageMaker の機能のひとつであり、サンプルノートブックやトレーニング済みのモデルを検索してワンクリックで立ち上げることができます。それに加えて、特定のユースケースに合わせて事前に構築された Solution と呼ばれるアーキテクチャをワンクリックでデプロイすることも可能。Amazon SageMaker JumpStart で利用可能な基盤モデルは下図のとおりです。

生成系 AI のモデルを試す方法の他の選択肢として、Hugging Face Hub を利用する選択肢も挙げられます。これは 12 万以上のモデルが公開されているプラットフォームであり、このプラットフォームから特定のモデルを Amazon SageMaker へ簡単にデプロイできます。

セッション内では、Amazon SageMaker を用いて構築する、複数の大規模言語モデルを呼び分ける際の典型的なアーキテクチャも紹介されました。

また、大規模言語モデルを利用してサービスを開発する際には、LangChain というライブラリを使うのが便利です。大規模言語モデルを使ったアプリケーションの構築を支援してくれます。

セッション最終盤では、生成系 AI アプリケーションの情報源を社内に蓄積されているデータのみに制限する検索拡張生成(Retrieval Augmented Generation)という手法や、その関連情報などの解説も行われました。

Retrieval Augmented Generation に関連するブログ

ブログ:高精度な生成系 AI アプリケーションを Amazon Kendra、LangChain、大規模言語モデルを使って作る

ブログ:Build a powerful question answering bot with Amazon SageMaker, Amazon OpenSearch Service, Streamlit, and LangChain

今回紹介した内容に関連するブログ

ブログ:AWS で生成系 AI を使用した構築のための新ツールを発表

ブログ:たった数枚の画像で Stable Diffusion をファインチューニングできる効率的な Amazon SageMaker JumpStart の使い方

セッション後は視聴者から寄せられた質問に回答し、イベントを終了しました。


導入支援・お見積り・資料請求等に関するご質問、ご相談に日本担当チームがお答えします。平日 10:00〜17:00 はチャットでもお問い合わせいただけます。お問い合わせはこちら