オフロード
ML インフラストラクチャの管理
ユーザーに提供
複数の LLM オプション
簡素化
オープンモデルと独自モデルへのアクセス
スケール
追加のモデルに対応するため
概要
従来のオンライン検索エンジンに代わる強力なサービスを提供したいと考えていた Perplexity は、厳選された多数のソースに裏付けられた、パーソナライズされた会話形式の回答を提供するインタラクティブな検索支援ツールを作成しました。ユーザーは、関連性が高く、正確で、理解しやすい情報を得るために、複数の高性能な大規模言語モデル (LLM) から選択できます。
人気の高い最先端の LLM である Anthropic の Claude などの専有モデルへのアクセスを簡素化し、オープンソース LLM をファインチューニングするために、Perplexity は検索エンジンである Perplexity AI のために強力なグローバルインフラストラクチャを必要としていました。同社は、エンタープライズグレードのセキュリティとプライバシー、業界をリードする基盤モデル (FM) へのアクセス、生成 AI を利用したアプリケーションなど、幅広いサービスを提供する Amazon Web Services (AWS) 上に Perplexity AI を構築することにしました。Perplexity は、AWS で独自のモデルを実行するだけでなく、Amazon Bedrock を通じて Claude へのアクセスをユーザーに提供しています。Amazon Bedrock は、単一の API を通じて、AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Amazon などの先駆的な AI 企業のさまざまな高性能 FM を提供するほか、セキュリティ、プライバシー、責任ある AI を備えた生成 AI アプリケーションを構築するために組織が必要とする幅広い機能を提供するフルマネージドサービスです。
機会 | AWS を利用した会話型検索エンジンの構築
2022 年 12 月にリリースされた Perplexity AI は、時間の経過に伴ってユーザーの関心や好みを学習することで、コンテキストを判断し、やり取りをパーソナライズできます。各検索結果はソースのリストとともに提供されるため、ユーザーは情報の信頼性も把握できます。
Perplexity は、パブリック API サービスの提供を開始して以来、Amazon SageMaker を利用しています。Amazon SageMaker は、事実上あらゆるユースケースに対応する高性能で低コストの機械学習 (ML) 用の幅広いツールをまとめたフルマネージドサービスです。複数のクラウドプロバイダーを評価した後、Perplexity は、Amazon Bedrock の利用を補完することを目的として、モデルのトレーニングと推論のために AWS を選択しました。「AWS を利用することで、GPU にアクセスでき、プロアクティブな AWS チームの技術的な専門知識から恩恵を受けることができました」と Perplexity の Chief Technology Officer である Denis Yarats 氏は述べています。同社は、幅広いコンピューティング、最大 3,200 Gbps のネットワーキング、ML プロジェクトの料金パフォーマンスを最適化するために特別に構築されたストレージサービスを提供する Amazon Elastic Compute Cloud (Amazon EC2) のインスタンスタイプをテストしました。具体的には、Perplexity は、NVIDIA A100 GPU を搭載し、分散トレーニング用に最適化された Amazon EC2 P4de インスタンスを使用して、オープンソース FM をファインチューニングしています。
Perplexity AI ユーザーは、Amazon Bedrock を通じて、AWS パートナーである Anthropic の Claude 3 モデルファミリーからモデルを選択できます。Claude 3 モデルは、最先端のパフォーマンスに加えて、専門知識、正確性、コンテキスト理解を備えています。「Amazon Bedrock などの高性能なサービスを利用することで、Anthropic の強力なモデルを活用でき、チームが製品の信頼性とレイテンシーを効果的に維持できるようになります」と Perplexity の Technical Team のメンバーである William Zhang 氏は述べています。
Amazon Bedrock などの高性能なサービスを利用することで、Anthropic の強力なモデルを活用でき、チームが製品の信頼性とレイテンシーを効果的に維持できるようになります”
William Zhang 氏
Perplexity、Technical Team メンバー
ソリューション | Amazon Bedrock と Anthropic の Claude 3 を使用して、責任ある正確な検索エクスペリエンスを強化
Claude は簡潔かつ自然な言葉で情報を提供するため、ユーザーは明確な回答を迅速に得ることができます。Claude 3 モデルは 200,000 トークン (約 150,000 語または 500 ページ超相当) のコンテキストウィンドウを特徴としているため、ユーザーは大規模なドキュメントを迅速にアップロードして分析することもできます。「何かを当社の製品の一部にする上で、使いやすさは不可欠です」と Zhang 氏は述べています。「Amazon Bedrock で Claude 3 を使用することは、優れたデベロッパーエクスペリエンスの一部となっています」。
Perplexity は、ハルシネーション (LLM の不正確な出力) を減らすことで、あらゆる検索結果が正確かつ有益であるようにすることを目指しています。Anthropic の以前のモデルである Claude 2.1 では、既にハルシネーションの率が半分に削減されていました。そして、Anthropic は Claude 3 ファミリーでハルシネーションの削減と精度の向上をさらに推し進め、Claude 2.1 よりも精度がさらに向上しました。Anthropic がモデルのハルシネーションをゼロにすることを目指して取り組んでいる一方で、Perplexity は人間のアノテーターを活用して、正確かつ安全で信頼できる情報をユーザーにさらに提供しています。さらに、Perplexity は Anthropic と AWS の責任ある AIへのコミットメントから恩恵を享受しています。「Amazon Bedrock には、人々が意図しない目的で当社のソリューションを利用しようとしている場合に警告するコンテンツフィルターが組み込まれており、当社はそれを高く評価しています」と Perplexity の クラウドインフラストラクチャエンジニアである Aarash Heydari 氏は述べています。安全性と研究を中核とする企業である Anthropic は、有害な応答を生成したり、モデルを悪用したりしようとする「脱獄」と呼ばれる試みと戦う市場リーダーです。
Perplexity は、AWS を利用したインフラストラクチャで他のモデルもファインチューニングし続けています。2023 年 8 月、Perplexity は Amazon SageMaker HyperPod の早期ベータテスターになりました。Amazon SageMaker HyperPod は、FM のトレーニング用の ML インフラストラクチャの構築と最適化に伴う、差別化につながらない手間のかかる作業を排除します。Perplexity のエンジニアは AWS のソリューションアーキテクトと連携して、高速化された Amazon EC2 P4de インスタンスにトレーニングワークロードを自動的に分割し、それらを並列処理する画期的なスケーラブルインフラストラクチャを作成しました。Amazon SageMaker HyperPod は Amazon SageMaker の分散トレーニングライブラリで事前設定されており、パフォーマンスをさらに改善します。「トレーニングスループットの速度が 2 倍になりました」と Heydari 氏は述べています。「インフラストラクチャの管理は簡単で、ハードウェア関連の障害が大幅に減少しました」。
Perplexity が Amazon SageMaker HyperPod を利用して基盤モデルのトレーニングを 40% 高速化した方法の詳細については、この導入事例をお読みください。
2 か月後、Perplexity は、自社の専有オンラインモデルである Sonar Small と Medium にユーザーがアクセスできるようにパブリック API をリリースしました。これらのモデルは AWS でホストされており、Mistral 7B と Mixtral 8x7B を使用してファインチューニングされています。これらのオンライン LLM は、時間が重要な要素となるクエリに対応するために、トレーニングデータよりもインターネットからの知識を優先します。「モデルトレーニングと推論のための当社のインフラストラクチャはすべて Amazon SageMaker HyperPod を利用しています。同サービスは、当社が AWS を選択する上で重要な要素でした」と Heydari 氏は述べています。「Amazon SageMaker HyperPod は、当社の AI イノベーションの推進に役立っています」。
成果 | 検索における最新のイノベーションへのユーザーアクセスの提供
Perplexity AI は、ユーザーのニーズに合った幅広いモデルを継続的に提供し、Claude の最近のイテレーションに自動的にアクセスして、ユーザーが新しい機能を使用できるようにしています。
「当社は、複雑な製品を機能させるために統合する必要があるすべてのインフラストラクチャの要素について、非常に信頼性の高いエクスペリエンスを AWS で実現しています」と Heydari 氏は述べています。「当社は最先端の AI 機能を維持し、強力なモデルを使用するとともに、ユーザーエクスペリエンスを改善するあらゆるものの可能性を検討し続けます」。
Perplexity について
Perplexity AI は AI を利用する検索エンジンおよびチャットボットであり、自然言語処理や Amazon Bedrock などの高度なテクノロジーを利用して、毎月 1,000 万人を超えるユーザーからのクエリに対して正確かつ包括的な回答を提供します。
利用している AWS のサービス
Amazon Bedrock
Amazon Bedrock は、単一の API を介して、AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Amazon などの大手 AI 企業が提供する、高性能な基盤モデル (FM) を幅広く提供するフルマネージドサービスです。強力なプライバシーとセキュリティ、そして責任ある AI を備えた生成 AI アプリケーションを構築するために必要な幅広い一連の機能も備えています。
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod は、トレーニング基盤モデル (FM) 用の機械学習 (ML) インフラストラクチャの構築と最適化に伴う差別化につながらない手間のかかる作業を排除し、トレーニング時間を最大 40% 削減します。
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) は、極めて幅広く、奥深いコンピューティングプラットフォームを提供します。また、ワークロードのニーズに最も適切に対応できるように、750 を超えるインスタンスを提供するほか、最新のプロセッサ、ストレージ、ネットワーク、オペレーティングシステム、購入モデルを選択できます。
その他の生成系 AI のお客様事例
今すぐ始める
あらゆる業界のさまざまな規模の組織が AWS を活用してビジネスを変革し、日々ミッションを遂行しています。当社のエキスパートにお問い合わせいただき、今すぐ AWS ジャーニーを開始しましょう。