Amazon Web Services ブログ
週刊生成AI with AWS – 2024/8/12週
みなさん、こんにちは。AWS ソリューションアーキテクトの小林です。
お盆の期間ですが、AWSのサービスアップデートはたくさんリリースされています。5月のゴールデンウィーク頃から書き始めたこの週刊生成AI with AWSでは、毎週発表される生成AIに関するニュースをお届けしてきました。皆さんも実感していらっしゃると思いますが、生成AIは技術の進歩がとても早い分野です。新しいモデルもどんどん出てきますし、AWSのサービス機能追加もハイペースで行われています。もしお時間が取れるようであれば、「便利に使えそうなサービスがリリースされていたけど、見落としていた」というものがないか、振り返ってみるのはいかがでしょうか?週刊生成AI with AWSの記事も、「週刊AWS」タグを付けてありますので一覧で見やすくなっています。
「AWSジャパン生成AI実用化推進プログラム」も参加者の方を募集中です。こちらのほうも引き続き、よろしくお願いいたします。
それでは、8 月 12 日週の生成AI with AWS界隈のニュースを見ていきましょう。
さまざまなニュース
-
- ブログ記事「LLM 社会実装を進める ELYZA 社: AWS Inferentia2 × Speculative Decoding の組み合わせは世界初、約 2 倍の推論速度を実現」を公開
AWS Startupブログ(日本語)で大規模言語モデル(LLM)の社会実装に取り組むELYZA様に関する記事が公開されています。700億パラメータのLLMである「ELYZA-japanese-Llama-2-70b」を開発したELYZA様ですが、チャット形式のデモサイトを提供しており、そのインフラ環境としてAWS Inferentia 2を搭載したインスタンスを活用しています。推論処理の高速化に利用されるSpeculative Decodingという手法をInferentiaで採用した事例としては世界初のものとなりますので、ぜひチェックしてみてください。
- ブログ記事「LLM 社会実装を進める ELYZA 社: AWS Inferentia2 × Speculative Decoding の組み合わせは世界初、約 2 倍の推論速度を実現」を公開
サービスアップデート
-
- Amazon EC2 G6eインスタンスが一般利用開始に
NVIDIA L40S Tensor Core GPUを搭載したAmazon EC2 G6eインスタンスがご利用頂けるようになりました。G6eインスタンスはG5インスタンスと比較して最大2.5倍のパフォーマンスを発揮し、P4dと比較して推論ワークロードを最大20%安価に実行できます。13B規模の大規模言語モデル(LLM)や画像、動画、音声を生成する拡散モデルのデプロイに適しています。現時点ではバージニア、オハイオ、オレゴンのリージョンでご利用頂けます。 - Amazon Connect Contact Lensが提供するエージェントのパフォーマンス評価機能が東京リージョンで利用可能に
Amazon Connectではコンタクトセンターの分析と品質管理機能を強化するContact Lensという機能を用意しています。この機能では生成AIの技術を活用して、お客様対応を担うエージェントのパフォーマンスを評価する上での推奨事項や、お客様対応が適切かどうかを示すインサイトを提供します。これによってコンタクトセンターの対応品質のさらなる向上に繋げることが可能です。 - Amazon Q in QuickSightが新たに5つのリージョンで利用可能に
Amazon Q in QuickSightは、データからのインサイトの獲得や活用を容易にする生成AIアシスタントです。これを利用すると、データを解釈し説明する文書やビジネス上のアクションを推奨したり、スライドやエグゼクティブサマリーを生成することができます。今回、Amazon Q in QuickSightが新たにカナダ(中央)、ムンバイ、アイルランド、サンパウロ、ロンドンの5つのリージョンでご利用頂けるようになりました。
- Amazon EC2 G6eインスタンスが一般利用開始に