Amazon Web Services ブログ
週刊生成AI with AWS – 2024/9/9週
みなさん、こんにちは。AWS ソリューションアーキテクトの小林です。
そういえば、builders.flashで最近公開された記事をご紹介するのを忘れていることに気づきました。9月も半ばになってしまいましたが、今回の週刊生成AI with AWSで取り上げることにします。
- Amazon Bedrockを活用したWebページ作成をアシストする仕組みの構築 ~ 株式会社ペライチによるページ作成AI機能の実装解説(株式会社ペライチ様)
- DifyとAmazon Bedrockを使って、簡単にセキュリティオペレーション自動化 ~Amazon GuardDuty検知結果の自動解析を例に~(株式会社サイバーエージェント様)
- AWSトレーニングを活用して、ノーコード実装の生成AIチャットボットを設計する(トレノケート株式会社様)
- Amazon Bedrockで企業会計基準チャットボットを作ってみた!~金融機関における生成AIを使った業務効率化~(Trust Base株式会社様)
- そうだ!生成AIにシステム開発の面倒ごとを手伝ってもらおう!
- ビジネス向け生成AIアシスタント Amazon Q Businessをグラレコで解説
今回も盛りだくさんですね。お客様からの寄稿記事が増えているのはとても有り難いことだなと感じました。私自身もたくさんのお客様と、AWSを活用して生成AIの利活用に取り組むためのアプローチについて議論させていただくことがかなり増えてきましたので、ビッグウェーブを感じます。そんなお客様をご支援する「AWSジャパン生成AI実用化推進プログラム」も引き続き参加者募集中です。こちらのほうも、よろしくお願いいたします。
それでは、9 月 9 日週の生成AI with AWS界隈のニュースを見ていきましょう。
さまざまなニュース
-
- ブログ記事「LangChain と Amazon DocumentDB のベクトル検索を使用した生成 AI チャットボットの構築」を公開
AWSは生成AIアプリケーションで頻繁に利用されるベクトル検索機能を、様々なサービスで提供しています。この記事ではAmazon DocumentDB(with MongoDB compatibility)をベクトルデータベースとして利用し、LangChainによって大規模言語モデル(LLM)に問い合わせを行う構造のチャットボットを開発する方法をご紹介しています。 - ブログ記事「【開催報告】AWS Summit Japan 2024 物流業界向けブース展示 「倉庫x生成AIからの物流DX」」を公開
6月20日21日に開催されたAWS Summit Japanにて、AWSジャパンの物流業担当チームがブース展示を行った「生成AIによる倉庫の在庫管理の高度化」について解説するブログを公開しました。実務に適用するためには色々と考慮しなければいけないことがありますが、生成AIで課題解決を行うアイデアの一例として参考にして頂けるのではないでしょうか。 - ブログ記事「Amazon Bedrock を用いた Deltek 社の政府調達文書の質疑応答システム」を公開
海外の事例記事の和訳バージョンですが、AWS Generative AI Innovation Center(GenAIIC)がDeltekというお客様を支援した事例として興味深い点があります。GenAIICはDeltekさんに向けては政府調達文書に対するQ&Aを実行するRAGソリューションを提供しました。この事例の興味深い点は時系列の関係にある2つの文書に関するQ&Aを実現している点です。実践的なテクニックとしてご覧頂ける記事ですので、おすすめです。 - ブログ記事「Stability AI の最高の画像生成モデルが Amazon Bedrock で使用可能に」を公開
先週の週刊生成AI with AWSで、Amazon BedrockでStability AIが開発した最新の画像生成モデルが利用できるようになったとお知らせしました。このブログ記事では、その話題をさらに深掘りする記事の和訳バージョンです。それぞれのモデルが、業界ごとにどういったワークロードに適用されうるのかを解説しています。
- ブログ記事「LangChain と Amazon DocumentDB のベクトル検索を使用した生成 AI チャットボットの構築」を公開
サービスアップデート
-
- Amazon Q Developer Agentの機能強化を発表
Amazon Q Developer Agentに大幅なアップデートが行われ、コード記述に関するアシスタンス機能がより自律的に動作できるようになりました。これまでは開発者が、Amazon Q Developerが推奨するコード記述計画を確認し、その内容を承認する操作を行う必要がありました。今回のアップデートにより、より素早く自律的な問題の解決が可能になりました。 - Amazon Bedrock Knowledge Basesがクロスリージョン推論に対応
先日発表したAmazon Bedrockのクロスリージョン推論機能に続いて、Kowledge Basesでもクロスリージョン推論が可能になりました。トラフィックが急増した場合に、他のリージョンに転送して処理を行うことでサービスの継続性を維持することができます。クロスリージョン推論機能の利用は無料で、ユーザリクエストを受け付けたリージョン(転送元のリージョン)の単価に基づいて料金が発生します。 - Amazon EC2 P5eインスタンスがリリースされ、EC2 Capacity Blocksを介した利用が可能に
NVIDIAのH200 Tensor Core GPUを搭載したAmazon EC2 P5eインスタンスがリリースされました。H100を搭載したP5インスタンスと比較して1.7倍のGPUメモリと1.5倍のGPUメモリ帯域幅を備え、最も高い計算能力を要するワークロードに最適です。このインスタンスタイプは、インスタンスを予約できる仕組みのEC2 Capacity Blockを介してご利用頂けます。 - Amazon SageMaker Inferenceでスティッキーセッションによるルーティングが可能に
Amazon SageMaker Inferenceは、モデルをデプロイしてユーザからの推論リクエストをマネージドで処理できるようにする機能です。今回、リクエストのルーティング時にスティッキーセッションを利用できるようになりました。これを有効にすると、同じセッションの全てのリクエストが同じインスタンスにルーティングされます。機械学習アプリケーションは、そのセッションにおいて過去に処理した内容を再利用することで、レイテンシの短縮やユーザエクスペリエンスの向上に繋げることが可能です。 - Amazon SageMaker HyperPodがAmazon EKS上でのジョブ実行をサポート
Amazon SageMaker HyperPodは基盤モデルの学習インフラストラクチャの構築と最適化を容易にするサービスです。今回、SageMaker HyperPodを利用してKubernetesベースのワークロードの実行・管理が可能になりました。MLワークフローのオーケストレーションにKubernetesを利用している場合に便利な機能です。 - Container InsightsがEKSで稼働するSageMaker HyperPodノードの可視化に対応
Amazon CloudWatch Container Insightsを利用して、Amazon EKS(Elastic Kubernetes Service)
で稼働するSageMaker HyperPodのノードの情報を可視化できるようになりました。分散トレーニングではノード異常への対応が重要です。この機能を利用すると異常が発生したノードを特定し、迅速な対応が可能になります。
- Amazon Q Developer Agentの機能強化を発表