Amazon Web Services ブログ

週刊生成AI with AWS – 2024/9/9週

みなさん、こんにちは。AWS ソリューションアーキテクトの小林です。

そういえば、builders.flashで最近公開された記事をご紹介するのを忘れていることに気づきました。9月も半ばになってしまいましたが、今回の週刊生成AI with AWSで取り上げることにします。

今回も盛りだくさんですね。お客様からの寄稿記事が増えているのはとても有り難いことだなと感じました。私自身もたくさんのお客様と、AWSを活用して生成AIの利活用に取り組むためのアプローチについて議論させていただくことがかなり増えてきましたので、ビッグウェーブを感じます。そんなお客様をご支援する「AWSジャパン生成AI実用化推進プログラム」も引き続き参加者募集中です。こちらのほうも、よろしくお願いいたします。

それでは、9 月 9 日週の生成AI with AWS界隈のニュースを見ていきましょう。

さまざまなニュース

サービスアップデート

    • Amazon Q Developer Agentの機能強化を発表
      Amazon Q Developer Agentに大幅なアップデートが行われ、コード記述に関するアシスタンス機能がより自律的に動作できるようになりました。これまでは開発者が、Amazon Q Developerが推奨するコード記述計画を確認し、その内容を承認する操作を行う必要がありました。今回のアップデートにより、より素早く自律的な問題の解決が可能になりました。
    • Amazon Bedrock Knowledge Basesがクロスリージョン推論に対応
      先日発表したAmazon Bedrockのクロスリージョン推論機能に続いて、Kowledge Basesでもクロスリージョン推論が可能になりました。トラフィックが急増した場合に、他のリージョンに転送して処理を行うことでサービスの継続性を維持することができます。クロスリージョン推論機能の利用は無料で、ユーザリクエストを受け付けたリージョン(転送元のリージョン)の単価に基づいて料金が発生します。
    • Amazon EC2 P5eインスタンスがリリースされ、EC2 Capacity Blocksを介した利用が可能に
      NVIDIAのH200 Tensor Core GPUを搭載したAmazon EC2 P5eインスタンスがリリースされました。H100を搭載したP5インスタンスと比較して1.7倍のGPUメモリと1.5倍のGPUメモリ帯域幅を備え、最も高い計算能力を要するワークロードに最適です。このインスタンスタイプは、インスタンスを予約できる仕組みのEC2 Capacity Blockを介してご利用頂けます。
    • Amazon SageMaker Inferenceでスティッキーセッションによるルーティングが可能に
      Amazon SageMaker Inferenceは、モデルをデプロイしてユーザからの推論リクエストをマネージドで処理できるようにする機能です。今回、リクエストのルーティング時にスティッキーセッションを利用できるようになりました。これを有効にすると、同じセッションの全てのリクエストが同じインスタンスにルーティングされます。機械学習アプリケーションは、そのセッションにおいて過去に処理した内容を再利用することで、レイテンシの短縮やユーザエクスペリエンスの向上に繋げることが可能です。
    • Amazon SageMaker HyperPodがAmazon EKS上でのジョブ実行をサポート
      Amazon SageMaker HyperPodは基盤モデルの学習インフラストラクチャの構築と最適化を容易にするサービスです。今回、SageMaker HyperPodを利用してKubernetesベースのワークロードの実行・管理が可能になりました。MLワークフローのオーケストレーションにKubernetesを利用している場合に便利な機能です。
    • Container InsightsがEKSで稼働するSageMaker HyperPodノードの可視化に対応
      Amazon CloudWatch Container Insightsを利用して、Amazon EKS(Elastic Kubernetes Service)
      で稼働するSageMaker HyperPodのノードの情報を可視化できるようになりました。分散トレーニングではノード異常への対応が重要です。この機能を利用すると異常が発生したノードを特定し、迅速な対応が可能になります。

著者について

Masato Kobayashi

小林 正人(Masato Kobayashi)

2013年からAWS Japanのソリューションアーキテクト(SA)として、お客様のクラウド活用を技術的な側面・ビジネス的な側面の双方から支援してきました。2024年からは特定のお客様を担当するチームを離れ、技術領域やサービスを担当するスペシャリストSAチームをリードする役割に変わりました。好きな温泉の泉質は、酸性-カルシウム-硫酸塩泉です。