Amazon Web Services ブログ

週刊生成AI with AWS – 2024/10/21週

みなさん、こんにちは。AWS ソリューションアーキテクトの木村です。

今週の 10 月 31 日 (木) は AWS AI Day ですね!会場での参加はすでに満席ですが、全てのセッションがライブ配信でご視聴いただけます。生成 AI の実用化に興味がある皆様のご参加をお待ちしております。私自身もとても楽しみにしています。

多くのお申し込みをいただいている「AWSジャパン生成AI実用化推進プログラム」ですが、申込み締め切りは 11 月 22 日までです。こちらの方もよろしくお願いいたします。

それでは、10 月 21 日週の生成AI with AWS 界隈のニュースを見ていきましょう。

さまざまなニュース

サービスアップデート

    • Amazon Q Business の使用状況のインサイトを得るための新しい分析機能を提供
      Amazon Q Business が、分析ダッシュボードの提供と Amazon CloudWatch Logs との統合を開始しました。分析ダッシュボードは、Amazon Q Business と Amazon Q Apps の使用状況について、チャットを通じた可視化機能を提供します。また、ユーザーとのチャット会話とフィードバックの情報が、Amazon CloudWatch Logs、Amazon S3、Amazon Data Firehose に連携可能になりました。これらにより、管理者は Amazon Q Business の利用状況を監視、分析しやすくなりました。
    • Amazon Bedrock で、アップグレードされた Anthropic Claude 3.5 Sonnet モデルと Computer Use が利用可能に
      アップグレードされた Claude 3.5 Sonnet モデルが Amazon Bedrock で利用可能になりました。こちらのモデルは、前バージョンと比べて全面的に改善されており、特にコーディング分野で大幅な進歩を遂げています。前バージョンと同じコストでご利用いただけます。Computer Use は、Claude に対して、カーソルを動かす、ボタンをクリックするなど、人間がコンピューターを使用するのと同じ方法で指示を出すことができる機能です。こちらはパブリックベータ版の提供で、リスクの低いタスクから利用することが推奨されています。アップグレードされた Claude 3.5 Sonnet モデルは、オレゴンリージョンで利用可能です。詳細は、ローンチブログをご覧ください。
    • Amazon Bedrock カスタムモデルインポートが一般提供開始
      カスタマイズされたモデルをインポートしてデプロイする Amazon Bedrock カスタムモデルインポートが一般提供を開始しました。Meta Llama 3.2 や Mixtral 8x7B などのモデルアーキテクチャをサポートしています。サーバーレス環境にデプロイできるようになっており、モデルを実行するインフラを管理する必要なく、アクセスができるようになっています。Amazon Bedrock Agents、Knowledge Bases、Guardrails などのネイティブなツールと組み合わせることで生成 AI アプリケーション開発の加速が期待できます。バージニア北部とオレゴンリージョンにて利用可能です。
    • Bottlerocket にてNVIDIA GPU Time-slicing が利用可能に
      Bottlerocket とは、コンテナ用に設計された Linux ベースのオペレーティングシステムです。今回 Bottlerocket にて NVIDIA GPU Time-slicing が利用可能になりました。GPU Time-slicing によって単一の GPU 上で複数の AI/ML モデルを実行できるようになります。特にマルチテナントやリソース制約のある環境で、GPU 使用率を向上させ効果的にスケーリングすることができます。
    • AI/ML アプリケーションのスケーラビリティ向上のための EFA のアップデートを発表
      EFA (Elastic Fabric Adapter) は、AI/MLワークロードのスケーリングに重要な高帯域幅・低遅延ネットワークを提供する機能です。これまでの EFA は IP アドレスが割り当てられたことにより、AI/MLモデルトレーニングジョブの拡大に制限がありましたが、今回のアップデートにより IP アドレスが割り当てられず同制限が解決されるようになりました。EFA は追加コストなしでご利用いただけます。

著者について

Naoto Kimura

木村 直登(Naoto Kimura)

AWS Japan のソリューションアーキテクトとして、製造業のお客様に対しクラウド活用の技術支援を行なっています。最近は生成AI と毎日戯れており、特にコード生成に注目しています。好きなうどんは’かけ’です。