Amazon Web Services ブログ

Category: AWS Trainium

業界タスク特化型⼤規模⾔語モデルの開発 〜 野村総合研究所様へのインタビュー 〜

みなさん、こんにちは。アマゾン ウェブ サービス (AWS) ジャパン合同会社 AI / ML 事業開発チーム […]

Neuron Community

【開催報告】Neuron Community – Vol.2

2025年7月15日に開催された「Neuron Community – Vol.2」の様子をレポートします。このイベントは、「Neuron Community」の協力のもと開催しました。Neuron Community は、ユーザー間で AWS Trainium / AWS Inferentia エコシステムに関する情報や知見の共有を促進するための場として発足したものです。今回は、AWS Trainium / AWS Inferentia を実際に利用した経験を共有していただき、さらに Amazon EC2 Inf2 インスタンス上で推論サーバーを立ち上げるハンズオンを実施しました。

詳解: Amazon EKS 超大規模クラスター

本日、Amazon Elastic Kubernetes Service (Amazon EKS) は最大 10 万台のノードをサポートするクラスターの提供を発表しました。Amazon EC2 の新世代高速コンピューティングインスタンスタイプを活用することで、これは単一の Kubernetes クラスターで 160 万個の AWS Trainium チップまたは 80 万個の NVIDIA GPU を実現することを意味します。これにより、最先端のモデルトレーニング、ファインチューニング、エージェント推論などの超大規模人工知能 (AI) および機械学習 (ML) ワークロードが可能になります。

Amazon の生成 AI 搭載ショッピングアシスタント Rufus を、80,000 以上の AWS AI チップを活用して Prime Day 向けにスケーリング

Amazon Rufus は、生成AIを活用したショッピングアシスタントです。Amazon の商品情報やウェブ上の様々な情報を活用して回答を作成し、お客様のよりスマートなお買い物をサポートします。
この記事では、Rufus が Neuron SDK や Inferentia2、Trainium チップ、そして AWS の各種サービスを活用して、数十億のパラメータを持つ LLM を安定的にデプロイし、運用する方法をご紹介します。

Neuron Community

【開催報告】Neuron Community – Day One

2025年4月9日に開催された「Neuron Community – Day One」の様子をレポートします。このイベントは、2025年3月に立ち上げられた「Neuron Community」の協力のもと開催しました。Neuron Community は、ユーザー間で AWS Trainium / Inferentia エコシステムに関する情報や知見の共有を促進するための場として発足したものです。本イベントは、記念すべき第1回目ということで、Day Oneと名付けられています。