Amazon Web Services ブログ
Tag: AWS Inferentia
AWS Inferentia と AWS Trainium を用いた、AWS SageMaker JumpStart によるコスト最適化された Llama 2 モデルのファインチューニングとデプロイ
この記事は、Fine-tune and deploy Llama 2 models cost-effectiv […]
Amazon EC2 Inf1、Inf2 インスタンスにおける FastAPI と PyTorch モデルの AWS Inferentia 利用時の最適化
深層学習モデルを大規模にデプロイする際には、パフォーマンスとコストのメリットを最大化するために、基盤となるハー […]
ByteDance が AWS Inferentia の利用により、推論におけるレイテンシの削減とスループットの向上とともに、最大で60%のコスト削減を実現
この記事は、 “ByteDance saves up to 60% on inference co […]
Exafunction で AWS Inferentia による機械学習推論のベストプライス・パフォーマンスを実現
この記事は、 Exafunction supports AWS Inferentia to unlock be […]
独自設計チップ AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスで ML トレーニングを高速実行(実践編)
こんにちは!アマゾン ウェブ サービス ジャパン合同会社 アンナプルナラボの常世です。 2022 年 10 月 […]
【開催報告】「AWS 秋の Amazon EC2 Deep Dive 祭り 2022」セミナー
ソリューションアーキテクトの渡辺です。2022年10月13日に「AWS 秋の Amazon EC2 Deep […]
独自設計チップ AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスで ML トレーニングを高速実行(基礎編)
こんにちは!アマゾン ウェブ サービス ジャパン合同会社 アンナプルナラボの常世です。 アンナプルナラボって何 […]
AWS CDK で作る AWS Inferentia と Amazon ECS を利用した推論環境(Part 2)
目次 事前準備 AWS Inferentia の制約を考慮した スケールする Amazon ECS を設計する […]
AWS CDK で作る AWS Inferentia と Amazon ECS を利用した推論環境(Part 1)
目次 事前準備 AWS CDK で 検証用 Amazon EC2 Inf1 インスタンス を構築する アプリケ […]
InfoJobs (Adevinta) が AWS Inferentia と Amazon SageMaker で NLP モデル予測のパフォーマンスをどのように向上させたか
この記事は、Adevinta Spain 社の ML エンジニアである Juan Francisco Fern […]