re:Invent 2018 / Andy Jassy Keynote / AWS Inferentia

みなさん、こんにちは。アマゾンウェブサービスジャパン、プロダクトマーケティング

エバンジェリストの亀田です。

AWS Inferentia がアナウンスされました。

AWS Inferentia

低コストで高性能を実現するように設計された機械学習の推論チップです。AWS Inferentは、TensorFlow、Apache MXNet、PyTorchディープラーニングフレームワーク、およびONNXフォーマットを使用するモデルをサポートし、アプリケーションの計算コストの90％を節約することができます。

AWS Inferentiaは、非常に低コストで高スループット、低遅延の推論性能を提供します。各チップは、複雑なモデルによる高速予測を可能にするために、数百のTOPS（1秒間のテラ操作）の推論スループットを提供します。パフォーマンスをさらに向上させるために、複数のAWS Inferentiaチップを一緒に使用して、何千ものスループットを向上させることができます。Amazon SageMaker、Amazon EC2、Amazon Elastic InferenceでAWS Inferentiaを使用できます。

2019年のサービス提供開始を予定しています。続報をお待ちください。

– プロダクトマーケティングエバンジェリスト亀田

Amazon Web Services ブログ

re:Invent 2018 / Andy Jassy Keynote / AWS Inferentia

AWS Inferentia

お役立ちリンク

フォローお願いいたします

学ぶ

リソース

デベロッパー

ヘルプ