Amazon Web Services ブログ

re:Invent 2018 / Andy Jassy Keynote / AWS Inferentia

みなさん、こんにちは。アマゾン ウェブ サービス ジャパン、プロダクトマーケティング

エバンジェリストの亀田です。

AWS Inferentia がアナウンスされました。

AWS Inferentia

 

 

低コストで高性能を実現するように設計された機械学習の推論チップです。AWS Inferentは、TensorFlow、Apache MXNet、PyTorchディープラーニングフレームワーク、およびONNXフォーマットを使用するモデルをサポートし、アプリケーションの計算コストの90%を節約することができます。

AWS Inferentiaは、非常に低コストで高スループット、低遅延の推論性能を提供します。各チップは、複雑なモデルによる高速予測を可能にするために、数百のTOPS(1秒間のテラ操作)の推論スループットを提供します。パフォーマンスをさらに向上させるために、複数のAWS Inferentiaチップを一緒に使用して、何千ものスループットを向上させることができます。Amazon SageMaker、Amazon EC2、Amazon Elastic InferenceでAWS Inferentiaを使用できます。

2019年のサービス提供開始を予定しています。続報をお待ちください。

– プロダクトマーケティング エバンジェリスト 亀田