AWS Inferentia を基盤とする Amazon EC2 Inf1 インスタンスの提供が米国東部 (オハイオ)、欧州 (フランクフルト、アイルランド) およびアジアパシフィック (シドニー、東京) リージョンで開始されました

投稿日: Aug 13, 2020

AWS は、Amazon EC2 Inf1 インスタンスが利用できるリージョンを米国東部 (オハイオ)、欧州 (フランクフルト、アイルランド) およびアジアパシフィック (シドニー、東京) リージョンに拡大しました。Inf1 インスタンスには、お客様にクラウドで最小の推論単価を提供し、ごく普通のデベロッパーが機械学習を大規模に使用する上でのハードルを下げるために Amazon が特別に設計した AWS Inferentia チップが搭載されています。

Inf1 インスタンスは、同等の GPU ベースのインスタンスと比較して、推論ごとに最大で 30% 高いスループット、および最大で 45% 低いコストを実現し、画像認識、自然言語処理、パーソナライゼーション、異常検知などのアプリケーションに最適です。デベロッパーは、TensorFlow、PyTorch、および MXNet といった人気の機械学習フレームワークと統合された AWS Neuron SDK を使って Inf1 インスタンスに機械学習モデルをデプロイできます。AWS Neuron SDK は、AWS Inferentia での推論パフォーマンスを最適化するためのコンパイラ、ランタイム、およびプロファイリングツールで構成されています。

追加リージョンでのローンチに伴い、Inf1 インスタンスは米国東部 (バージニア東部、オハイオ)、米国西部 (オレゴン)、欧州 (フランクフルト、アイルランド)、およびアジアパシフィック (シドニー、東京) の各 AWS リージョンでご利用いただけるようになりました。Inf1 インスタンスには、最大 16 個の Inferentia チップを搭載した 4 つのサイズがあり、最大 2,000 TOPS (Tera Operations per Second) のスループットと最大 100 Gbps のネットワーク帯域幅を提供します。これらは、オンデマンド、リザーブドインスタンス、スポットインスタンス、または Savings Plans の一部としてご購入いただけます。

最も簡単かつ迅速に Inf1 インスタンスの使用を開始する方法は、機械学習モデルの構築、トレーニング、およびデプロイメントのためのフルマネージドサービスである Amazon SageMaker を使用する方法です。独自の機械学習アプリケーション開発プラットフォームを管理したいというデベロッパーは、Neuron SDK が含まれる AWS Deep Learning AMI で Inf1 インスタンスを起動する、またはコンテナ化された ML アプリケーション向けの Amazon Elastic Kubernetes Service (EKS) もしくは Amazon Elastic Container Service (ECS) 経由で Inf1 インスタンスを使用することによって開始できます。

詳細については、Amazon EC2 Inf1 インスタンスページをご覧ください。

AWS Inferentia を基盤とする Amazon EC2 Inf1 インスタンスの提供が米国東部 (オハイオ)、欧州 (フランクフルト、アイルランド) およびアジアパシフィック (シドニー、東京) リージョンで開始されました

Internet Explorer のサポートの終了