投稿日: Aug 2, 2019
AWS Batch では本日より、ホストデバイスを AWS Batch ジョブに公開する機能のサポートを開始します。これには、AWS Batch の管理対象インスタンスのプロビジョニングとスケジューリングを使用した高性能な分散 HPC および機械学習のワークロードの実行を可能にする Elastic Fabric Adapter (EFA) が含まれます。
EFA は、AWS 上での大規模なノード間通信を高いレベルで必要とするようなアプリケーションの実行を可能にする、Amazon EC2 インスタンスのためのネットワークインターフェイスです。カスタムビルドのオペレーティングシステム (OS) バイパスハードウェアインターフェイスでは、これらのアプリケーションのスケーリングに不可欠な、インスタンス間通信のパフォーマンスを向上させます。EFA を使用すると、Message Passing Interface (MPI) を使用する高性能計算 (HPC) アプリケーションおよび NVIDIA Collective Communications Library (NCCL) を使用する Machine Learning (ML) アプリケーションを、数千の CPU や GPU にスケールできます。その結果、AWS クラウドのオンデマンドの伸縮自在性と柔軟性を備えたオンプレミスの HPC クラスターのアプリケーションパフォーマンスを実現できます。
AWS Batch は、インスタンスのプロビジョニングとジョブのスケジューリングを管理するクラウドネイティブスケジューラーです。AWS Batch は、ジョブの仕様に従って、適切なプレイスメントグループ、ネットワーキング設定、およびユーザー指定のファイルシステムを使用してインスタンスを自動的にプロビジョニングします。Batch は起動するインスタンスへの EFA 相互接続を自動的に設定します。このインスタンスはお客様により単一の API パラメータで指定されます。
EFA の使用方法と AWS Batch へのホストデバイスの公開方法の詳細については、ドキュメントを参照してください。