Amazon File Cache のよくある質問

全般

Amazon File Cache は AWS のフルマネージドの高速キャッシュで、簡単にファイルデータを処理でき、データの保存場所も問いません。

Amazon File Cache は、オンプレミスのファイルシステムのデータや、AWS のファイルシステムやオブジェクトストアのデータに対して、高性能の一時ストレージとして機能します。このサービスによって、分散データセットを統合された形で高速に AWS のファイルベースのアプリケーションに使用できるようになります。

キャッシュを複数の NFS ファイルシステム (オンプレミスとクラウド上のファイルシステムを含む) または Amazon Simple Storage Service (S3) バケットにリンクし、オンプレミスと複数の AWS リージョンにまたがって、統合された形でデータに高速アクセスできます。キャッシュでは、読み取りと書き込みのデータアクセスができ、1 ミリ秒未満のレイテンシー、最大数百 GB/s のスループット、最大数百万回の IOPS で AWS のワークロードを計算できます。

Amazon File Cache によって、データがどこにあっても、AWS のコンピューティングリソースの俊敏性、パフォーマンス、コスト効率をデータの処理に簡単に活用できるようになります。

Amazon File Cache を使用すると、データがコンピューティングリソースと同じ AWS リージョンにないときや複数の場所にまたがっている場合に、ビジュアルエフェクト (VFX) レンダリング、チップ設計シミュレーション、ゲノム解析などの計算量の多いワークロードを AWS で実行できます。

また、Amazon File Cache を使用すると、ファイルインターフェイスを使用して Amazon S3 データに高速で低レイテンシーのアクセスが必要な場合に Amazon S3 データセットを処理することもできます。Amazon File Cache は、Amazon FSx for Open ZFS と Amazon FSx for NetApp ONTAP の NFS v3 データセットもサポートしています。

キャッシュは、AWS マネジメントコンソール、AWS コマンドラインインターフェイス (CLI)、または AWS API (およびさまざまな言語専用の SDK) で作成できます。キャッシュは、数分以内に実行が開始されて、コンピューティングインスタンスがアクセスできるようになります。詳細については、「getting started with Amazon File Cache」を参照してください。 

キャッシュをマウントすると、NFS ファイルシステムまたは Amazon S3 バケットのデータがディレクトリとファイルリストとして表示されます。ストレージの消費を最小化するために、ファイルとオブジェクトの内容は、ファイルまたはオブジェクトがキャッシュ内で最初にアクセスされるまでインポートされません。

Amazon File Cache は、Amazon Linux, Amazon Linux 2、、RHEL、CentOS、SUSE Linux、Ubuntu など、ほとんどのよく使われる Linux ベースの AMI で使用できます。また、このサービスは、x86 ベースの Amazon Elastic Compute Cloud (EC2) インスタンス、AWS Graviton2 プロセッサを搭載した ARM ベースの Amazon EC2 インスタンス、Amazon Elastic Container Service (ECS)、および Amazon Elastic Kubernetes Service (EKS) コンテナインスタンスとも互換性があります。Amazon File Cache を利用すると、1 つのキャッシュに接続されるインスタンスタイプと Linux AMI を混在させたり、組み合わせたりできます。

Linux インスタンスからキャッシュにアクセスするには、まずオープンソースの Lustre クライアントをインストールします。インストールしたら、標準的な Linux コマンドを使用してキャッシュをマウントできます。マウントが完了すると、ローカルファイルシステムと同じように、キャッシュでファイルやディレクトリを操作できるようになります。詳細については、File Cache のドキュメントを参照してください。

AWS Lustre クライアントリポジトリには、Amazon Linux、Amazon Linux 2、Red Hat Enterprise Linux (RHEL)、CentOS、および Ubuntu オペレーティングシステムと互換性があるクライアントモジュールが用意されています。詳細については、Amazon File Cache のドキュメントを参照してください。

Amazon File Cache はフルマネージドサービスです。そのため、ファイルストレージインフラストラクチャの管理は自動的に行われます。Amazon File Cache を使用すると、複雑なキャッシュインフラストラクチャをデプロイし、維持するというコストと煩わしさがなくなります。

キャッシュは、AWS マネジメントコンソール、AWS CLI、および AWS API (およびさまざまな言語専用の SDK) を通じて管理できます。コンソール、API、SDK を使用すると、キャッシュの作成と削除、キャッシュタグの作成と編集、キャッシュに関する詳細情報の表示ができます。

はい、キャッシュからのデータとデータリポジトリ (NFS ファイルシステム/Amazon S3 バケット) からのデータに両方同時にアクセスできます。

オンプレミスのファイルサーバーを Amazon File Cache にリンクするには、オンプレミスサーバーが NFSv3 プロトコルをサポートしている必要があります。オンプレミスのデータソースに Amazon File Cache を使用する前に、AWS Direct Connect または仮想プライベートネットワーク (VPN) の接続をオンプレミスネットワークと、ファイルキャッシュが格納されている Amazon 仮想プライベートネットワーク (VPC) との間にセットアップし、トラフィックがキャッシュと、VPC セキュリティグループ、オンプレミスファイアウォール、および NFSv3 ファイルサーバー内のオンプレミスファイルサーバーとの間を通過できるようにする必要があります。

Amazon File Cache には、データリポジトリからキャッシュにデータをインポートする際に 2 つのオプションがあります。遅延ロード (デフォルト) とプリロードです。遅延ロードでは最初のアクセス時にオンデマンドでデータをインポートし、プリロードではワークロードを開始する前にデータをインポートします。メタデータ (ファイル/オブジェクトの名前と属性) とデータ (ファイル/オブジェクトの内容) について、遅延ロードとプリロードの選択を指定できます。遅延ロードではメタデータとデータがキャッシュにインポートされるのを待たずにワークロードを開始できるので、ほとんどのワークロードには遅延ロードが適しています。プリロードは、最初のバイトのレイテンシーの影響が大きいアクセスパターンの場合に適しています。データをキャッシュにプリロードする際のベストプラクティスの詳細については、ドキュメントを参照してください。

キャッシュがリンクされた後にデータリポジトリに追加されたファイルは、自動的にキャッシュで利用可能になります。データリポジトリでファイルが変更され、そのファイルがキャッシュにロードされていない場合、変更されたバージョンは遅延ロードによってキャッシュにインポートされます。キャッシュに既にロードされているファイルは、データリポジトリでファイルが更新されても、自動的に更新されません。

はい。Amazon File Cache では、ファイルシステムコマンドを使用して、新規または変更されたファイルをリンクされたデータリポジトリにエクスポートして戻すことができます (詳細については、「Exporting changes to the data repository」をご覧ください)。リンクされたデータリポジトリまたはキャッシュのどちらかのファイルを変更することができ、それぞれが受け取った順番に更新を持続します。リンクされたデータリポジトリとキャッシュの両方で同じファイルを修正する場合、競合を防ぐために、アプリケーションレベルで更新を調整する必要があります。Amazon File Cache は、複数の場所で競合する書き込みを防止することはできません。

Amazon File Cache は Amazon CloudWatch を統合しており、キャッシュの健全性とパフォーマンスのメトリクスをリアルタイムでモニタリングできます。メトリクスの例としては、消費されたストレージ、スループット、1秒あたりのファイル操作数などがあります。AWS CloudTrail を使用して、Amazon File Cache API コールをログに記録できます。

Amazon File Cache サービスがどのリージョンで利用できるかの詳細については、「AWS サービス (リージョン別)」を参照してください。

スケールとパフォーマンス

ファイルがキャッシュされると、ファイルはコンピューティングインスタンスまたはコンテナにキャッシュから直接引き出されます。レイテンシーは一貫してミリ秒未満、スループットは最大数百 Gbps、IOPS は最大数百万回です。キャッシュのベースラインのスループットキャパシティは、キャッシュストレージ 1 TiB あたり 1,000 MB/s です。要求されたデータがキャッシュされていない場合は、最大でベースラインのスループットキャパシティのスピードで、リンクされたデータリポジトリからキャッシュにデータがコピーされます。

キャッシュのスループットキャパシティは、キャッシュにアクセスするクライアントと、キャッシュとデータリポジトリの間のデータ移動で分け合います。例えば、スループットが 4.8 GB/s の 4.8 TiB キャッシュは、10 Gbps (1.25 GB/s) の接続でオンプレミスのファイルサーバーからファイルをロードしながら、同時にクライアントからの 3.55 GB/s の I/O をサポートできます。

Amazon File Cache でオンプレミスファイルサーバーからファイルがコピーされるレートは、AWS Direct Connect/VPN リンクの帯域幅と往復レイテンシー、およびオンプレミスサーバーでサポートされているスループットにも依存します。パフォーマンスを最適化するには、AWS Direct Connect をお勧めします。

詳細については、Amazon File Cache のパフォーマンスに関するドキュメントを参照してください。

1 つのキャッシュには、数千のコンピューティングインスタンスが同時にアクセスできます。

キャッシュは、1.2 TiB のサイズまたは 2.4 TiB の増分で作成できます。キャッシュストレージに加えて、キャッシュごとに 2.4 TiB のメタデータストレージキャパシティも必要です。

キャッシュにはアカウントにつき 100 という上限がありますが、リクエストによって増やすことができます。

セキュリティと可用性

Amazon File Cache では、保管中および転送中のデータは暗号化されます。

AWS Key Management Service (KMS) で管理されているキーを使用して、保管中のデータは常に暗号化されます。サービス独自のキーかユーザー独自のキーのいずれかを使用できます。

Amazon File Cache では、選択された Amazon EC2 クライアントインスタンスタイプからキャッシュがアクセスされたとき、転送中のデータは自動的に暗号化されます。Amazon File Cache では、キャッシュと S3 データリポジトリの間のトラフィックは HTTPS (TLS) を使用して暗号化されます。

オンプレミスファイルサーバーと Amazon File Cache の間の転送中の暗号化では、VPN を使用して VPC とオンプレミスネットワークの間のデータ転送が必ず暗号化されるようにできます。また、Message Authentication Code (MAC) Security (MACsec) を使用して、貴社のデータセンターから AWS Direct Connect の場所へのデータを暗号化することもできます。

Amazon File Cache リソースはすべて、AWS アカウントの所有となります。リソースを作成する許可やリソースにアクセスする許可はアクセス許可ポリシーによって制御されます。キャッシュがアクセス可能になっている VPC を指定し、VPC セキュリティグループを使用してキャッシュにアクセスできるリソースをコントロールします。AWS Identity and Access Management (IAM) を使用して、キャッシュリソースを管理 (作成や削除など) できるユーザーをコントロールします。

はい、Amazon File Cache では、VPC を共有している所有者アカウントと参加者アカウントの両方から、共有 Amazon VPC 内にキャッシュを作成して使用することができます。VPC 共有により、作成および管理を要する VPC 数は削減されます。一方、請求やアクセスコントロールには、これまでどおり別々のアカウントを利用できます。

Amazon File Cache では、データをキャッシュするために並列ファイルシステムを使用しています。並列ファイルシステムでは、データは複数のネットワークファイルサーバーに保存されて、パフォーマンスが最大化され、ボトルネックが減少します。そして各サーバーには複数のディスクがあります。大きいキャッシュには、小さいキャッシュよりも多くのファイルサーバーとディスクがあります。ファイルサーバーが使用不可能になった場合、数分以内に自動的に置き換えられます。その間、そのサーバー上のデータへのクライアントのリクエストは透過的に再試行され、ファイルサーバーが置き換えられた後、最終的に成功します。データはディスクにレプリケートされ、障害が発生したディスクは自動的かつ透過的にバックグラウンドで交換されます。

はい。Amazon File Cache SLA では、ある請求期間において、月間稼働率がサービスコミットメントを下回った場合にサービスクレジットを提供するよう定められています。

料金と請求

支払いは実際に使用したリソースに対してのみ発生します。詳細については、Amazon File Cache の料金ページを参照してください。