Amazon Web Services ブログ

Category: Intermediate (200)

AWS Snowball Edge を使用して HDFS ファイルを Amazon S3 データレイクに移行する

 データのソースが増えると、新しく接続されたデータを保存する必要性が高まります。企業のお客様は、オンプレミス Hadoop アプリケーションのデータレイクストレージリポジトリとして Hadoop 分散ファイルシステム (HDFS) を使用しています。お客様は、より安全で、スケーラブルで、アジャイルで、費用対効果の高いソリューションを求めて、データレイクを AWS に移行しています。 AWS への高速転送速度が妥当ではない HDFS 移行には、AWS は AWS Snowball Edge サービスを提供しています。AWS Snowball Edge を使用した HDFS 移行のベストプラクティスは、ファイル転送に中間ステージングマシンを使用することです。このブログ記事では、移行中に中間ステージングマシンを使用する方法を詳しく説明します。 AWS Snowball Edge がお客様に出荷するのは、物理的なデータ移行およびエッジコンピューティングデバイスです (図 1)。デバイスは大量のデータを Amazon Simple Storage Service (Amazon S3) に転送するために使用します。 Amazon S3 は、業界をリードするスケーラビリティ、データの可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。バルク取り込みの場合、データレイクのエントリポイントが Amazon S3 です。99.999999999% (9 が 11 個) の耐久性を持つオブジェクトストアである Amazon S3 は、10,000 データレイク以上をホストします。 AWS のデータレイクストレージの基盤として、Amazon S3 […]

Read More

EC2 インスタンス起動ウィザードから Amazon EFS ファイルシステムを自動でマウントするには

Amazon Elastic File System (EFS) を他の AWS のサービスで使用するベストプラクティスや統合について過去に投稿したところすばらしいフィードバックが寄せられており、さらなる投稿へのご要望をいただいています。そこで今回は、Amazon EFS ファイルシステムを EC2 インスタンス起動ウィザードから直接 EC2 インスタンスにマウントする流れを単純化、自動化する方法についてご説明します。ぜひ、先月の EFS を用いた Amazon Sagemaker でのモデルトレーニングの加速と単純化や Amazon Elastic Container Service (ECS)、Elastic Kubernetes Service (EKS) でのコンテナストレージ用 EFS 使用方法に関するベストプラクティスと併せて、皆様の EFS クックブックに加えていただけたらと思います。 Amazon EFS は、AWS クラウドサービスとオンプレミスリソースで使用するための Linux ベースのワークロードに対し、単純でスケーラブルかつ伸縮自在な NFS ファイルシステムを、わずか 0.08 USD/GB-月* の実効料金で提供します。EFS ファイルシステムのマウントとファイルデータの共有は何千という数の EC2 インスタンスで行うことができます。このたび、EC2 インスタンス起動ウィザードを使い、Amazon EC2 インスタンスを構成して Amazon EFS ファイルシステムをマウント可能になりました。これにより、EC2 インスタンスを構成し、起動時に推奨されるマウントオプションで EFS ファイルシステムをマウントするプロセスが単純になります。ここからは、EC2 […]

Read More