S3 に関するよくある質問すべて

S3 全般についてのよくある質問

すべて開く

Amazon S3 は、任意の量のデータの保存と取得をどこからでも行えるように設計されたオブジェクトストレージです。S3 は、業界をリードする耐久性、可用性、パフォーマンス、セキュリティ、および事実上無制限のスケーラビリティを非常に低コストで提供する、シンプルなストレージサービスです。

Amazon S3 はシンプルなウェブサービスインターフェイスを提供しており、いつでも、どこからでも容量に関係なくデータを保存および取得できます。このサービスを利用すれば、クラウドネイティブなストレージを使用するアプリケーションを簡単に構築することができます。Amazon S3 は高度にスケーラブルで、お客様は使用したものに対して支払えばよいので、性能または信頼性を犠牲にせずに、アプリケーションを望むとおりに拡張することができます。また Amazon S3 は、高い柔軟性を持つようデザインされています。お客様が望むどのようなタイプ、分量のデータでも保存できます。同一のデータを何百万回でも読み込むことができますし、災害対策のための緊急用としてのみ使用することもできます。FTP を使ったシンプルなアプリケーションから、Amazon.com の小売用ウェブサイトなど、高度なウェブアプリケーションを開発することもできます。Amazon S3 を使えば、データの保存方法を考えるのに時間を費やす代わりに、イノベーションに専念できます。

Amazon S3 にサインアップするには、S3 コンソールにアクセスしてください。このサービスへのアクセスには Amazon Web Services のアカウントが必要です。アカウントをまだお持ちでない場合は、Amazon S3 サインアッププロセスを開始すると、アカウントを作成することができます。サインアップ後、Amazon S3 ドキュメントを参照し、S3 の開始方法の資料を閲覧し、リソースセンターの追加リソースを参照して、Amazon S3 の使用を開始してください。

Amazon S3 では、莫大な規模を誇る Amazon 独自のメリットを活用でき、初期費用やパフォーマンスの妥協は必要ありません。Amazon S3 を利用することで、低コストかつ簡単に、データへの迅速なアクセスを可能にし、データを常に利用可能にし、また、データのセキュリティを確保できます。

実質的にはどのようなフォーマットのどのような種類のデータでも格納できます。詳細については、Amazon Web Services 使用許諾契約をご覧ください。

Amazon S3 に格納可能なデータの総量とオブジェクトの数には制限はありません。個別の Amazon S3 オブジェクトのサイズは、最低 0 バイトから最大 5 TB までさまざまです。1 つの PUT にアップロード可能なオブジェクトの最大サイズは 5 GB です。100 MB を超えるオブジェクトの場合は、マルチパートアップロード機能を使うことをお考えください。

汎用バケットは Amazon S3 に保存されているオブジェクトのコンテナであり、バケットにはオブジェクトをいくつでも保存できます。汎用バケットは元の S3 バケットタイプであり、1 つの汎用バケットには、S3 Express One Zone を除くすべてのストレージクラスに保存されたオブジェクトを含めることができます。ほとんどのユースケースやアクセスパターンに推奨されます。

ディレクトリバケットは Amazon S3 に保存されているオブジェクトのコンテナであり、バケットにはオブジェクトをいくつでも保存できます。S3 ディレクトリバケットでは、S3 Express One Zone ストレージクラスに保存されたオブジェクトのみを許可します。これにより、1 つのアベイラビリティーゾーン内でのデータ処理が高速になります。低レイテンシーのユースケースで推奨されます。各 S3 ディレクトリバケットは、バケット内のディレクトリ数にかかわらず、1 秒あたり最大 200 万トランザクション (TPS) をサポートできます。

テーブルバケットは、Apache Iceberg 形式を使用してテーブルを格納するためのものです。Amazon S3 Tables を使用すると、わずか数ステップでテーブルバケットを作成し、テーブルレベルの権限を設定できます。S3 テーブルバケットは、特に分析と機械学習のワークロードに最適化されています。Apache Iceberg のサポートが組み込まれているため、Amazon Athena、Amazon Redshift、Apache Spark などの一般的なクエリエンジンを使用して S3 の表形式のデータをクエリできます。S3 テーブルバケットを使用して、毎日の購入取引、ストリーミングセンサーデータ、広告インプレッションなどの表形式のデータを Amazon S3 の Iceberg テーブルとして保存し、分析機能を使用してそのデータを操作します。

ベクトルバケットは、ベクトルの保存とクエリのために特別に構築されています。ベクトルバケット内では、S3 オブジェクト API ではなく、専用のベクトル API を使用してベクトルデータを書き込み、意味論的意味と類似性に基づいてクエリします。バケットや IAM ポリシーなど、Amazon S3 の既存のアクセスコントロールメカニズムを使用して、ベクトルデータへのアクセスを制御できます。ベクトルバケットへのすべての書き込みは強力な一貫性を備えているため、最後に追加されたベクトルにすぐにアクセスできます。時間が経過する中で、ベクトルの書き込み、更新、削除が行われると、S3 ベクトルバケットは、データセットがスケールおよび進化しても、保存されているベクトルデータを自動的に最適化し、最適な料金パフォーマンスを実現します。

バケットは Amazon S3 に保存されているオブジェクト、テーブルのコンテナであり、バケットにはオブジェクトをいくつでも保存できます。汎用バケットは元の S3 バケットタイプであり、1 つの汎用バケットには、S3 Express One Zone を除くすべてのストレージクラスに保存されたオブジェクトを含めることができます。ほとんどのユースケースとアクセスパターンに推奨されます。S3 ディレクトリバケットでは、S3 Express One Zone ストレージクラスに保存されたオブジェクトのみを許可します。これにより、1 つのアベイラビリティーゾーン内でのデータ処理が高速になります。低レイテンシーのユースケースで推奨されます。各 S3 ディレクトリバケットは、バケット内のディレクトリ数にかかわらず、1 秒あたり最大 200 万トランザクション (TPS) をサポートできます。 S3 テーブルバケットは、日々の購入取引、ストリーミングセンサーデータ、広告インプレッションなどの表形式のデータを S3 に保存するために設計されています。テーブルバケットを使用する場合、データはアイスバーグテーブルとして S3 に保存され、行レベルのトランザクション、クエリ可能なテーブルスナップショットなどの分析機能を使用してそのデータを操作できます。これらはすべて S3 によって管理されます。さらに、テーブルバケットは継続的にテーブルメンテナンスを実行し、データレイクがスケールしたり、進化したりしても、クエリの効率を継続的かつ自動的に最適化します。 S3 ベクトルバケットは、ベクトルの保存とクエリのために特別に構築されています。ベクトルバケット内では、専用のベクトル API を使用してベクトルデータを書き込み、意味論的意味と類似性に基づいてクエリします。バケットや IAM ポリシーなど、Amazon S3 の既存のアクセスコントロールメカニズムを使用して、ベクトルデータへのアクセスを制御できます。時間が経過する中で、ベクトルの書き込み、更新、削除が行われると、S3 ベクトルバケットは、データセットがスケールおよび進化しても、保存されているベクトルデータを自動的に最適化し、最適な料金パフォーマンスを実現します。

Amazon は、お客様のデータを保管し、データに関連する利用の追跡を行いますが、これは請求処理を行うためです。Amazon は、Amazon S3 のサービス提供とは無関係の目的でお客様のデータにアクセスすることはありません。ただし、法律によって求められる場合を除きます。詳細については、Amazon Web Services 使用許諾契約をご覧ください。

はい。Amazon 全体の組織は Amazon S3 をさまざまなプロジェクトで使用します。これらのプロジェクトの多くは、Amazon S3 を信頼できるデータストアとして使用しており、ビジネスに直結する作業のために活用しています。

Amazon S3 はシンプルなキーベースのオブジェクトストアです。データを格納する場合、後にデータを取得するために使用することのできる独特なオブジェクトキーを割り当てます。キーは任意の文字列にすることができます。また階層的属性を模して構築することができます。または、S3 オブジェクトタグを用いて、お使いのすべての S3 バケットやプレフィックスにわたってデータを編成できます。

Amazon S3 はシンプルで、標準ベースの REST ウェブサービスインターフェイスを提供します。これはどんなインターネット開発ツールキットでも動作するように設計されています。操作性は意図的に単純化されており、新しいディストリビューションプロトコルや機能レイヤーを追加することも簡単です。

Amazon S3 によって、高度にスケーラブルで可用性も高く、かつ高速で安価なデータストレージインフラストラクチャを利用できるようになります。このインフラストラクチャは、Amazon が使用しているウェブサイトのグローバルネットワークと同じものです。S3 Standard ストレージクラスは 99.99% のアベイラビリティー、S3 標準 – IA ストレージクラス、S3 Intelligent-Tiering ストレージクラスおよび S3 Glacier Instant Retrieval ストレージクラスは 99.9% のアベイラビリティー、S3 1 ゾーン – IA ストレージクラスは 99.5% のアベイラビリティー、S3 Glacier Flexible Retrieval および S3 Glacier Deep Archive クラスは 99.99% のアベイラビリティーおよび 99.9% の SLA に設計されています。これらすべてのストレージクラスは Amazon S3 サービスレベルアグリーメント (SLA) の適用対象です。

Amazon S3 はどのようなインターネットアプリケーションに対してもトラフィックを処理できるよう基礎から設計されています。従量制の料金設定と無制限の容量により、負荷上昇によってコストが変わることはなく、サービスが干渉を受けることもありません。Amazon S3 の莫大な規模により、負荷を均等に配分することができます。これによって個別のアプリケーションが、トラフィックのスパイクによる影響を受けることはありません。

はい。Amazon S3 SLA では、ある請求期間中において、月間アップタイムがサービスコミットメントを下回った場合にサービスクレジットを提供するよう定められています。

Amazon S3 は、パフォーマンスや可用性を変更することなく、アプリケーションのリージョンレベルの分離を犠牲にすることなく、追加コストなしで、強力なリードアフターライトの整合性を自動的に提供します。新しいオブジェクトの書き込みが成功した後、または既存のオブジェクトが上書きされた後、後続の読み取りリクエストはすぐにオブジェクトの最新バージョンを受け取ります。S3 はリスト操作にも強力な整合性を提供するため、書き込み後、変更を反映した状態でバケット内のオブジェクトのリスト化をすぐに実行できます。

書き込み後の読み取りと書き込みの一貫性が高いと、書き込み直後にオブジェクトを読み取る必要がある場合に役立ちます。例えば、オブジェクトの書き込み直後に読み取りと一覧表示を頻繁に行う場合などです。また、高性能コンピューティングワークロードは、オブジェクトが上書きされてから同時に何度も読み取られる場合に、強力なリードアフターライトの整合性により、すべての読み取りで最新の書き込みが確実に読み取られるという恩恵も受けることになります。これらのアプリケーションは、強力なリードアフターライトの整合性から自動的かつ即座にメリットを享受します。さらに、S3 の強力な整合性は、強力な整合性を提供するための追加のインフラストラクチャの必要性を排除することにより、コストを削減します。

AWS リージョン

すべて開く

Amazon S3 汎用バケットを作成するときに AWS リージョンを指定します。S3 Standard、S3 標準 – IA、S3 Intelligent-Tiering、S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive の各ストレージクラスでは、オブジェクトは少なくとも 3 つのアベイラビリティーゾーン (AZ) にまたがる複数のデバイスに自動的に保存されます。各 AZ はそれぞれ他の AZ から物理的に意味のある距離、つまり数キロメートル離れていますが、互いにすべて 100 km (60 マイル) 以内に配置されています。S3 1 ゾーン – IA ストレージクラスに保存されたオブジェクトは、お客様が選択した AWS リージョン内で、ひとつのアベイラビリティーゾーンで冗長的に保存されます。ディレクトリバケットを作成するときに、単一のアベイラビリティーゾーンまたは AWS 専用ローカルゾーンを指定します。ディレクトリバケット内のオブジェクトは、単一のアベイラビリティーゾーンまたは 1 つのローカルゾーンに重複して格納されます。専用ローカルゾーンに S3 ストレージクラスを使用する場合、オブジェクトは AWS リージョンに転送しない限り、専用ローカルゾーンに残ります。S3 on Outposts を使用する場合、AWS リージョンに転送するよう手動で選択しない限り、データは Outposts のオンプレミス環境に保存されます。AWS リージョン別の Amazon S3サービスの可用性の詳細については、AWS リージョン別サービス一覧をご覧ください。

セキュリティとコンプライアンスの要件に対応するために、指定された規制管轄区域内において、お客様専用の、物理的に分離されたインフラストラクチャ上で実行する必要がある機密データとアプリケーションがある場合は、AWS 専有ローカルゾーン用の S3 ストレージクラスを使用すべきです。たとえば、一部の規制では、公共部門、医療、石油・ガス、その他の規制の厳しい業界で一般的な規制、契約、または情報セキュリティ上の理由から、データを特定の国または州に保存する必要があります。AWS はお客様と協力して、規制要件を満たすために必要な強化されたセキュリティとガバナンス機能を備えるお客様独自のプライベートゾーンを設定します。

AWS リージョンは、AWS がデータセンターを集約している世界各地の物理的ロケーションです。リージョン内の論理データセンターの各グループは、アベイラビリティーゾーン (AZ) として知られています。各 AWS リージョンは、1 つの地理的エリアにある、最低 3 つの、それぞれが隔離され物理的にも分離された AZ によって構成されています。 1 つのデータセンターを 1 つのリージョンとして定義することが多い他のクラウドプロバイダーとは違い、全 AWS リージョンが採用するこのマルチ AZ デザインは、お客様にいくつかのメリットをご提供するものです。各 AZ には個別の電力源、冷却システム、そして物理的セキュリティが備わっており、これらは冗長的でレイテンシーが非常に低いネットワークを介し接続されています。

アベイラビリティーゾーン (AZ) とは、1 つの AWS リージョン内でそれぞれ切り離され、冗長的な電力源、ネットワーク、そして接続機能を備えている 1 つ以上のデータセンターのことです。AZ によって、単一のデータセンターでは実現できない高い可用性、耐障害性、および拡張性を備えた本番用のアプリケーションとデータベースの運用が実現されています。AWS リージョン内のすべての AZ は、AZ 間に高スループットかつ低レイテンシーのネットワーキングを提供する、完全に冗長性を持つ専用メトロファイバー上に構築された、高帯域幅、低レイテンシーのネットワーキングで相互接続されています。Amazon S3 Standard、S3 Standard-Infrequent Access、S3 Intelligent-Tiering、S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive ストレージクラスは、データを 3 つ以上の AZ 間でレプリケーションすることで、1 つの AZ が全て削除されないように保護されています。このことは AZ が 3 つ未満しか公には利用可能ではないリージョンでも同様です。これらのストレージクラスに保存されたオブジェクトはひとつの AWS リージョン中の全 AZ から利用可能です。
Amazon S3 1 ゾーン – IA ストレージクラスは、単一の AZ 内でデータをレプリケーションします。S3 One Zone-IA に保存されたデータは、地震、火災、洪水などの災害に起因するアベイラビリティーゾーンの物理的な消失に対して回復力がありません。

特定のアプリケーションに合わせて考慮すべきいくつかの要素があります。例えば、データアクセスのレイテンシーを減らすために、顧客、データセンター、またはその他の AWS リソースの近くのリージョンにデータを保存したいと考えるかもしれません。また、地理的な冗長性と災害対策の目的で、他のオペレーションから離れたリージョンにデータを保存することもできます。また、特定の法的要件や規制要件に対応したり、ストレージコストを削減したりできるリージョンも検討する必要があります。コストを節約するために、より低料金のリージョンを選択できます。S3 の料金に関する情報については、こちらの Amazon S3 の料金のページにアクセスしてください。

Amazon S3 は世界中の AWS リージョンで使え、お客様のロケーションにかかわらず Amazon S3 を使えます。ただ、どの AWS リージョンで Amazon S3 のデータを保存したいかを決めていただく必要があります。現在 S3 が利用可能な AWS リージョンのリストについては、AWS リージョン別サービス一覧をご覧ください。

請求

すべて開く

Amazon S3 では、実際に使用した分のみ料金が発生します。最低料金の設定はありません。AWS 料金見積りツールを使って、月間の請求額をお見積りいただけます。AWS は、コストが低ければ、料金は安くなります。Amazon S3 リージョンによって異なる料金もあります。請求料金はお客様の S3 バケットの場所に基づいています。コピーリクエストを通じて、Amazon S3 リージョン内でデータを転送した場合は、データ転送料金は請求されません。AWS リージョン間でコピーリクエストを通じて転送されるデータは、Amazon S3 料金ページで指定された料金で課金されます。同じリージョン内の Amazon EC2 (または任意の AWS のサービス) と Amazon S3 の間で転送されたデータ、例えば、米国東部 (バージニア北部) リージョン内で転送されたデータについては、データ転送料金が発生しません。ただし、異なるリージョンにある Amazon EC2 (または任意の AWS のサービス) と Amazon S3 の間、例えば、Amazon EC2 米国東部 (バージニア北部) と Amazon S3 米国西部 (北カリフォルニア) の間で転送されたデータについては、Amazon S3 の料金ページで指定される料金が課金されます。データ転送コストは、ソースバケット所有者に請求されます。S3 on Outposts の料金については、Outposts の料金ページにアクセスしてください。

Amazon S3 の利用を開始するためのセットアップ料金や契約はありません。月末に、その月の使用料金が自動的に請求されます。Amazon Web Services アカウントにログインし、コンソールプロファイルに関連付けられた [請求ダッシュボード] を選択すると、いつでも現在の請求期間の料金を表示することができます。AWS 無料利用枠*で、お客様には AWS GovCloud リージョンを除くすべてのリージョンで Amazon S3 の使用を無料で開始していただけます。AWS の新規お客様は、サインアップしていただくと、Amazon S3 Standard ストレージ 5 GB、20,000 Get リクエスト、2,000 Put リクエスト、(インターネット、他の AWS リージョン、または Amazon CloudFront への) データ送信 100 GB を毎月、1 年間ご利用いただけます。未使用分が翌月に繰り越されることはありません。Amazon S3 では、以下のタイプの利用料金を請求させていただきます。以下の計算は、AWS 無料利用枠が適用されていない場合を仮定していることにご注意ください。

AWS は、コストが低ければ、料金は安くなります。例えば、米国東部 (バージニア北部) リージョンのコストは、米国西部 (北カリフォルニア) リージョンのコストよりも低くなっています。

通常の Amazon S3 料金は、格納またはリクエストされるオブジェクトの各バージョンについて適用されます。例えば、バージョニングを利用した場合のストレージコストを説明するために、次のシナリオを見てみましょう (現在の月は 31 日間と仮定します): 1) 該当月の 1 日目: バケットに対して 4 GB (4,294,967,296 バイト) の PUT を実行します。
2) 月の 16 日目: 1 日目の最初の PUT と同じキーを使用して、同一のバケット内で、5 GB (5,368,709,120 バイト) の PUT を実行します。

上記のオペレーションのストレージ費用を分析する際、5 GB のオブジェクトが 15 日目に書き込まれた時、初日の 4 GB のオブジェクトが、バケットから削除されるわけではないことにご注意ください。そうではなく、4 GB のオブジェクトは古いバージョンとして保存され、5 GB のオブジェクトがお客様のバケット内で最も新しく書き込まれたオブジェクトのバージョンとなります。月末: 合計バイト-時間使用量
[4,294,967,296 バイト x 31 日間 x (24 時間/日)] + [5,368,709,120 バイト x 16 日間 x (24 時間/日)] = 5,257,039,970,304 バイト-時間。合計 GB-月への変換
5,257,039,970,304 バイト-時間 x (1 GB/1,073,741,824 バイト) x (1 か月 / 744 時間) = 6.581 GB-月コストは、Amazon S3 の料金ページに記載されているリージョンの現在の料金に基づいて計算されます。

AWS マネジメントコンソール経由でサービスにアクセスする場合は、通常の Amazon S3 料金が適用されます。パフォーマンスを最適化するために、AWS マネジメントコンソールが能動的にリクエストを実行する場合があります。また、いくつかのインタラクティブなオペレーションでは、サービスに対して複数のリクエストが発生します。

別の AWS アカウントでストレージにアクセスする場合は、通常の Amazon S3 料金が適用されます。また、バケットをリクエスタ支払いバケットとして設定することもできます。その場合、リクエスタは Amazon S3 データのリクエストとダウンロードの料金を支払うことになります。リクエスタ支払いバケットの設定の詳細については、Amazon S3 ドキュメントをご覧ください。

別途記載がない限り、表示される料金には付加価値税、売上税など、一切の税金等および関税は含まれません。日本の居住者であるお客様が AWS サービスをご利用になった場合には、料金とあわせて別途消費税をご請求させていただきます。AWS サービスに対する税金の詳細 »

AWS は、対象となるお客様が、以下のプロセスに従ってすべてのデータを AWS の外部に移動する場合、インターネットへの無料データ転送 (OUT) を提供しています。

次のステップを完了してください: 1) 専任の AWS アカウントチームがある場合は、まずそのチームに連絡して計画を伝えてください。AWS と交渉して契約を結んでいる場合は、AWS アカウントチームと選択肢について話し合うことをお勧めします。2) このページに記載されている基準と手続きを確認してください。3) AWS カスタマーサポートに連絡し、リクエストが「AWS の外部に移動するための無料データ転送」についてのものであることを明記してください。” AWS カスタマーサポートは、データ移動の計画を確認し、無料データ転送 (OUT) の要件を満たしているかどうかを評価して、適切なクレジット額を計算できるように、情報の提供を求めます。4) AWS カスタマーサポートがお客様の移行を承認した場合、お客様には AWS の計算時点で AWS サービス全体に保存したすべてのデータ量に基づいて、データ転送費用の一時的なクレジットが支給されます。承認された場合は AWS カスタマーサポートから通知が届き、60 日以内に AWS からの移行を完了してください。クレジットはデータ転送使用量にのみカウントされ、他のサービスの使用には適用されません。AWS サービスから移行後、60 日以内に、残っているすべてのデータとワークロードを AWS アカウントから削除する必要があります。または、AWS アカウントを閉鎖することもできます。IT プロバイダーの移行における無料データ転送には、次の条件も適用されます: a) アクティブであり、かつ、利用状況に問題のない AWS アカウントをお持ちのお客様のみが、無料のデータ転送 (OUT) の対象となります。b) AWS アカウントに保存されているデータが 100 GB 未満の場合、AWS の既存の月間 100 GB のデータ転送 (OUT) 無料利用枠に基づいて、このデータを AWS から無料で移動できます。AWS アカウントに保存されているデータが 100 GB 未満のお客様は、追加クレジットの対象になりません。c) AWS は、お客様が AWS からすべてのデータを移行する場合、インターネットへのデータ転送 (OUT) を無料で提供します。1 つのサービスの使用量全体のみを移行するが、すべてを移行しない場合は、AWS カスタマーサポートまでお問い合わせください。d) 計画が変更された場合、または 60 日以内に AWS からの移行を完了できない場合は、AWS カスタマーサポートに通知する必要があります。e) AWS サービスの利用についての標準サービス料金は含まれていません。クレジットの対象となるのは、お客様の AWS からの移行を支援するデータ転送料金のみです。ただし、Amazon CloudFront、AWS Direct Connect、AWS Snowball、AWS Global Accelerator などの専用のデータ転送サービスからのデータ転送 (OUT) は含まれていません。f) AWS は、これらの要件への準拠を検証するために、お客様のサービス利用状況を確認する場合があります。お客様のデータ転送 (OUT) の使用が AWS からの移行以外の目的であると AWS が判断した場合、クレジットされていたデータ転送 (OUT) について料金を請求する場合があります。g) AWS は、インターネットへの無料データ転送 (OUT) に関して、いつでも変更することができるものとします。

AWS のお客様は毎日何億件ものデータ転送を行っていますが、当社は通常、そのデータ転送の理由はわかりません。たとえば、顧客は、バックアップの目的でアプリケーションのエンドユーザー、Web サイトの訪問者、または別のクラウド環境やオンプレミス環境にデータを転送する場合があります。したがって、お客様のデータ転送が、AWS の外部への移行をサポートするためのものである旨を当社が知る唯一の方法は、お客様から事前に通知していただくことです。

S3 Tables

すべて開く

Amazon S3 Tables は、分析ワークロードに特化して最適化された S3 ストレージを提供し、コストを削減しつつ、クエリパフォーマンスを改善します。Amazon SageMaker Lakehouse との S3 Tables 統合により、Amazon Athena、Redshift、EMR などの使い慣れた AWS サービスを利用して、Iceberg の高度な分析機能にアクセスし、データをクエリできます。さらに、Apache Spark、Apache Flink、Trino、DuckDB、PyIceberg などの Iceberg REST 互換のサードパーティーアプリケーションを使用して、S3 Tables にデータを読み書きすることもできます。テーブルバケットを使用すると、日々の購入取引、ストリーミングセンサーデータ、広告インプレッションなどの表形式データを Amazon S3 の Iceberg テーブルとして保存し、行レベルのトランザクション、クエリ可能なテーブルスナップショットなどの分析機能を使用してそのデータを利用できます。これらはすべて、Amazon S3 によって管理されます。さらに、テーブルバケットは継続的にテーブルメンテナンスを実行し、データレイクがスケールしたり、進化したりしても、時間が経過する中でクエリの効率を自動的に最適化します。

Amazon S3 に表形式のデータを保存するシンプルでパフォーマンスが高く費用対効果の高い方法としては、S3 Tables を使用する必要があります。S3 Tables では、構造化データをテーブルに整理し、標準の SQL ステートメントを使用してそのデータをクエリできます。設定はほとんど必要ありません。さらに、S3 Tables は S3 自体と同じ耐久性、可用性、スケーラビリティ、パフォーマンス特性を提供し、ストレージを自動的に最適化してクエリのパフォーマンスを最大化し、コストを最小限に抑えます。

S3 Tables は、構造化データを Apache Parquet、Avro、または ORC 形式で保存するための専用の S3 ストレージを提供します。テーブルバケット内では、テーブルをファーストクラスのリソースとして直接 S3 に作成できます。これらのテーブルは、ID ベースまたはリソースベースのポリシーで定義されたテーブルレベルの許可で保護でき、Apache Iceberg 標準をサポートするアプリケーションまたはツールによってアクセスできます。テーブルバケットにテーブルを作成すると、S3 内の基盤となるデータは Parquet、Avro、または ORC ファイルとして保存されます。次に、S3 は Apache Iceberg 標準を使用して、そのデータをアプリケーションでクエリできるようにするために必要なメタデータを保存します。S3 Tables には、テーブルバケット内のテーブルの Iceberg メタデータを操作および更新するためにクエリエンジンによって使用されるクライアントライブラリが含まれています。このライブラリは、テーブルオペレーション用の更新された S3 API と連携して、複数のクライアントが安全に、データをテーブルに読み書きできるようにします。時間が経過する中で、S3 は、オブジェクトを書き換える (あるいは「圧縮」する) ことによって、基盤となる、Parquet、Avro、または ORC データを自動的に最適化します。圧縮により、S3 上のデータが最適化され、クエリのパフォーマンスが改善することができます。

S3 Tables は、S3 外部のインフラストラクチャを立ち上げなくても、ほんの数ステップで使い始めることができます。まず、S3 コンソールでテーブルバケットを作成します。コンソールを通じて最初のテーブルバケットを作成すると、AWS 分析サービスとの統合が自動的に行われ、S3 はアカウントとリージョン内のすべてのテーブルバケットとテーブルを AWS Glue データカタログに自動的に入力できるようになります。この後、Amazon Athena、EMR、Redshift などの AWS クエリエンジンから S3 Tables にアクセスできるようになります。次に、S3 コンソールから Amazon Athena を使用してテーブルを作成するためにクリックできます。Athena にアクセスすると、新しいテーブルへの入力とクエリをすぐに開始できます。

あるいは、AWS Glue データカタログを通じて Iceberg REST カタログエンドポイントを使用して S3 Tables にアクセスすることもできます。これにより、すべてのテーブルリソースを含むデータ資産全体を検出できます。また、個々のテーブルバケットエンドポイントに直接接続して、そのバケット内のすべての S3 Tables リソースを検出することもできます。これにより、Apache Iceberg REST カタログ仕様をサポートする任意のアプリケーションまたはクエリエンジンで S3 Tables を使用できるようになります。

S3 の CreateTable API を使用してテーブルバケットにテーブルを作成できます。または、クエリエンジンを使用してテーブルを作成することもできます。S3 の DeleteTable API を使用して、テーブルバケットからテーブルを削除できます。または、クエリエンジンを使用してテーブルを削除することもできます。これを行うと、クエリエンジンからテーブルにアクセスできなくなります。

S3 Tables は Apache Iceberg 標準をサポートしており、Amazon Athena、Amazon Redshift、Apache Spark などのクエリエンジンを使用して Iceberg テーブルをクエリするために使用でき、標準 SQL を使用してテーブルバケット内のテーブルをクエリするために使用できます。

Iceberg テーブルを汎用 Amazon S3 バケットに保存する場合と比較して、クエリパフォーマンスは最大 3 倍速く、1 秒あたりのトランザクション数 (TPS) は最大 10 倍高くなることが期待できます。これは、テーブルバケットがテーブルの基になる Parquet、Avro、または ORC データを自動的に圧縮してクエリのパフォーマンスを最適化し、専用ストレージがデフォルトで最大 10 倍の TPS をサポートするためです。

いいえ。テーブルの整合性が誤って損なわれたり、ダウンストリームのアプリケーションが壊れたりするのを防ぐため、テーブルバケットでは手動でオブジェクトを上書きしたり削除したりすることはできません。テーブルバケットは、Iceberg テーブルへのアクセスと更新に必要な S3 API のサブセットのみをサポートします。代わりに、テーブルで未参照ファイルの削除とスナップショットの有効期限を設定してデータを削除できます。

テーブルバケットでは、リソースポリシーをバケット全体または個々のテーブルに適用できます。テーブルバケットポリシーは、PutTablePolicy と PutTableBucketPolicy API を使用して適用できます。テーブルレベルのポリシーを使用すると、個々の Parquet、Avro、または ORC ファイルの物理的な場所を理解しなくても、関連する論理テーブルに基づいてテーブルバケット内のテーブルに対する許可を管理できます。さらに、S3 ブロックパブリックアクセスは常にテーブルバケットに適用されます。

はい。テーブルバケットは Iceberg のスナップショット機能を利用して、複数のライターが同時に存在する場合にテーブルの一貫性を保ちます。

テーブルバケットは、Parquet、Avro、または ORC データを含む Apache Iceberg テーブル形式をサポートしています。

テーブルバケットには、コンパクション、スナップショット管理、および非参照ファイルの削除という 3 つのメンテナンス操作があります。コンパクションは、クエリのパフォーマンスを向上させるために、小さなオブジェクトを定期的により少ない大きなオブジェクトに結合します。スナップショット管理は、スナップショット保持設定に従ってテーブルスナップショットを期限切れにし、削除します。非参照ファイルの削除では、参照されていないファイル削除ポリシーに従って、どのテーブルスナップショットからも参照されていないオブジェクトが削除され、ストレージコストが最適化されます。

はい。S3 Tables は AWS CloudTrail をサポートしています。汎用 S3 バケットの場合と同様に、テーブルバケットに CloudTrail データイベントと管理イベント CloudTrail を設定できます。テーブルバケットの CloudTrail ログには、テーブルとデータオブジェクトの両方の情報が含まれます。

はい。テーブルバケット内のデータはデフォルトでサーバー側の暗号化を使用して暗号化されるため、保管中のデータの基本的な保護を実現できます。セキュリティを強化するために、お客様独自の暗号化キーを使用して S3 Tables 内のデータを暗号化するオプションをご利用いただけます。これらのキーは、AWS Key Management Service (AWS KMS) を介してお客様の AWS アカウント内で作成および管理されます。KMS では、KMS キーの使用についての個別の許可があります。これにより、追加のコントロールレイヤーと、テーブルバケットに格納されているテーブルへの非承認アクセスに対する保護が追加されます。さらに、KMS は詳細な監査証跡を生成するため、お客様のキーを使用して誰がどのテーブルにいつアクセスしたのかを追跡できます。また、KMS は、PCI-DSS、HIPAA/HITECH、FedRAMP などの業界要件への準拠の取り組みをサポートするための追加のセキュリティコントロールも提供します。暗号化とキー管理に対するこの包括的なアプローチは、機密データを効果的に保護するために必要なセキュリティと柔軟性を提供します。

S3 Tables では、テーブルバケットに保存されているオブジェクトごとに、ストレージ、リクエスト、およびオブジェクトモニタリングの料金をお支払いいただきます。テーブルのメンテナンスには追加料金もかかります。料金の詳細については、S3 の料金ページをお読みください。

コンパクションは、小さなオブジェクトをより少ない大きなオブジェクトに結合して、Iceberg クエリのパフォーマンスを向上させます。Amazon S3 は、データアクセスパターンに最適なターゲットファイルサイズ、または指定した値に基づいてテーブルを圧縮します。圧縮されたファイルは、テーブルの最新のスナップショットとして書き込まれます。圧縮はすべての S3 Tables でデフォルトでサポートされており、デフォルトのターゲットファイルサイズは 512 MB です。PutTableMaintenanceConfiguration API を使用して、ターゲットファイルサイズを 64 MB から 512 MB に変更できます。

スナップショット管理では、スナップショット保持設定に従ってテーブルスナップショットの有効期限が切れ、削除されます。スナップショット管理は、最小スナップショット (デフォルトは 1) と最大スナップショット期間 (デフォルトでは 120 時間) に基づいて、テーブルのアクティブなスナップショットの数を決定します。スナップショットの有効期限が切れると、Amazon S3 はそのスナップショットによって一意に参照されるデータファイルとメタデータファイルの削除マーカーを作成し、それらのファイルを最新でないものとしてマークします。これらの最新でないファイルは、非参照ファイル削除ポリシーの NonCurrentDays プロパティで指定された日数が経過すると削除されます。PutTableMaintenanceConfiguration API を使用してスナップショットのデフォルト値を変更できます。スナップショット管理では、ブランチベースまたはタグベースのリテンションを含め、Iceberg metadata.json ファイルに設定したリテンション値はサポートされません。ブランチベースまたはタグベースのリテンションポリシーを設定したり、PutTableMaintenanceConfiguration API で設定した値よりも長いリテンションポリシーを metadata.json ファイルに設定したりすると、S3 Tables のスナップショット管理は無効になります。

未参照ファイルの削除は、どのテーブルスナップショットからも参照されていないすべてのオブジェクトを識別して削除します。非参照ファイル削除ポリシーの一部として、ExpireDays (デフォルトで 3 日) と NonCurrentDays (デフォルトでは 10 日) の 2 つのプロパティを設定できます。テーブルから参照されておらず、ExpireDays プロパティよりも古いオブジェクトについては、NonCurrentDays プロパティで指定された日数が経過すると、S3 はそのオブジェクトを完全に削除します。参照されていないファイルの削除は、テーブルバケットレベルで設定できます。スナップショット保持のデフォルト値は、PutTableBucketMaintenanceConfiguration API を使用して変更できます。

S3 Vectors

すべて開く

Amazon S3 の外部にインフラストラクチャをセットアップすることなく、4 つのシンプルなステップで S3 Vectors の使用を開始できます。まず、CreateVectorBucket API または S3 コンソールを通じて、特定の AWS リージョンにベクトルバケットを作成します。次に、ベクトルデータをベクトルバケットに整理するために、CreateIndex API または S3 コンソールを使用してベクトルインデックスを作成します。ベクトルインデックスを作成するときは、距離メトリクス (コサインまたはユークリッド) とベクトルの次元数 (最大 4092) を指定します。最も正確な結果を得るには、埋め込みモデルによって推奨される距離メトリクスを選択してください。3 番目に、PutVectors API を使用してベクトルインデックスにベクトルデータを追加します。オプションで、各ベクトルに key-value ペアとしてメタデータをアタッチし、クエリをフィルタリングできます。4 番目に、QueryVectors API を使用して類似性クエリを実行し、検索するベクトルと、最も類似する結果のうち、返される数を指定します。

ベクトルインデックスは、S3 コンソールまたは CreateIndex API を使用して作成できます。インデックス作成時に、ベクトルバケット、インデックス、距離メトリクス、ディメンションを指定し、さらに、類似性クエリ中にフィルタリングから除外するメタデータフィールドのリストをオプションで指定します。例えば、ベクトルに関連付けられたデータを純粋に参照用に保存する場合は、これらをフィルタリング不可のメタデータフィールドとして指定できます。作成時に、各インデックスには、一意の Amazon リソースネーム (ARN) が割り当てられます。その後、書き込みまたはクエリリクエストを実行する際、ベクトルバケット内のベクトルインデックスにそのリクエストを送信します。

PutVectors API を使用して、ベクトルインデックスにベクトルを追加できます。各ベクトルはキーで構成され、このキーによってベクトルインデックス内の各ベクトルが一意に識別されます (例: プログラムを使用して UUID を生成できます)。書き込みスループットを最大化するには、大きなバッチ (最大リクエストサイズまで) でベクトルを挿入することをお勧めします。さらに、メタデータ (例: 年、著者、ジャンル、場所) を key-value ペアとして各ベクトルにアタッチできます。メタデータを含めると、ベクトルインデックスの作成時にフィルタリング不可のメタデータとして指定しない限り、デフォルトではすべてのフィールドを類似性クエリにおけるフィルターとして使用できます。非構造化データの新しいベクトル埋め込みを生成するために、Amazon Bedrock の InvokeModel API を使用し、使用する埋め込みモデルのモデル ID を指定できます。

GetVectors API でベクトルキーを使用して、ベクトルとそれに関連付けられたメタデータを検索して返すことができます。

QueryVectors API を使用して類似性クエリを実行し、クエリベクトル、返される関連結果の数 (上位 k 個の近傍)、インデックス ARN を指定します。クエリベクトルを生成する際は、ベクトルインデックスに保存される初期ベクトルの生成に使用したのと同じ埋め込みモデルを使用すべきです。例えば、Amazon Bedrock で Amazon Titan Text Embeddings v2 を使用してドキュメントの埋め込みを生成する場合は、同じモデルを使用して質問をベクトルに変換することをお勧めします。さらに、クエリでメタデータフィルターを使用して、フィルターに一致するベクトルを検索できます。類似性クエリを実行すると、デフォルトではベクトルキーが返されます。オプションで、距離とメタデータをレスポンスに含めることができます。

S3 Vectors は、耐久性と可用性に優れたベクトルストレージを提供します。S3 Vectors に書き込まれたデータは、イレブンナインのデータ耐久性を実現するよう設計された S3 に保存されます。S3 Vectorsは 99.99% の可用性と 99.9% の可用性SLAを実現するように設計されています。

S3 Vectors は、1 秒未満のクエリレイテンシー時間を実現します。Amazon S3 の伸縮自在なスループットを使用して、数百万のベクトルの検索を処理し、頻度の低いクエリワークロードに最適です。

ベクトル埋め込みについて類似性クエリを実行する場合、埋め込みモデル、ベクトルデータセットのサイズ (ベクトルの数と次元)、クエリの分布など、いくつかの要因が平均リコールに影響を及ぼす可能性があります。S3 Vectors は、ほとんどのデータセットで 90% を超える平均リコールを実現します。平均リコールはクエリ結果の質を測定します。90% は、インデックスに保存されている、クエリベクトルに最も近いグラウンドトゥルースベクトルの 90% がレスポンスに含まれていることを意味します。ただし、実際のパフォーマンスは具体的なユースケースによって異なる場合があるため、代表的なデータとクエリを使用して独自のテストを実施し、S3 ベクトルインデックスがリコール要件を満たしていることを検証することをお勧めします。

ListVectors API を使用すると、ベクトルインデックス内のベクトルのリストを確認できます。この API は、一度に最大 1,000 個のベクトルを返します。レスポンスが切り詰められている場合は、そのインジケーターも表示されます。レスポンスには、最終変更日、ベクトルキー、ベクトルデータ、メタデータが含まれます。また、ListVectors API を使用すると、指定したベクトルインデックスからベクトルデータを簡単にエクスポートできます。ListVectors オペレーションは強力な一貫性を備えています。そのため、書き込み後、変更が反映されたベクトルをすぐにリスト表示できます。

S3 Vectors では、ストレージと、該当する書き込みおよび読み取りリクエスト (例: ベクトルの挿入、ベクトルインデックス内のベクトルに対するクエリオペレーションの実行) についての料金をお支払いいただきます。料金の詳細については、S3 の料金ページをご覧ください。

はい。Bedrock コンソールまたは API を通じて Bedrock ナレッジベースを作成する際に、既存の S3 Vectors インデックスをベクトルストアとして設定することで、RAG ユースケースのベクトルストレージコストを削減できます。Bedrock にベクトルインデックスの作成と管理を任せたい場合は、Bedrock コンソールのクイック作成ワークフローを使用してください。さらに、Amazon SageMaker Unified Studio で、新しい S3 ベクトルインデックスを RAG ワークフローのベクトルストアとして設定することもできます。

はい。S3 Vectors を Amazon OpenSearch Service で使用するには 2 つの方法があります。1 つ目の方法として、S3 をご利用のお客様は、S3 または OpenSearch コンソールのいずれかを使用して、新しいサーバーレスコレクションとして、すべてのベクトルを S3 ベクトルインデックスから OpenSearch Serverless にエクスポートできます。S3 Vectors を使用してネイティブに構築する場合、リアルタイムクエリが必要なワークロードのために OpenSearch Serverless を選択的に使用できるという恩恵を享受できます。2 つ目の方法として、マネージド OpenSearch をご利用のお客様は、1 秒未満のレイテンシーでクエリ可能なベクトルデータのエンジンとして S3 Vectors を選択できるようになりました。その後、OpenSearch は自動的に S3 Vectors をベクトルの基盤エンジンとして使用し、OpenSearch API を使用してベクトルデータを更新および検索できます。アプリケーションに変更を加えることなく、S3 Vectors のコストメリットを享受できます。

Amazon S3 と IPv6

すべて開く

インターネットに接続されているすべてのサーバーとデバイスには固有のアドレスが付いている必要があります。インターネットプロトコルバージョン 4 (IPv4) は、最初の 32 ビットのアドレス設定スキームでした。しかし、インターネットの継続的な成長は、利用可能なすべての IPv4 アドレスがやがて利用し尽くされてしまうことを意味します。インターネットプロトコルバージョン 6 (IPv6、Internet Protocol Version 6) は、IPv4 のグローバルアドレス制限を克服するために設計されたアドレス設定メカニズムです。

Amazon S3 で IPv6 を使用すると、IPv6 から IPv4 への変換ソフトウェアやシステムの必要なく、アプリケーションから Amazon S3 への接続が可能となります。より簡単にコンプライアンス要件を満たし、既存の IPv6 ベースのオンプレミスアプリケーションと統合させることができ、そしてアドレス変換を処理するための高価なネットワーク機器の必要性が排除されます。また、IPv6 アドレス設定の IAM ポリシーとバケットポリシーの既存のソースアドレスフィルタリング機能を利用して、Amazon S3 とインタラクションするアプリケーションをセキュアにするためのオプションを拡張できます。

まず、IPv4 と IPv6 の両方のアクセスをサポートする Amazon S3 の「デュアルスタック」エンドポイントにアプリケーションをポイントします。多くのネットワーククライアントではデフォルトで IPv6 が優先されるので、ほとんどの場合、IPv6 のアクセスに他の設定は必要ありません。 IPv6 を使用することで影響が出たアプリケーションは、いつでも標準の IPv4 のみのエンドポイントに切り替えることができます。Amazon S3 を使用した IPv6 は、AWS GovCloud (米国) リージョン、Sinnet が運営する Amazon Web Services 中国 (北京) リージョン、および NWCD が運営する Amazon Web Services 中国 (寧夏) リージョンを含むすべての商用 AWS リージョンでサポートされています。

いいえ。Amazon S3 では IPv4 と IPv6 のいずれを使用してもパフォーマンスは同じです。

S3 イベント通知

すべて開く

Amazon S3 イベント通知機能を使用すると、PUT、POST、COPY、DELETE イベントなど、S3 バケットで特定のイベントが発生したときに通知を受け取ることができます。通知は、Amazon EventBridge、Amazon SNS、Amazon SQS、または直接 AWS Lambda に発行することができます。

Amazon S3 イベント通知を使用すると、Amazon S3 に保存されているオブジェクトの変更に応答して、ワークフローの実行、アラートの送出、その他のアクションの実行が行えます。S3 イベント通知を使用すれば、メディアファイルがアップロードされたときのコード変換、データファイルが利用可能になったときのデータ処理、S3 オブジェクトのその他のデータストアへの同期といったアクションの実行をトリガーできます。オブジェクト名のプレフィックスおよびサフィックスに基づいてイベント通知を設定することも可能です。例えば、「images/」で始まるオブジェクト名のときに通知を受け取るよう選択できます。

Amazon S3 イベント通知メッセージに含まれる情報の詳細については、Amazon S3 イベント通知の設定に関するドキュメントをご覧ください。

イベント通知設定の詳細については、Amazon S3 イベント通知の設定に関するドキュメントをご覧ください。AWS メッセージングサービスの詳細については、Amazon SNS のドキュメントおよび Amazon SQS のドキュメントをご覧ください。

Amazon S3 を用いてイベント通知を行うための追加料金はありません。イベント通知を配信するための Amazon SNS または Amazon SQS の使用料金、または AWS Lambda 機能を実行するためのコストのみ必要です。これらのサービスの料金に関する詳細については、Amazon SNS、Amazon SQS、または AWS Lambda の料金のページをご覧ください。

Amazon S3 Transfer Acceleration

すべて開く

Amazon S3 Transfer Acceleration によって、クライアントと Amazon S3 バケットの長距離間でファイルを高速、簡単、安全に転送できます。S3 Transfer Acceleration では、世界中に散らばる Amazon CloudFront の AWS エッジロケーションが活用されます。データが AWS エッジロケーションに到着すると、最適化されたネットワークパスで Amazon S3 バケットに向かうようルーティングされます。

S3 Transfer Acceleration を使い始めるには、Amazon S3 コンソール、Amazon S3 API、または AWS CLI を用いて S3 バケットで S3 Transfer Acceleration を有効化してください。S3 Transfer Acceleration が有効にされた後、Amazon S3 の PUT および GET リクエストで、s3-accelerate エンドポイントのドメイン名を指定できます。データ転送を加速するには、データ転送アプリケーションで、次の 2 つのタイプのエンドポイントのいずれかを使用してバケットにアクセスする必要があります。"デュアルスタック" エンドポイントの場合は .s3-accelerate.amazonaws.com または .s3-accelerate.dualstack.amazonaws.com です。標準のデータ転送を利用する場合、通常のエンドポイントの使用を継続できます。バケットが S3 Transfer Acceleration をサポートすることについては、いくらかの制約があります。詳細については、Amazon S3 のドキュメントをご覧ください。

S3 Transfer Acceleration は帯域を十分に活用するのに役立ち、距離の長さがスループットに与える影響を最小化し、クライアントの場所にかかわらず Amazon S3 にデータを高速かつ安定して転送するように設計されています。高速化の程度は主に、利用できる帯域幅、転送元と転送先との距離、およびネットワークパスのパケット損失率に依存します。一般的には、転送元が転送先から遠いほど、利用できる帯域幅が大きいほど、オブジェクトサイズが大きいほど、大幅に高速化されます。あるお客様の計測では、米国、欧州、およびアジアの一部に散らばるグローバルユーザーベースからアジアパシフィック (シドニー) リージョンのバケットに 300 MB ファイルを取り込むときに、平均時間が 50% 短くなりました。別のお客様では、東南アジアおよびオーストラリアのユーザーが 250 MB のファイル (50 MB に分割) を米国東部 (バージニア北部) リージョンの S3 バケットにアップロードするときに、パフォーマンスが 500% 以上向上しました。S3 Transfer Acceleration 速度比較ツールにアクセスして、ご利用のロケーションから得られるパフォーマンス上の利点をプレビューしてください。

S3 Transfer Acceleration は、世界各地から S3 バケットへの転送速度を最適化するよう設計されています。地理的に分散した場所から中央のバケットにアップロードする場合、または大陸間で GB 単位、または TB 単位のデータを定期的に転送する場合、S3 Transfer Acceleration でデータ転送時間を数時間または数日短縮できる場合があります。

S3 Transfer Acceleration は、Amazon S3 の通常の転送と同じセキュリティを提供します。クライアントの IP アドレスによるアクセス制限のような Amazon S3 のセキュリティ機能すべてもサポートされています。S3 Transfer Acceleration はクライアントと標準 TCP を介して通信し、ファイアウォールの設定変更は不要です。AWS エッジロケーションにデータが保存されることはありません。

お客様が S3 Transfer Acceleration を使用してオブジェクトをアップロードするたびに、AWS では S3 Transfer Acceleration が、通常の Amazon S3 による転送よりも高速であるかどうかを確認します。S3 Transfer Acceleration が、同じ AWS リージョンへの同じオブジェクトの通常の Amazon S3 による転送よりも高速ではないと判断した場合は、その転送で使用する S3 Transfer Acceleration の料金を AWS が請求することはなく、S3 Transfer Acceleration システムをバイパスする可能性があります。

はい。S3 Transfer Acceleration では、マルチパートアップロードを含め、バケットレベルの機能がすべてサポートされています。

S3 Transfer Acceleration では、TCP プロトコルが最適化され、クライアントと S3 バケットの間にインテリジェンスが追加されるため、スループットを大きくしたい場合には S3 Transfer Acceleration がより適しています。1 GB 未満のオブジェクト、またはデータセットのサイズが 1 GB 未満の場合には、パフォーマンス最適化のために Amazon CloudFront の PUT/POST コマンドの使用を検討することをお勧めします。

AWS Direct Connect は、プライベートネットワークを必要とするお客様や、AWS Direct Connect でのやり取りにアクセス可能なお客様にとって優れた選択肢です。S3 Transfer Acceleration は、地理的に分散したクライアントがパブリックインターネットを介してデータを送信する場合、またはネットワークの状況が変化しやすくスループットの劣ったところからデータを送信する場合に最適です。AWS Direct Connect を利用するお客様の中には、S3 Transfer Acceleration を、インターネットパフォーマンスが低いリモートオフィスへの転送のサポートに使用しているケースもあります。

サードパーティーのゲートウェイでバケットのターゲットを設定して、S3 Transfer Acceleration エンドポイントドメインを使用すると、利点が得られます。
AWS 実装の詳細については、この Storage Gateway のよくある質問のファイルセクションにアクセスしてください。

はい。Amazon S3 に直接接続するソフトウェアパッケージがそのジョブを Amazon S3 に送信するときは、S3 Transfer Acceleration が役に立ちます。ストレージパートナーソリューションの詳細 »

はい。AWS は、S3 Transfer Acceleration を HIPAA 対応サービスとして含めるように HIPAA 準拠プログラムを拡張しました。AWS と事業提携契約 (BAA) を締結している場合は、S3 Transfer Acceleration を使用して、クライアントと S3 バケットの長距離間で保護医療情報 (PHI) などのファイルを高速、簡単、安全に転送できます。

セキュリティ

すべて開く

Amazon S3 はデフォルトでセキュリティに保護されています。作成した時点で、お客様が作成した Amazon S3 バケットには、お客様だけがアクセスでき、誰がお客様のデータにアクセスできるかを完全に制御できます。Amazon S3 はユーザー認証をサポートし、データへのアクセスをコントロールしています。バケットポリシーなどのアクセスコントロールメカニズムを使用して、選択的にユーザーおよびユーザーのグループに権限を付与することができます。Amazon S3 コンソールでは、パブリックにアクセス可能なバケットがハイライトされ、パブリックにアクセスされたアクセス元が示されます。また、バケットポリシーやバケット ACL への変更によりバケットがパブリックにアクセス可能になった場合、警告が出されます。パブリックにアクセスしたくないすべてのアカウントとバケットに対して、Amazon S3 パブリックアクセスブロックを有効にする必要があります。すべての新しいバケットでは、パブリックアクセスブロックがデフォルトでオンになっています。HTTPS プロトコルを使用して、SSL エンドポイント経由で Amazon S3 にデータを安全にアップロードまたはダウンロードできます。Amazon S3 は、お客様のバケットにアップロードされるすべてのオブジェクトを自動的に暗号化します (2023 年 1 月 5 日現在)。または、固有の暗号化ライブラリを使用して、Amazon S3 に保存する前にデータを暗号化することもできます。
AWS のセキュリティの詳細については、AWS セキュリティページをご覧ください。S3 のセキュリティ情報については、S3 セキュリティページおよび S3 セキュリティベストプラクティスガイドにアクセスしてください。

お客様は、Amazon S3 リソースへのアクセスを制御するために、AWS Identity and Access Management (IAM) ポリシー、バケットポリシー、アクセスポイントポリシー、アクセスコントロールリスト (ACL)、クエリ文字列認証、Amazon Virtual Private Cloud (Amazon VPC) エンドポイントポリシー、AWS Organizations のサービスコントロールポリシー (SCP)、Amazon S3 パブリックアクセスブロックなど、さまざまなメカニズムを使用できます。

はい。お客様はオプションで、それに対して行われたすべてのリクエストのアクセスログレコードを作成するように Amazon S3 バケットを設定することができます。または、ログから IAM/ユーザー特定情報をキャプチャする必要のあるお客様は、AWS CloudTrail データイベントを設定することもできます。これらのアクセスログレコードは、監査目的で使用することができ、これらにはリクエストタイプ、リクエストで指定されたリソース、リクエストが処理された時刻や日付など、リクエストの詳細を含めることができます。

Amazon S3 は、任意のバケットへのすべての新規データのアップロードを暗号化します。Amazon S3 は、すべてのオブジェクトのアップロードに対して、S3 で管理されたサーバー側の暗号化 (SSE-S3) を暗号化の基本レベルとして適用します (2023 年 1 月 5 日現在)。SSE-S3 では、Amazon でセキュリティ層を複数使用してキーの管理と保護を実行するフルマネージドソリューションを提供します。Amazon でキーを管理したい場合には、引き続き SSE-S3 をご利用ください。さらに、データの暗号化には、SSE-C、SSE-KMS、または Amazon S3 Encryption Client などのクライアントライブラリを選択できます。各オプションでは、機密データを休止状態で暗号化して Amazon S3 に保存できます。SSE-C は、Amazon S3 がオブジェクトの暗号化と復号化を実行し、お客様は暗号化キーのコントロールを保持することができます。SSE-C では、Amazon S3 に保存されているオブジェクトの暗号化と復号にクライアント側のライブラリを実装/使用する必要はありませんが、オブジェクトを暗号化および復号するために Amazon S3 に送信するキーを管理する必要があります。独自の暗号化キーを管理しながら、クライアント側の暗号化ライブラリを実装または使用しない場合は、SSE-C を使用します。SSE-KMS では、AWS Key Management Service (AWS KMS) により暗号化キーを管理できます。AWS KMS を使用してキーを管理すると、いくつかの利点があります。AWS KMS では、KMS キーの使用に対して別の許可があり、制御レイヤーが追加され、また Amazon S3 に格納されているオブジェクトへの非承認アクセスに対する保護を提供できます。AWS KMS では監査追跡が提供されるので、誰がキーを使用してどのオブジェクトにいつアクセスしたのかがわかるだけでなく、データ復号許可を持たないユーザーからのデータアクセス試行の失敗を確認できます。また、AWS KMS では追加のセキュリティコントロールを提供し、PCI-DSS、HIPAA/HITECH、FedRAMP の各業界要件に準拠する顧客をサポートします。DSSE-KMS は、クライアント側の暗号化に必要なインフラストラクチャに投資することなく、データに2層の暗号化を適用するプロセスを簡素化します。暗号化の各レイヤーは、256ビットのガロスカウンターモード（AES-GCM）アルゴリズムの実装が異なり、極秘ワークロードでの使用が認められています。DSSE-KMS は AWS KMS を使用してデータキーを生成し、AWS KMS に暗号化キーを管理させます。AWS KMS では、KMS キーの使用に対して別の許可があり、制御レイヤーが追加され、また Amazon S3 に格納されているオブジェクトへの非承認アクセスに対する保護を提供できます。AWS KMS では監査追跡が提供されるので、誰がキーを使用してどのオブジェクトにいつアクセスしたのかがわかるだけでなく、データ復号許可を持たないユーザーからのデータアクセス試行の失敗を確認できます。また、AWS KMS では追加のセキュリティコントロールを提供し、PCI-DSS、HIPAA/HITECH、FedRAMP の各業界要件に準拠する顧客をサポートします。暗号化クライアントライブラリを使用すると、キーをユーザー側で管理し、ユーザーの好みの暗号化ライブラリを使用して、クライアント側でオブジェクトの暗号化と復号を実行することができます。お客様によっては、オブジェクトの暗号化と復号をエンドツーエンドで完全に管理することを希望される場合があります。その場合、暗号化したオブジェクトのみがインターネットを介して Amazon S3 に転送されます。暗号化キーの管理を維持する必要がある場合、クライアント側の暗号化ライブラリを実装または使用できる場合、および Amazon S3 へ保存するための送信前にオブジェクトを暗号化する必要がある場合は、クライアント側のライブラリを使用します。Amazon S3 SSE-S3、SSE-C、または SSE-KMS の使用に関する詳細については、暗号化を使用したデータの保護に関するドキュメントをご覧ください。

お客様は、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (パリ)、欧州 (ストックホルム)、欧州 (ミラノ)、欧州 (スペイン)、欧州 (ロンドン)、欧州 (チューリッヒ) リージョンを使用して、すべてのデータを欧州に保存することを選択できます。また、Amazon S3 on Outposts を使用すれば、全データを AWS Outposts 上のオンプレミスに保存できると同時に、AWS Outposts 間や AWS リージョンに対して、データを転送することも可能です。欧州の個人情報保護法への準拠は、お客様の責任範囲となります。詳細については、AWS General Data Protection Regulation (GDPR) Center および AWS Data Privacy Center をご覧ください。より具体的なロケーション要件やその他のデータプライバシー規制により、AWS リージョンがない場所にデータを保持することが義務付けられている場合は、AWS 専有ローカルゾーン用の S3 ストレージクラスまたは Outposts 用の S3 ストレージクラスを使用できます。

デフォルトでは、オブジェクトデータとオブジェクトメタデータは、オブジェクトを配置した単一の専有ローカルゾーン内に留まります。バケット名、キャパシティメトリックス、CloudTrail ログ、CloudWatch メトリックス、AWS キー管理サービス (KMS) のカスタマー管理キー、ID とアクセス管理 (IAM) ポリシーを含むバケット管理およびテレメトリデータは、親 AWS リージョンに保存されます。オプションで、S3 バッチオペレーションなどの他のバケット管理機能では、バケット名とオブジェクト名を含む管理メタデータを親 AWS リージョンに保存します。

Amazon S3 向け Amazon VPC エンドポイントは、AWS グローバルネットワークを介して S3 へ接続できる VPC 内の論理エンティティです。S3 の VPC エンドポイントには、ゲートウェイ VPC エンドポイントとインターフェイス VPC エンドポイントの 2 種類があります。ゲートウェイエンドポイントは、AWS ネットワークを介して VPC から S3 にアクセスするためにルートテーブルで指定するゲートウェイです。インターフェースエンドポイントは、プライベート IP を使用して、VPC 内、オンプレミス、または別の AWS リージョンから S3 にリクエストをルーティングすることにより、ゲートウェイエンドポイントの機能を拡張します。詳細については、AWS PrivateLink for Amazon S3 のドキュメントをご覧ください。

バケットに対するアクセスを特定の Amazon VPC エンドポイント、またはエンドポイントのセットからのみに制限するには、Amazon S3 バケットポリシーを使用します。S3 バケットポリシーは、アクセスを制限するための条件 aws:sourceVpce をサポートするようになりました。詳細とポリシー例については、S3 用ゲートウェイエンドポイントのドキュメントをお読みください。

AWS PrivateLink for S3 は、Amazon S3 とオンプレミスの間でプライベート接続を行えるようにします。VPC で S3 のインターフェイス VPC エンドポイントをプロビジョニングして、オンプレミスアプリケーションを AWS Direct Connect または AWS VPN を介して S3 に直接接続できます。オンプレミスから S3 にアクセスするために、パブリック IP を使用したり、ファイアウォールルールを変更したり、インターネットゲートウェイを設定したりする必要がなくなりました。詳細については、AWS PrivateLink for S3 ドキュメントにアクセスしてください。

AWS VPC マネジメントコンソール、AWS コマンドラインインターフェイス (AWS CLI)、AWS SDK、または API を使用して、インターフェイス VPC エンドポイントを作成できます。詳細については、ドキュメントにアクセスしてください。

AWS は、オンプレミスまたは別の AWS リージョンの VPC から S3 にアクセスするには、インターフェイス VPC エンドポイントを使用することをお勧めします。S3 と同じ AWS リージョンの VPC から S3 にアクセスしているリソースの場合、課金されないため、ゲートウェイ VPC エンドポイントを使用することをお勧めします。詳細については、ドキュメントにアクセスしてください。

はい。既存のゲートウェイ VPC エンドポイントがある場合は、VPC にインターフェイス VPC エンドポイントを作成し、クライアントアプリケーションを VPC エンドポイント固有のエンドポイント名で更新します。例えば、インターフェイスエンドポイントの VPC エンドポイント ID が us-east-1 リージョンの vpce-0fe5b17a0707d6abc-29p5708s の場合、エンドポイント固有の DNS 名は vpce-0fe5b17a0707d6abc-29p5708s.s3.us-east-1.vpce.amazonaws.com になります。この場合、VPC エンドポイント固有の名前へのリクエストのみが、インターフェイス VPC エンドポイントを介して S3 にルーティングされ、他のすべてのリクエストは引き続きゲートウェイ VPC エンドポイントを介してルーティングされます。詳細については、ドキュメントにアクセスしてください。

Amazon Macie は AI を活用したセキュリティサービスで、Amazon S3 に保存された機密データを自動的に検出、分類、保護することによりデータの消失を防ぐことができます。Amazon Macie では、機械学習を使用して、個人を特定できる情報 (PII) や知的財産などの機密データを認識し、ビジネス価値を割り当て、このようなデータが組織内でどこに保存されてどのように使用されているかについての可視性を提供します。Amazon Macie では、特異なデータアクセスアクティビティを継続的にモニタリングし、不正アクセスの危険や不注意によるデータ漏えいが検出された場合にアラートを配信します。Amazon Macie を使用すると、データとアカウントの認証情報を継続的にモニタリングすることにより、セキュリティの脅威から保護できます。Amazon Macie で提供されているビジネスデータの検出および分類の方法は、自動化されており、操作が簡単です。Amazon Macie では、テンプレート化された Lambda 関数による制御が提供されており、エンティティやサードパーティーのアプリケーションに対する疑わしい動作や承認されていないデータアクセスが検出された場合に、アクセスの取り消しやパスワードリセットポリシーをトリガーできます。アラートが生成された場合、Amazon CloudWatch Events を使用してデータ保護のためのアクションを迅速に実行することにより、Amazon Macie をインシデント対応に使用できます。詳細については、Amazon Macie のドキュメントにアクセスしてください。

Access Analyzer for S3 は、S3 バケットとアクセスポイントのポリシーを設定、検証、調整する際の許可管理を簡素化するのに役立つ機能です。 Access Analyzer for S3 は、既存のアクセスポリシーをモニタリングして、S3 リソースへの必要なアクセスのみを提供していることを確認します。Access Analyzer for S3 は、バケットアクセスポリシーを評価し、アクセスの必要がないバケットを検出して迅速に修正できるようにします。インターネット上のすべてのユーザーへのアクセスを許可するように構成されているバケット、または他の AWS アカウントと共有されているバケットがある場合、Access Analyzer for S3 は警告を発します。パブリックアクセスまたは共有アクセスのソースとレベルに関する検出結果を受け取ります。例えば、Access Analyzer for S3 は、アクセスコントロールリストまたはバケットポリシーを介して必要のない読み取りや書き込みアクセスが提供されているかどうかを事前に通知します。これらの検出結果により、必要なアクセスポリシーをすぐに設定または復元できます。バケットへ潜在的に共有されたアクセスを示す結果を確認する場合、S3 コンソールで 1 回クリックするだけで、バケットへのパブリックアクセスをブロックできます。また、バケットレベルの許可設定にドリルダウンして、きめ細かいアクセスレベルを設定することもできます。監査のために、Access Analyzer for S3 の結果を CSV レポートとしてダウンロードできます。また、S3 コンソールが、S3 ポリシーを作成するときに、IAM Access Analyzer からのセキュリティ警告、エラー、および提案をレポートします。コンソールは、ポリシーを検証するために 100 を超えるポリシーチェックを自動的に実行します。こうしたチェックは時間を節約し、エラーを解決するためのガイドとなり、セキュリティのベストプラクティスを適用するのに役立ちます。
詳細については、IAM Access Analyzer ドキュメントにアクセスしてください。

S3 Access Grants

すべて開く

Amazon S3 Access Grants では、Active Directory などのディレクトリや AWS Identity and Access Management (IAM) プリンシパルのアイデンティティを S3 のデータセットにマッピングします。これにより、社内のアイデンティティに基づいてエンドユーザーに S3 のアクセス権を自動的に付与することで、データのアクセス許可を大規模に管理できます。また、S3 Access Grants では、S3 のデータにアクセスするために使用されたエンドユーザーのアイデンティティとアプリケーションを AWS CloudTrail のログに記録します。これにより、S3 バケットのデータへのすべてのアクセスについて、エンドユーザーのアイデンティティなどの詳細な監査履歴を手に入れることができます。

S3 Access Grants は、S3 データが多くのユーザーやアプリケーションで共有およびアクセスされ、その ID の一部が Okta や Entra ID などの社内ディレクトリにあり、これらの S3 データセットへのアクセスを大規模に許可するためのスケーラブルでシンプル、かつ監査可能な方法が必要な場合に適しています。

S3 Access Grants は、4 つのステップで開始できます。まず、S3 アクセス権限インスタンスを設定します。このステップでは、社内ディレクトリのユーザーやグループで S3 アクセス権限を使用する場合は、AWS Identity Center を有効にして、S3 アクセス権限を ID センターインスタンスに接続します。次に、ロケーションを S3 アクセス権限に登録します。このプロセスでは、ユーザーとアプリケーションが S3 にアクセスするために使用できる一時的な S3 認証情報の作成に使用される IAM ロールを S3 アクセス権限に付与します。3 つ目は、誰が何にアクセスできるかを定義する権限付与を定義することです。最後に、アクセス時に、アプリケーションが S3 Access Grants に一時的な認証情報をリクエストし、Access Grants が提供した認証情報を使用して S3 にアクセスするようにします。

S3 Access Grants は、AWS アイデンティティセンターからのエンタープライズユーザーまたはグループ ID と、IAM ユーザーとロールを含む AWS IAM プリンシパルの 2 種類のアイデンティティをサポートしています。AWS Identity Center で S3 アクセス権限を使用すると、ディレクトリグループのメンバーシップに基づいてデータ権限を定義できます。AWS アイデンティティセンターは、Azure Active Directory、Okta、Ping など、一般的に使用されているアイデンティティプロバイダーに接続する AWS サービスです。S3 アクセス権限は、AWS Identity Center によるディレクトリアイデンティティのサポートに加えて、IAM ユーザーとロールを含む AWS IAM プリンシパルの権限ルールもサポートします。これは、AWS アイデンティティセンターではなく IAM および SAML アサーションを介してカスタム ID フェデレーションを管理する (実装例) 場合や、IAM プリンシパルに基づいてアプリケーション ID を管理しているが、スケーラビリティと監査可能性を考慮して S3 Access Grants を引き続き使用したいというユースケース向けです。

S3 Access Grants には、読み取り、書き込み、読み取り書き込みの 3 つのアクセスレベルがあります。READ を使用すると、S3 からオブジェクトを表示および取得できます。WRITE では、S3 への書き込みや S3 からの削除が可能です。READWRITE では、読み取りと書き込みの両方を行うことができます。

いいえ。S3 Access Grants が提供する 3 つの定義済みアクセスレベル (READ/WRITE/READWRITE) のみを使用できます。

はい。S3 Access Grants インスタンスごとに最大 100,000 の権限を作成でき、S3 Access Grants インスタンスごとに最大 1,000 のロケーションを作成できます。

いいえ。S3 Access Grants から一時的な認証情報を取得する場合のレイテンシーは、現在 AWS STS から一時的な認証情報を取得する場合と似ています。S3 Access Grants から認証情報を取得したら、有効期限が切れていない認証情報を以降のリクエストで再利用できます。後続のリクエストでは、S3 Access Grants の認証情報を使用して認証されたリクエストが他の方法で認証された場合と比べてレイテンシーが増えることはありません。

ディレクトリ ID に S3 Access Grants を使用する場合は、まず AWS IAM アイデンティティセンターをセットアップする必要があります。AWS IAM アイデンティティセンターは、ID がアイデンティティセンターで作成および保存されているか、外部のサードパーティのアイデンティティプロバイダーに保存されているかにかかわらず、従業員の ID を作成または接続するのに役立ちます。セットアッププロセスについては、Identity Center のドキュメントを参照してください。Identity Center インスタンスをセットアップしたら、そのインスタンスを S3 アクセス権限に接続できます。その後、S3 Access Grants はアイデンティティセンターを利用してグループメンバーシップなどのユーザー属性を取得し、リクエストを評価して承認を決定します。

はい。今日では、アプリケーションに関連付けられた IAM 認証情報 (たとえば、EC2 の IAM ロール認証情報や IAM Roles Anywhere の認証情報、長期的な IAM ユーザー認証情報など) を使用して S3 クライアントを初期化するのに対し、アプリケーションは S3 クライアントを初期化する前に、まず S3 アクセス権限認証情報を取得する必要があります。これらの S3 アクセス権限認証情報は、アプリケーション内の認証済みユーザーに固有のものです。S3 クライアントがこれらの S3 Access Grants 認証情報で初期化されると、その認証情報を使用して通常どおり S3 データのリクエストを行うことができます。

現在の S3 Access Grants は、既に S3A コネクタ経由で EMR やオープンソースの Spark と統合されています。さらに、S3 Access Grants は Immuta や Informatica などのサードパーティ製ソフトウェアと統合されているため、権限管理を一元化できます。最後に、S3 Access Grants は Terraform と CloudFormation をサポートしているため、プログラムで S3 Access Grants をプロビジョニングできます。

いいえ。S3 Access Grants は IAM に取って代わるものではなく、実際には既存の IAM ベースのデータ保護戦略 (暗号化、ネットワーク、データ境界ルール) とうまく連携します。S3 Access Grants は IAM プリミティブに基づいて構築されており、より詳細な S3 許可を大規模に表現できます。

はい。KMS で暗号化されたオブジェクトに S3 アクセス権限を利用するには、バケット所有者はロケーション登録の一環として S3 アクセス権限に付与する必要な KMS 権限を IAM ロールに含めます。その後、S3 Access Grants はその IAM ロールを利用してバケット内の KMS 暗号化オブジェクトにアクセスできます。

AWS マネジメントコンソールの S3 Access Grants コンソールエクスペリエンスを使用するか、SDK と CLI API を使用して S3 Access Grants の許可を表示および管理できます。

いいえ。S3 Access Grants を使用してデータへのパブリックアクセスを付与することはできません。

S3 Access Grants を使用してデータアクセスセッションを開始するアプリケーションからのリクエストは、CloudTrail に記録されます。CloudTrail は、リクエストを行うユーザーの ID と、ユーザーに代わってデータにアクセスするアプリケーション ID を区別します。これは、誰がどのデータにいつアクセスしたのかというエンドユーザーの識別情報を監査するのに役立ちます。

S3 Access Grants は S3 Access Grants へのリクエスト数に基づいて課金されます。詳細については、料金ページをご覧ください。

AWS Lake Formation は、表形式のデータ (Glue テーブルなど) へのアクセスを管理する必要があるユースケースや、行レベルと列レベルのアクセスを強制したい場合に適しています。S3 Access Grants は、動画、画像、ログなどの非構造化データなどの直接 S3 許可へのアクセスを管理するためのものです。

いいえ。S3 Access Grants は、現時点では IAM アクセスアナライザーと統合されていません。IAM アクセスアナライザーを使用して S3 アクセス権限付与を分析することはまだできません。お客様は、S3 コンソールの S3 Access Grants ページにアクセスするか、ListAccessGrants API を使用してプログラムで S3 Access Grants 付与を直接監査できます。

S3 Access Points

すべて開く

Amazon S3 Access Points は、S3 と連動するアプリケーションまたは AWS サービスのデータアクセス管理を簡素化するエンドポイントです。S3 Access Points は、S3 バケットおよび Amazon FSx for OpenZFS ファイルシステムで動作します。各アプリケーションまたはユーザーに合わせてカスタマイズされた名前と許可を持つアクセスポイントを作成することで、さまざまなアプリケーションまたはユーザーがデータにアクセスする方法を制御および簡素化できます。

S3 バケットで S3 Access Points を使用すると、作成、読み取り、追跡、監査が必要な何百もの異なる許可ルールを含む単一の複雑なバケットポリシーを管理する必要がなくなります。代わりに、バケットごとに数百のアクセスポイントを作成し、それぞれがバケットへのカスタマイズされたパスを提供し、アクセスポイントを介して行われるすべてのリクエストに対して特定の許可とネットワーク制御を適用する独自のホスト名とアクセスポリシーを設定できます。

FSx for OpenZFS で S3 Access Points を使用すると、データが S3 に存在しているかのように、S3 API を使用して FSx データにアクセスできます。この機能により、FSx for OpenZFS 内のファイルデータは、FSx for OpenZFS ファイルシステムに保存したまま、S3 と連携するさまざまな人工知能、機械学習、分析のサービスおよびアプリケーションで使用できるようになります。

S3 Access Points は、S3 上の共有データセットに対するデータアクセスの管理方法を簡素化します。たった 1 つの複雑なバケットポリシーを管理するのに、数百の許可ルールの書き込み、読み取り、追跡、監査をする必要がなくなりました。S3 Access Points を使用すると、アクセスポイントを作成したり、信頼できるアカウントに許可を委任して、バケットにクロスアカウントアクセスポイントを作成したりできます。これにより、特定のアプリケーションに合わせたポリシーで共有データセットにアクセスできます。Access Points を使用すると、1 つの大型サイズのバケットポリシーを分割して、共有データセットにアクセスする必要のある各アプリケーション向けに個別のアクセスポイントポリシーを単独で作成できます。このため、あるアプリケーションに対して正しいアクセスポリシーを作成するのがこれまでよりも簡単になり、ほかのアプリケーションが共有データセット内で実行していることを気にする必要はありません。また、サービスコントロールポリシー (SCP) を作成して、すべてのアクセスポイントを仮想プライベートクラウド (VPC) に制限して、データをプライベートネットワーク内でファイアウォール管理できます。

S3 Access Points を使用すると、データを S3 に移動することなく、S3 API を使用して Amazon FSx for OpenZFS のファイルデータにアクセスできます。FSx for OpenZFS ファイルシステムにアタッチされた S3 Access Points は、S3 バケットにアタッチされた S3 Access Points と同様に機能し、アクセスポリシーによってアクセスが制御された S3 経由のデータアクセスを提供します。データは引き続き FSx for OpenZFS ファイルシステムまたは S3 バケットのいずれかに保存されます。例えば、S3 Access Points を FSx for OpenZFS ファイルシステムにアタッチすると、お客様は、S3 と連携する生成 AI、機械学習、分析サービス、およびアプリケーションでそのアクセスポイントを使用して、FSx for OpenZFS データにアクセスできます。

各 S3 Access Point は、ユースケースまたはアプリケーションに固有のアクセスポリシーで設定され、バケットには数千のアクセスポイントを含めることができます。例えば、データレイクのユーザーグループやアプリケーショングループにアクセス権を付与する S3 バケットに対してアクセスポイントを作成できます。Access Point が 1 つあれば、単一のユーザーやアプリケーション、またはアカウント内やアカウント間のユーザーグループやアプリケーショングループがサポートされるため、各アクセスポイントを個別に管理できます。さらに、信頼できるアカウントに許可を委任して、バケットにクロスアカウントアクセスポイントを作成できます。バケット所有者から許可が付与されるまで、クロスアカウントアクセスポイントはデータに対するアクセス権を付与しません。バケット所有者は常にデータの最終的なコントロールを保持し、バケットポリシーを更新してクロスアカウントアクセスポイントからのリクエストを承認する必要があります。サンプルのバケットポリシーについては、ユーザーガイドをご覧ください。各アクセスポイントは単一のバケットと関連付けられています。また、ネットワークオリジンコントロールとパブリックアクセスのブロックコントロールが含まれます。AWS クラウドとは論理的に分離された仮想プライベートクラウドからのストレージアクセスだけを許可するネットワーク発信元制御によって、アクセスポイントを作成できます。また、定義されたプレフィックスを持つオブジェクトや、特定のタグを持つオブジェクトだけにアクセスを許可するように設定されたアクセスポイントポリシーによって、アクセスポイントを作成することもできます。アクセスポイントを介して共有バケットのデータにアクセスするには、次の 2 つの方法があります。S3 オブジェクトのオペレーションでは、バケット名の代わりにアクセスポイントの ARN を使用することができます。スタンダードな S3 バケット名の形式でバケット名を必要とするリクエストには、代わりにアクセスポイントのエイリアスを使用できます。S3 Access Points のエイリアスは自動的に生成され、データアクセスにバケット名を使用する場面でどこでも S3 バケット名と入れ替え可能です。バケットにアクセスポイントが作成されるたびに、S3 は自動的に新しい Access Point エイリアスを生成します。対応するオペレーションや AWS のサービスの全容については、S3 ドキュメントにアクセスしてください。

デフォルトでは、アカウントおよびクロスアカウントのバケットで、アカウントごとに 1 つのリージョンあたり 10,000 の S3 Access Points を作成できます。AWS アカウントあたりの S3 アクセスポイントの数に厳しい制限はありません。このクォータの引き上げをリクエストするには、Service Quotas にアクセスしてください。

S3 Access Points には、独自の IAM アクセスポイントポリシーがあります。リソースとしてアクセスポイント ARN を使用して、バケットポリシーのようにアクセスポイントポリシーを記述します。アクセスポイントポリシーは、アクセスポイントを介してリクエストされた S3 データへのアクセスを許可または制限できます。Amazon S3 は、ユーザー、バケット、アクセスポイント、VPC エンドポイント、サービスコントロールポリシー、アクセスコントロールリストのポリシーなど、関連するすべてのポリシーを評価して、リクエストを承認するかどうかを決定します。

IAM ルールを使用して許可とポリシードキュメントのアクセスポイント ARN を管理し、バケットポリシーと同様にアクセスポイントポリシーを作成できます。

バケットポリシーを引き続き使用して、指定された VPC へのバケットアクセスを制限できます。アクセスポイントは、API コントロールを使用して、組織内のすべてのアプリケーションの共有データセットから、すべてのデータまたは一部のデータを VPC のみのトラフィックにロックダウンする、より簡単で監査可能な方法を提供します。AWS Organizations サービスコントロールポリシー (SCP) を使用して、組織で作成されたアクセスポイントが「ネットワークオリジンコントロール」の API パラメータ値を「vpc」に設定することを義務付けることができます。次に、作成された新しいアクセスポイントは、VPC のみのトラフィックへのデータアクセスを自動的に制限します。指定された VPC からのみデータリクエストが処理されるようにするために、追加のアクセスポリシーは必要ありません。

はい。組織内のアクセスポイントに「インターネットデータアクセスなし」ポリシーを適用するには、すべてのアクセスポイントが VPC のみのアクセスを適用するようにします。そのために、create_access_point() API の「ネットワークオリジンコントロール」パラメータの値「vpc」のみをサポートする AWS SCP を作成します。以前作成したインターネットに面したアクセスポイントがある場合は、それらを削除できます。また、各バケットのバケットポリシーを変更して、バケットホスト名を介したバケットへのインターネットアクセスを直接制限する必要があります。他の AWS のサービスがバケットに直接アクセスしている可能性があるため、これらの AWS のサービスを許可するようにポリシーを変更して、お望みの AWS のサービスを許可するアクセスを設定してください。実行方法の例については、S3 ドキュメントをご覧ください。

現在はありませんが、アクセスポイントを使用して行われなかったリクエストを拒否するバケットポリシーを添付できます。詳細については、S3 ドキュメントをご覧ください。

はい。アクセスポイントを削除しても、他のアクセスポイントやバケットのホスト名を介して関連付けられたバケットへのアクセスは中断されません。

アクセスポイントまたはアクセスポイントを使用するバケットでは追加料金はかかりません。通常の Amazon S3 リクエスト料金が適用されます。

AWS マネジメントコンソール、AWS コマンドラインインターフェイス (CLI)、アプリケーションプログラミングインターフェイス (API)、および AWS Software Development Kit (SDK) クライアントを通じて、新しいバケットと既存のバケットで S3 Access Points の作成を開始できます。S3 Access Points の詳細については、ユーザーガイドにアクセスしてください。

耐久性とデータ保護

すべて開く

Amazon S3 は、クラウドで極めて耐久性の高いストレージを提供します。S3 は、独自のアーキテクチャに基づいて、99.999999999% (イレブンナイン) のデータ耐久性を実現できるように設計されています。さらに、S3 はデフォルトで最低 3 つのアベイラビリティーゾーン (AZ) にデータを冗長的に保存するため、広範囲に及ぶ災害に対する回復力が組み込みで備わっています。お客様は、データを 1 つの AZ に保存してストレージコストやレイテンシーを最小限に抑えたり、データセンター全体が永久に失われても回復できるように複数の AZ に保存したり、地理的な回復力要件を満たすために複数の AWS リージョンに保存したりできます。

Amazon S3 の設計で高い耐久性を実現できているのは、デバイスの故障率を前提にしつつ、それらのデバイスで障害を迅速に検出してデータを再レプリケートできる仕組みを備えているからです。S3 は、オブジェクトをアップロードするたびにエンドツーエンドの整合性チェックを行い、アップロードが成功したと見なす前に、すべてのデータが複数のストレージデバイスに正しく冗長的に保存されていることを確認します。データが S3 に保存されると、S3 は保管中のすべてのデータの整合性を定期的にチェックして、データの耐久性を長期にわたって継続的に監視します。また、S3 はデータの冗長性を積極的に監視して、オブジェクトが複数のストレージデバイスの同時障害に耐えられることを確認します。

万が一、AWS アベイラビリティーゾーンの全部または一部が失われたり損傷したりした場合、One Zone ストレージクラスのデータが失われる可能性があります。たとえば、火災や水害などのイベントでは、データが失われる可能性があります。このようなタイプのイベントとは別に、One Zone ストレージクラスはリージョンレベルのストレージクラスと同様のエンジニアリング設計を採用して、独立したディスク、ホスト、ラックレベルの障害からオブジェクトを保護します。また、いずれのクラスも 99.999999999% のデータ耐久性を実現するように設計されています。

Amazon S3 には強固な耐久性文化があり、耐久性のベストプラクティスは当社のシステムとソフトウェアにゼロから組み込まれています。AWS は、他のどのクラウドプロバイダーよりも耐久性の高いストレージの運用経験が豊富であり、この経験を活かして耐久性リスクを軽減し、すべての活動に耐久性保護策を取り入れています。

はい。Amazon S3 の耐久性システムでは、偶発的な削除や悪意のある削除を防ぐことはできません。S3 では、どのデータを保持したいか、どのデータを削除するか、事故や悪意による誤った削除を防ぐためにどのようなオプションコントロールが必要かを決めるのはお客様次第です。Amazon S3 にデータを削除するように指示すると、そのデータはすぐに削除され、AWS では復元できません。この方法で削除リクエストを受け付けることは、このサービスの重要な特徴です。

S3 オブジェクトバージョニング、S3 レプリケーション、S3 Object Lock はすべて、S3 が自動的に提供する耐久性を超えて、データ保護を強化するために使用できるオプション機能です。さらに、バックアップアプリケーションを使用して、S3 バケットのデータの全部または一部をバックアップできます。

Amazon S3 は、Content-MD5 チェックサム、セキュアハッシュアルゴリズム (SHA)、および周期的な冗長性チェック (CRC) を組み合わせて、データの整合性を検証します。Amazon S3 は、保管中のデータにこれらのチェックサムを実行し、冗長データを用いて相違の修復を行います。さらに、最新の AWS SDK では、すべてのアップロードの効率的な CRC ベースのチェックサムが自動的に計算されます。 S3 はそのチェックサムを個別に検証し、パブリックインターネット経由での転送中にデータの整合性が維持されていたことを確認した後にのみオブジェクトを受け入れます。事前に計算されたチェックサムを提供しないバージョンの SDK を使用してオブジェクトをアップロードする場合、S3 はマルチパートアップロードの場合でも、オブジェクト全体の CRC ベースのチェックサムを計算します。チェックサムはオブジェクトメタデータに保存されるため、いつでもデータの整合性を検証できます。アップロードおよびダウンロードリクエストのデータ整合性チェックをサポートする 5 つのチェックサムアルゴリズムから選択できます。アプリケーションのニーズに応じて、SHA-1、SHA-256、CRC32、CRC32C、または CRC64NVME チェックサムアルゴリズムを選択できます。S3 からデータを保存または取得するときにチェックサムを自動的に計算および検証でき、HeadObject S3 API、GetObjectAttributes S3 API または S3 Inventory レポートを使用していつでもチェックサム情報にアクセスできます。データを S3 にストリーミングするときにチェックサムを計算すると、2 つの連続した操作としてではなく、1 回のパスでデータの検証と送信の両方ができるため、時間を節約できます。データ検証にチェックサムを使用することは、データの耐久性のベストプラクティスであり、これらの機能により、パフォーマンスが向上し、そのためのコストが削減されます。

バージョニングを使用すれば、Amazon S3 バケットに格納されたあらゆるオブジェクトのあらゆるバージョンを、保存、取得、復元することができます。バケットのバージョニングを有効にすると、既存のオブジェクトに対して PUT、POST、COPY、DELETE のいずれかが行われた場合、Amazon S3 はそのオブジェクトを保持します。デフォルトでは、GET リクエストは最も新しく書き込まれたバージョンを取得するようになっています。上書きされた、または削除されたオブジェクトの古いバージョンは、リクエストでバージョンを指定することによって取得できます。

Amazon S3 はお客様に、極めて耐久性の高いストレージインフラストラクチャを提供しています。お客様がオブジェクトを誤って上書きまたは削除してしまった場合に、バージョニングで回復する手段を提供することによって、さらにレベルの高い保護能力をもたらします。これによって、意図せぬユーザーアクションやアプリケーションの障害から、簡単に回復することができます。バージョニングはデータ保持やデータアーカイブにも利用できます。

Amazon S3 バケットで設定を有効にすることによって、バージョニングの使用を開始できます。バージョニングを有効にする方法の詳細については、Amazon S3 ドキュメントをご覧ください。

ユーザーがオブジェクトに対して DELETE オペレーションを実行した場合、その後の単純な (バージョニングされていない) リクエストでそのオブジェクトが取得されることはなくなります。しかし、そのオブジェクトの全バージョンはお客様の Amazon S3 バケットに継続的に保存され、取得または復元することができます。Amazon S3 バケットの所有者だけがバージョンを永久に削除できます。ライフサイクルルールを設定して、複数のバージョンのオブジェクトを保存するライフタイムとコストを管理できます。

Amazon S3 ライフサイクルルールを S3 バージョニングとともに使用して、S3 オブジェクトにロールバックウィンドウを実装できます。例えば、バージョニングが有効なバケットで、以前のバージョンすべてを低コスト S3 Glacier Flexible Retrieval ストレージクラスにアーカイブして、100 日後に削除するルールを設定することで、ストレージコストを抑えつつ、データ変更のロールバックのために 100 日間のウィンドウを設けることができます。加えて、5 日後またはより新しいバージョンのオブジェクトが少なくとも 2 つある場合、古い (最新ではない) バージョンのオブジェクトを削除することによりコストを削減できます。コスト最適化のニーズに応じて、日数や新しいバージョン数を変更することができます。これにより、必要に応じてオブジェクトの追加のバージョンを保持できますが、一定時間後それらを移行または削除することによりコスト削減ができます。

バージョニングの多要素認証 (MFA) 削除機能はセキュリティをさらに強化するために使えます。デフォルトでは、Amazon S3 バケットに対するリクエストはすべて AWS アカウントの認証情報を必要とします。Amazon S3 バケットにおいて MFA Delete のバージョニングを有効にした場合、オブジェクトのバージョンを永久に削除するためには次の 2 つの形式の認証が必要です。お客様の AWS アカウントによる認証情報およびお客様が物理的に保有する認証デバイスからの有効な 6 桁の数字とシリアル番号です。認証デバイスの購入やアクティブ化の方法など、MFA Delete をバージョニングで有効にすることについての詳細は、Amazon S3 ドキュメントをご覧ください。

通常の Amazon S3 料金は、格納またはリクエストされるオブジェクトの各バージョンについて適用されます。例えば、バージョニングを利用した場合のストレージコストを説明するために、次のシナリオを見てみましょう (現在の月は 31 日間と仮定します): 1) 該当月の 1 日目: バケットに対して 4 GB (4,294,967,296 バイト) の PUT を実行します。
2) 月の 16 日目: 1 日目の最初の PUT と同じキーを使用して、同一のバケット内で、5 GB (5,368,709,120 バイト) の PUT を実行します。

上記のオペレーションのストレージ費用を分析する際、5 GB のオブジェクトが 15 日目に書き込まれた時、初日の 4 GB のオブジェクトが、バケットから削除されるわけではないことにご注意ください。そうではなく、4 GB のオブジェクトは古いバージョンとして保存され、5 GB のオブジェクトがお客様のバケット内で最も新しく書き込まれたオブジェクトのバージョンとなります。月末: 合計バイト-時間使用量
[4,294,967,296 バイト x 31 日間 x (24 時間/日)] + [5,368,709,120 バイト x 16 日間 x (24 時間/日)] = 5,257,039,970,304 バイト-時間。合計 GB-月への変換
5,257,039,970,304 バイト-時間 x (1 GB/1,073,741,824 バイト) x (1 か月 / 744 時間) = 6.581 GB-月コストは、Amazon S3 の料金ページに記載されているリージョンの現在の料金に基づいて計算されます。

Amazon S3 Object Lock は Amazon S3 の機能であり、オブジェクトバージョンが一定期間または無期限に削除または上書きされないようにします。これにより、データ保護の追加レイヤーとして、または規制コンプライアンスのために、リテンションポリシーを適用できます。事前定義されたリテンション期日前に、または無期限 (リーガルホールド期日) に、オブジェクトバージョンの削除を防ぐには、ワークロードを既存の Write Once Read Many (WORM) システムから Amazon S3 に移行し、S3 オブジェクトロックをオブジェクトレベルおよびバケットレベルで設定します。S3 オブジェクトロックの保護は、オブジェクトバージョンが格納されているストレージクラスと、ストレージクラス間の S3 ライフサイクル移行に関係なく維持されます。データを WORM で保護すること義務付ける規制要件がある場合、または Amazon S3 のデータの保護レイヤーを追加する場合は、S3 オブジェクトロックを使用する必要があります。S3 オブジェクトロックを使用することで、データを不変な形式で保存するよう指定する規制要件を満たすことができます。また、Amazon S3 のデータの偶発的または悪意のある削除を回避することもできます。
詳細については、S3 Object Lock のユーザーガイドにアクセスしてください。

Amazon S3 Object Lock は、指定された保持期間中、またはリーガルホールドが解除されるまで無期限に、オブジェクトバージョンが削除されないようにします。S3 オブジェクトロックを使用すると、WORM 保護が適用されている限り、オブジェクトのバージョンが確実に不変のままとすることができます。WORM 保護を適用するには、AWS SDK、CLI、REST API、または S3 マネジメントコンソールを使用して、オブジェクトバージョンにリテンション期日またはリーガルホールド期日を割り当てます。PUT リクエスト内に保持設定を適用するか、作成後に既存のオブジェクトに適用することもできます。リテンション期日は、オブジェクトバージョンが不変のままにする時間の長さを定義します。リテンション期日がオブジェクトに割り当てられると、リテンション期日が経過するまで、そのオブジェクトバージョンを変更または削除することはできません。ユーザーがリテンション期日前にオブジェクトを削除しようとすると、そのオペレーションは拒否されます。または、リーガルホールドを適用することで、オブジェクトを不変にすることもできます。リーガルホールドは、オブジェクトバージョンが明示的に削除されるまで無期限に、オブジェクトバージョンが変更または削除されるのを防ぎます。リーガルホールドを適用して削除するには、AWS アカウントに PutObjectLegalHold アクションの書き込みアクセス権限が必要です。リーガルホールドは、S3 オブジェクトロックを有効にしたバケット内のオブジェクトに適用できます。そのオブジェクトが現在、保持期間によって WORM 保護されているかどうかは関係ありません。
S3 オブジェクトロックは、2 つのうちいずれかのモードで設定できます。ガバナンスモードでデプロイされると、特定の IAM アクセス権限を持つ AWS アカウントはオブジェクトバージョンから WORM 保護を削除できます。規制を遵守するためにより強力な不変性が必要な場合は、コンプライアンスモードを使用することができます。コンプライアンスモードでは、ルートアカウントを含め、どのユーザーも、WORM 保護を無効にすることはできません。

いいえ。S3 Object Lock を有効にすると、バケットの S3 Object Lock または S3 バージョニングを無効にすることはできません。

S3 Object Lock が有効になっているバケットから S3 レプリケーションでオブジェクトのレプリケーションを開始するには、同じまたは異なる AWS リージョンで、同じまたは異なる AWS アカウントにあるレプリケート先バケットを指定することで、ソースバケットにレプリケーション設定を追加できます。すべてのオブジェクトを S3 バケットレベルで複製するか、共有プレフィックスレベルでオブジェクトをフィルタリングするか、S3 オブジェクトタグを使用してオブジェクトレベルでオブジェクトをフィルタリングするかを選択できます。また、レプリケーション操作を実行するために必要な権限を持つ AWS ID およびアクセス管理 (IAM) ロールを指定する必要があります。S3 コンソール、AWS API、AWS CLI、AWS SDK、または AWS CloudFormation を使用してレプリケーションを有効にできます。また、ソースバケットとターゲットバケットの両方で S3 バージョニングを有効にする必要があります。さらに、S3 Object Lock が有効なバケットからオブジェクトを複製するには、レプリケート先バケットでも S3 オブジェクトロックが有効になっている必要があります。詳細については、S3 レプリケーションの設定と S3 レプリケーションでの S3 Object Lock の使用に関するドキュメントをご覧ください。

はい。S3 Object Lock が有効なバケットからオブジェクトをレプリケートするには、レプリケーションのセットアップに使用する IAM ロールのソースバケットに、s3:GetObjectRetention および s3:GetObjectLegalHold という 2 つの新しい許可を付与する必要があります。または、IAM ロールに s3: Get* 権限がある場合は、要件を満たしています。詳細については、S3 レプリケーションでの S3 Object Lock の使用に関するドキュメントをご覧ください。

いいえ。S3 同一リージョンレプリケーション (S3 SRR)、S3 クロスリージョンレプリケーション (S3 CRR)、進行状況を追跡するための S3 レプリケーションメトリクス、S3 Replication Time Control (S3 RTC)、S3 バッチレプリケーションなど、S3 レプリケーションのすべての機能は、S3 Object Lock バケットからのレプリケーション中にサポートされます。

S3 Batch Replication を使用して、S3 Object Lock が有効なバケットから既存のオブジェクトをレプリケートできます。既存のオブジェクトの複製の詳細については、S3 Batch Replication に関するドキュメントをご覧ください。

ストレージクラス

すべて開く

Amazon S3 は、ワークロードのデータアクセス、回復力、およびコスト要件に基づいて選択できるさまざまなストレージクラスを提供しています。S3 ストレージクラスは、さまざまなアクセスパターンに最低コストのストレージを提供できるように設計されています。S3 ストレージクラスは、要求の厳しいパフォーマンスニーズ、データ常駐要件、不明または変更されたアクセスパターン、アーカイブストレージなど、事実上すべてのユースケースに最適です。各 S3 ストレージクラスは、データを保存するための料金と、データにアクセスするための料金がかかります。ワークロードに最適な S3 ストレージクラスを決定する際には、データのアクセスパターンと保持時間を考慮し、データの存続期間におけるトータルコストが最も低くなるように最適化します。

ワークロードに最適な S3 ストレージクラスを決定する際には、データのアクセスパターンと保持時間を考慮し、データの存続期間におけるトータルコストが最も低くなるように最適化します。多くのワークロードは、変化する (ユーザー生成コンテンツ)、予測できない (分析、データレイク)、または未知の (新しいアプリケーション) アクセスパターンを持っています。そのため、S3 Intelligent-Tiering をデフォルトのストレージクラスとして使用し、自動的にストレージコストを節約する必要があるのです。データのアクセスパターンがわかっていれば、このガイダンスに従うことができます。S3 Standard ストレージクラスは、頻繁にアクセスするデータに最適です。月に 1 回以上データにアクセスする場合は、これが最適です。S3 Standard-Infrequent Access は、少なくとも 1 か月間保持し、1～2 か月に 1 回アクセスするデータに最適です。Amazon S3 Glacier ストレージクラスは、データアーカイブ専用に設計されており、クラウドで最高のパフォーマンス、最高の検索の柔軟性、最低のコストのアーカイブストレージを提供します。さまざまなアクセスパターンやストレージ期間に最適化された 3 種類のアーカイブストレージクラスから選択できるようになりました。医療画像、ニュースメディアアセット、ゲノミクスデータなど、すぐにアクセスする必要のあるアーカイブデータであれば、ミリ秒レベルの取得時間で最低コストのストレージを提供するアーカイブストレージクラスである S3 Glacier Instant Retrieval ストレージクラスを選択できます。バックアップやディザスタリカバリのユースケースなど、すぐにアクセスする必要はないものの、大量のデータを無料で取得できる柔軟性が必要なアーカイブデータであれば、S3 Glacier Flexible Retrieval を選択すれば、数分での検索、または 5〜12 時間での無料での一括検索が可能です。コンプライアンスアーカイブやデジタルメディア保存などの長寿命のアーカイブストレージにかかるコストをさらに節約するには、S3 Glacier Deep Archive をお選びください。12 時間以内にデータを取得でき、クラウドで最も低コストのストレージです。これらのストレージクラスはすべて、複数のデバイスと AWS リージョン内の物理的に分離された AWS アベイラビリティーゾーンにデータを冗長的に保存することで、マルチアベイラビリティーゾーン (AZ) の耐障害性を提供します。

耐障害性の要件が低いデータの場合は、S3 One Zone-Infrequent Access のようなシングル AZ ストレージクラスを選択することでコストを削減できます。既存の AWS リージョンでは満たせないデータレジデンシーや分離の要件がある場合は、AWS 専有ローカルゾーン用の S3 ストレージクラスまたは Outposts ラック用の S3 ストレージクラスを使用して、特定の境界にデータを保存できます。

S3 Intelligent-Tiering

すべて開く

S3 Intelligent-Tiering は、パフォーマンスへの影響、取得費用、運用上のオーバーヘッドなしに、アクセス頻度に基づいてデータを極めて費用対効果の高いアクセスティアに自動的に移動することにより、きめ細かいオブジェクトレベルでストレージコストを自動的に削減できる初めてのクラウドストレージです。S3 Intelligent-Tiering は、高頻度、低頻度、およびアーカイブインスタントアクセス階層で、頻繁に、稀に、そしてめったにアクセスされないデータに対して、ミリ秒単位でのレイテンシーと高スループットのパフォーマンスを提供します。オブジェクトモニタリングとオートメーションに対する少額の月額料金で、S3 Intelligent-Tiering はアクセスパターンをモニタリングし、オブジェクトをある階層から別の階層へ自動的に移動させることができます。S3 Intelligent-Tiering では取得に料金はかからないため、アクセスパターンを変更しても、ストレージの請求が予想外に増えることはありません。これで、S3 Intelligent-Tiering を、事実上すべてのワークロード、特にデータレイク、データ分析、機械学習、新しいアプリケーション、およびユーザー生成コンテンツのデフォルトのストレージクラスとして使用できます。

Amazon S3 Intelligent-Tiering ストレージクラスは、アクセスパターンが変化したときに、最もコスト効率の高いアクセス階層に自動的にデータを移動することで、コストを最小限に抑えるように設計されています。オブジェクトごとのモニタリングとオートメーションに対して発生する少額の月額料金で、S3 Intelligent-Tiering を使用してアクセスパターンをモニタリングし、30 日間連続してアクセスされていないオブジェクトを低頻度アクセス階層に自動的に移動させ、ストレージコストを最大 40% 削減することができます。90 日間連続してアクセスがない場合、オブジェクトはアーカイブインスタントアクセス階層に移動し、ストレージコストを最大 68% 節約できます。S3 Intelligent-Tiering では、パフォーマンスへの影響はなく、取り出し料金は発生しません。低頻度アクセス階層またはアーカイブインスタントアクセス階層にあるオブジェクトに後でアクセスすると、そのオブジェクトは高頻度アクセス階層に自動的に戻されます。非同期にアクセス可能なデータのストレージコストを最小にするには、追加のアーカイブ機能をアクティブ化することを選択できます。非同期アーカイブアクセス階層の 1 つまたは両方を有効にすると、S3 Intelligent-Tiering は、最低 90 日間アクセスされなかったオブジェクトをアーカイブアクセス階層に移動させて、最大 71% を節約し、180 日間アクセスされなかったオブジェクトをディープアーカイブアクセス階層に移動させて、ほとんどアクセスされないオブジェクトに対して最大 95% を節約します。オプションのアーカイブアクセス階層またはディープアクセス階層にあるオブジェクトが後で復元されると、そのオブジェクトは高頻度アクセス階層に戻され、オブジェクトを取り出す前に、まず RestoreObject を使ってオブジェクトを復元する必要があります。アーカイブされたオブジェクトの復元については、アーカイブされたオブジェクトの復元をご参照ください。S3 Intelligent-Tiering には取り出し料金は発生しません。S3 Intelligent-Tiering ストレージクラスのアクセス階層間でオブジェクトを移動させるときに追加の階層化料金もしくはライフサイクル料金は発生しません。

S3 Intelligent-Tiering には最小オブジェクトサイズはありませんが、128 KB 未満のオブジェクトは自動階層化の対象にはなりません。これらの小さいオブジェクトは S3 Intelligent-Tiering に保存できますが、常に高頻度アクセス階層料金で課金され、モニタリング料金やオートメーション料金は発生しません。新しく作成されたデータのデフォルトのストレージクラスとして S3 Intelligent-Tiering を標準とする場合は、S3 PUT API リクエストヘッダーで INTELLIGENT-TIERING を指定してアプリケーションを変更できます。S3 Intelligent-Tiering は 99.9% の可用性と 99.999999999% の耐久性を実現するよう設計されており、S3 Standard と同等の低レイテンシーかつ高スループットのパフォーマンスを自動的に提供します。AWS Cost Explorer を使用して、アーカイブインスタントアクセスティアからの追加の節約を測定できます。

これで、S3 Intelligent-Tiering を、事実上すべてのワークロード、特にデータレイク、データ分析、機械学習、新しいアプリケーション、およびユーザー生成コンテンツのデフォルトのストレージクラスとして使用できます。S3 Intelligent-Tiering は、パフォーマンスへの影響、取得費用、運用上のオーバーヘッドなしに、アクセス頻度に基づいてデータを最も費用効果の高いアクセスティアに自動的に移動することにより、きめ細かいオブジェクトレベルでストレージコストを自動的に削減できる初めてのクラウドストレージです。データレイク、データ分析、新しいアプリケーションを含む、アクセスパターンが不明または変化するデータがある場合は、S3 Intelligent-Tiering の使用をお勧めします。すぐに取り出す必要のないデータがある場合は、ディープアーカイブアクセス階層をアクティブ化することをお勧めします。この階層では、長期間にわたってほとんどアクセスされなくなる可能性のあるデータに対して、1 TB あたり 1 USD/月という低料金をお支払いいただきます。S3 Intelligent-Tiering は、アクセスパターンが不明または変化するデータ向きです。S3 Intelligent-Tiering ストレージクラスをご利用の場合は、取り出し料金はかかりません。

S3 Intelligent-Tiering は、パフォーマンスに影響を与えることなく、ストレージコストを自動的に最適化します。S3 Intelligent-Tiering の高頻度アクセス階層、低頻度アクセス階層、アーカイブインスタントアクセス階層は、ミリ秒単位のレイテンシーと高スループットのパフォーマンスを実現します。

非同期アクセスが可能なデータについては、オプションのアーカイブアクセス階層のパフォーマンスは S3 Glacier Flexible Retrieval と同じで、ディープアーカイブアクセス階層のパフォーマンスは S3 Glacier Deep Archive ストレージクラスと同じです。非同期アーカイブ機能をアクティブ化するのは、アプリケーションが数分から数時間待つことができる場合のみにしてください。取得するオブジェクトがアーカイブアクセス階層またはディープアーカイブアクセス階層に保存されている場合、オブジェクトを取得する前に、まず RestoreObject を使用してオブジェクトを復元する必要があります。アーカイブされたオブジェクトの復元については、アーカイブされたオブジェクトの復元をご覧ください。アーカイブアクセス階層のオブジェクトは、3〜5 時間以内に高頻度アクセス階層に移動され、オブジェクトがディープアーカイブアクセス階層にある場合は 12 時間以内に移動されます。アーカイブアクセス階層のオブジェクトへのより高速なアクセスが必要な場合は、コンソールで迅速な取得速度オプションを選択してその料金を支払うことで、より高速に取り出すことができます。

S3 Intelligent-Tiering は S3 Standard ストレージクラスと同様、99.999999999% の耐久性を実現するよう設計されています。S3 Intelligent-Tiering は、99.9% の可用性を提供するよう設計されており、サービスレベルアグリーメントには、任意の請求サイクルで、可用性が当社のサービス契約を下回る場合、サービスクレジットが提供されることが定められています。

S3 Intelligent-Tiering にデータを保存する方法は 2 つあります。S3 Intelligent-Tiering に直接 PUT するには、x-amz-storage-class ヘッダーに INTELLIGENT_TIERING を指定するか、S3 Standard または S3 Standard-IA から S3 INTELLIGENT_TIERING にオブジェクトを移行するライフサイクルポリシーを設定します。

S3 Intelligent-Tiering では、1 か月あたりのストレージ、リクエスト、データ転送に対して料金を請求し、さらにオブジェクトごとのモニタリングとオートメーションに対して少額の月額料金を請求します。S3 Intelligent-Tiering ストレージクラスは、オブジェクトを S3 Standard ストレージ料金で提供された高頻度アクセス階層、S3 Standard-Infrequent Access ストレージ料金で提供された低頻度アクセス階層、S3 Glacier Instant Retrieval ストレージ料金で提供されたアーカイブインスタントアクセス階層の 3 つのアクセス階層に自動的に保存します。また、S3 Intelligent-Tiering には、非同期アクセス用に設計された 2 つのオプションのアーカイブ階層があります。アーカイブアクセス階層は S3 Glacier Flexible Retrieval ストレージ料金で、ディープアーカイブアクセス階層は S3 Glacier Deep Archive ストレージ料金で提供されます。

S3 Intelligent-Tiering は、わずかなモニタリングおよびオートメーション費用で、低レイテンシーおよび高スループットのアクセス階層を介してアクセスパターンをモニタリングし、オブジェクトを自動的に移動させられます。また、2 つのオプトイン非同期アーカイブアクセス階層も用意されており、非同期にアクセスできるデータに対して、お客様にクラウドで最も低いストレージコストを実現します。

S3 Intelligent-Tiering には請求可能な最小オブジェクトサイズはありませんが、128 KB 未満のオブジェクトは自動階層化の対象にはなりません。これらの小さなオブジェクトはモニタリングされず、常に高頻度アクセス階層料金で課金され、モニタリング料金やオートメーション料金は発生しません。S3 Intelligent-Tiering のアーカイブアクセス階層またはディープアーカイブアクセス階層にアーカイブされたオブジェクトごとに、Amazon S3 はオブジェクトの名前とその他のメタデータに 8 KB のストレージを使用し (S3 Standard ストレージレートで請求)、インデックスと関連メタデータに 32 KB のストレージを使用します (S3 Glacier Flexible Retrieval および S3 Glacier Deep Archive のストレージ料金で請求)。

いいえ。S3 Intelligent-Tiering には取り出し料金は発生しません。S3 Intelligent-Tiering は、お客様のデータのアクセスパターンをモニタリングし、低頻度アクセス階層、アーカイブインスタントアクセス階層、または非同期アーカイブ階層のオブジェクトにアクセスした場合、S3 Intelligent-Tiering は自動的にそのオブジェクトを高頻度アクセス階層に移動させます。

アーカイブ階層またはディープアーカイブアクセス階層のオブジェクトにアクセスするには、復元リクエストを発行する必要があります。発行すると、オブジェクトはすべて S3 Intelligent-Tiering ストレージクラス内の高頻度アクセス階層に戻り始めます。アーカイブアクセス階層のオブジェクトは 3〜5 時間以内に高頻度アクセス階層に移動され、ディープアーカイブアクセス階層のオブジェクトは 12 時間以内に高頻度アクセス階層に移動されます。オブジェクトが高頻度アクセス階層に入ると、GET リクエストを発行してオブジェクトを取得できます。

Amazon S3 インベントリで、S3 Intelligent-Tiering ストレージクラスに格納されているオブジェクトのアクセス階層をレポートできます。Amazon S3 インベントリは、オブジェクトとそれに対応するメタデータを一覧表示する CSV、ORC、または Parquet 出力ファイルを S3 バケットまたは共有プレフィックスに毎日または毎週提供します。オブジェクトに対して HEAD リクエストを作成して、S3 Intelligent-Tiering アーカイブアクセス階層を報告することもできます。

はい。S3 Intelligent-Tiering の高頻度アクセス階層、低頻度アクセス階層、アーカイブインスタントアクセス階層から S3 One-Zone Infrequent Access、S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive へオブジェクトをライフサイクルすることができます。また、S3 Intelligent-Tiering のオプションのアーカイブアクセス階層から S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive へ、および S3 Intelligent-Tiering ディープアーカイブアクセス階層から S3 Glacier Deep Archive へ、オブジェクトをライフサイクルさせることができます。

ありません。S3 Intelligent-Tiering ストレージクラスには、最小ストレージ期間はありません。

ありません。S3 Intelligent-Tiering ストレージクラスには請求可能な最小オブジェクトサイズはありませんが、128 KB 未満のオブジェクトは自動階層化の対象にはなりません。これらの小さなオブジェクトは、常に高頻度アクセス階層料金で課金され、モニタリング料金やオートメーション料金は発生しません。S3 Intelligent-Tiering のオプトインアーカイブアクセス階層またはディープアーカイブアクセス階層にアーカイブされたオブジェクトごとに、Amazon S3 はオブジェクトの名前とその他のメタデータに 8 KB のストレージを使用し (S3 Standard ストレージレートで請求)、インデックスと関連メタデータに 32 KB のストレージを使用します (S3 Glacier Flexible Retrieval および S3 Glacier Deep Archive のストレージ料金で請求)。詳細については、Amazon S3 の料金ページにアクセスしてください。

S3 Standard

すべて開く

Amazon S3 Standard は、ミリ秒単位のアクセスレイテンシーと高スループットのパフォーマンスを備えた耐久性のあるストレージを、アクセス頻度の高い (通常月に 1 回以上) データに提供します。S3 Standard は、データレイク、クラウドネイティブアプリケーション、動的ウェブサイト、コンテンツ配信、モバイルおよびゲームアプリケーション、分析、機械学習モデルなど、パフォーマンスが重視されるユースケース向けに設計されています。S3 Standard は、特定の 1 年間において、複数のアベイラビリティーゾーンにわたる 99.99% のデータ可用性と、オブジェクトの 99.999999999% の耐久性を実現するように設計されています。S3 ライフサイクルポリシーを使用して、アプリケーションを変更することなく、S3 Standard と低コストのストレージクラスの間でデータを移行するタイミングを正確に制御することができます。

S3 Standard は、ミリ秒単位でのアクセスと高スループットのパフォーマンスが求められる、アクセス頻度や変更頻度の高いデータに最適です。S3 Standard は、取り出し料金が発生しないため、頻繁に読み書きされるデータに最適です。S3 Standard は、データレイク、クラウドネイティブアプリケーション、動的ウェブサイト、コンテンツ配信、モバイルやゲームアプリケーション、分析など、さまざまなユースケースに最適です。

S3 Express One Zone

すべて開く

Amazon S3 Express One Zone は、レイテンシーの影響を極めて受けやすいアプリケーションのために 1 桁ミリ秒の一貫したデータアクセスを提供することを目的として構築された、高性能な単一アベイラビリティーゾーン Amazon S3 ストレージクラスです。Amazon S3 Express One Zone は、現在利用可能な極めてレイテンシーの低いクラウドオブジェクトストレージクラスであり、データアクセス速度は Amazon S3 Standard よりも最大 10 倍速く、リクエストコストは最大 80% 低くなっています。 S3 Express One Zone では、データを保存する AWS リージョン内の特定の AWS アベイラビリティーゾーンを選択できます。パフォーマンスをさらに最適化するために、ストレージおよびコンピューティングリソースを同じアベイラビリティーゾーン内にともに配置することを選択できます。

S3 Express One Zone は、遅延の影響を受けやすいアプリケーションで最速のデータアクセス速度と最高のパフォーマンスを必要とするアプリケーションに最適なストレージクラスです。S3 Express One Zone は、機械学習 (ML) のトレーニングや推論、インタラクティブな分析、メディアコンテンツの作成など、要求の多い操作に最適なストレージクラスです。

まず、選択した AWS アベイラビリティーゾーン (AZ) に S3 ディレクトリバケットを作成します。パフォーマンスをさらに最適化するために、ストレージを同じ AZ 内のコンピューティングリソースと同じ場所に配置することもできます。ディレクトリバケットでは、デフォルトで S3 ブロックパブリックアクセスが有効になっています。ディレクトリバケットを作成したら、オブジェクトを S3 Express One Zone ストレージクラスに直接アップロードするか、既存の S3 ストレージクラスから S3 Express One ゾーンにオブジェクトをコピーできます。また、AWS マネジメントコンソールでワンクリックで S3 Express One Zone にデータをインポートしたり、S3 バッチオペレーションを使用してバケット全体、プレフィックス、またはデータのサブセットを既存の S3 ストレージクラスから S3 Express One Zone にコピーすることもできます。

ディレクトリバケットを作成した後、インポートオプションを使用して S3 コンソール経由で同じ AWS リージョン内のデータを S3 Express One Zone ストレージクラスにインポートできます。インポートでは、コピーするオブジェクトをすべて個別に指定しなくても、データをインポートするプレフィックスまたはバケットを選択できるため、S3 ディレクトリバケットへのデータのコピーが簡単になります。S3 バッチオペレーションは、選択したプレフィックスバケットまたは汎用バケットにオブジェクトをコピーします。S3 バッチオペレーションジョブの詳細ページからインポートコピージョブの進行状況を監視できます。

S3 Express One Zone オブジェクトは、選択した単一の AWS アベイラビリティーゾーン (AZ) に保存されます。オブジェクトを 1 つのゾーンに格納すると、データをコンピューティングのローカルに保存してレイテンシーを最小限に抑えることができます。レイテンシーは増大しますが、複数のアベイラビリティーゾーンからデータにアクセスできます。

S3 Express One Zone は、他の S3 ストレージクラスと同様のパフォーマンス伸縮性を提供しますが、最初のバイトの読み取り/書き込みリクエストレイテンシーは一貫して 1 桁ミリ秒で、既存の S3 ストレージクラスよりも最大 10 倍高速です。S3 Express One Zone を使用すると、お客様は容量やスループットの要件を事前に計画またはプロビジョニングする必要がなく、要求が桁違いに早く完了するというメリットがすぐに得られます。S3 Express One Zone は、ストレージレイテンシーによってジョブの完了時間が短縮され、全体的な TCO が削減される分析ジョブに最適です。また、クリエイティブプロフェッショナルが S3 データに可能な限り応答性の高いアクセスを必要とする、動画編集などのインタラクティブなワークロードにも最適です。

S3 Express One Zone は独自のアーキテクチャを使用してパフォーマンスを最適化し、常に低いリクエストレイテンシーを実現します。S3 Express One Zone はデータを高性能ハードウェアに保存し、そのオブジェクトプロトコルは認証とメタデータのオーバーヘッドを効率化するように強化されています。さらに、アクセス速度をさらに向上させ、1 秒あたり最大 200 万件のリクエストをサポートするために、データは新しいバケットタイプ、すなわち、Amazon S3 ディレクトリバケットに保存されます。 S3 Express One Zone では、データを保存する AWS リージョン内の特定の AWS アベイラビリティーゾーンを選択できます。パフォーマンスをさらに最適化するために、ストレージおよびコンピューティングリソースを同じアベイラビリティーゾーン内にともに配置することを選択できます。

各 S3 ディレクトリバケットは、バケット内のディレクトリ数にかかわらず、S3 ディレクトリバケットごとに 1 秒あたり最大 200 万回の読み取りと最大 20 万回の書き込みをサポートできます。デフォルトでは、各 S3 ディレクトリバケットは、1 秒あたり最大 20 万回の読み取りと最大 10 万回の書き込みをサポートします。ワークロードでデフォルトの TPS 制限を超える処理が必要な場合は、AWS サポートを通じて制限の引き上げをリクエストできます。

3 か月以上リクエストアクティビティがない S3 ディレクトリバケットは、非アクティブ状態に移行します。非アクティブな状態では、ディレクトリバケットは一時的に読み取りや書き込みができなくなります。非アクティブなバケットには、すべてのストレージ、オブジェクトメタデータ、バケットメタデータが保持されます。非アクティブなバケットには既存のストレージ料金が適用されます。非アクティブなバケットへのアクセスリクエストにより、バケットは通常数分以内にアクティブな状態に移行します。この移行期間中、読み取りと書き込みを行うと 503 SlowDown エラーコードが返されます。

S3 Express One Zone は、他の Amazon S3 ストレージクラスと同等の高い、伸縮自在なスループットを提供します。S3 Express One Zone は、個々のお客様がスループットを非常に高い総レベルにまで引き上げることができるようにゼロから設計されています。たとえば、機械学習モデルトレーニングアプリケーションでは、数百万のオブジェクトとペタバイトのデータに対してトレーニングを行うことができます。これらのリクエストを別々の接続に分散させて、アクセス可能な帯域幅を最大化することで、最高のパフォーマンスを実現できます。

S3 Express One Zone では、新しいセッションベースのメカニズムである S3 CreateSession を使用してリクエストを認証および承認します。このメカニズムは、レイテンシーを最小限に抑えるように最適化されています。CreateSession を使用して、バケットへの低レイテンシーアクセスを提供する一時的な認証情報をリクエストできます。これらの一時的な認証情報は、特定の S3 ディレクトリバケットに限定されます。このセッションベースモデルの詳細については、開発者ガイドの「S3 Create Session」をご覧ください。

S3 Express One Zone は、単一のアベイラビリティーゾーン内で 99.95% の可用性を実現するように設計されており、可用性 SLA は 99.9% です。

S3 Express One Zone では、データは単一の AZ 内の複数のデバイスに冗長的に保存されます。当サービスは、冗長性の喪失を素早く検出して修復することによって、デバイスの障害が同時に発生することを防ぐよう設計されています。つまり、既存のデバイスに障害が発生した場合、S3 Express One Zone はリクエストを AZ 内の新しいデバイスに自動的にシフトします。この冗長性により、AZ 内のデータへのアクセスが中断されることはありません。

S3 Express One Zone の利用を開始するためのセットアップ料金や契約はありません。S3 Express One Zone では、ストレージとリクエストの料金を請求します。1 か月あたりに請求されるストレージ容量は、1 か月あたりのギガバイト数 (GB-月) で測定される、1 時間あたりの合計ストレージ使用量に基づいて計算されます。また、リクエストタイプ (PUT や GET など) に基づいて、リクエストあたりのアクセス料金がかかります。データのアップロードと取得には、GB あたりの追加料金がかかります。例 1:
S3 Express One Zone に 10 GB のデータを 30 日間保存し、合計で 100 万回の書き込みと 900 万回の読み取りを行い、10 KB のリクエストサイズで Athena でアクセスしたとします。その後、30 日の終わりまでに 1,000,000 個のファイルを削除します。バケットが米国東部 (バージニア北部) リージョンにあると仮定した場合、リクエスト料金は以下のように計算されます: ストレージの料金
バイト-時間の合計使用量 =10 GB-月
合計ストレージコスト = 10 GB-月 x 0.11 USD = 1.10 USD リクエスト料金
1,000,000 件の PUT リクエスト: 1,000,000 件のリクエスト x 0.00113 USD/1,000 = 1.13 USD
9,000,000 件の GET リクエスト: 9,000,000 件のリクエスト x 0.00003 USD/1,000 = 0.27 USD
1,000,000 件の DELETE リクエスト = 1,000,000 件のリクエスト x 0.00 USD (無料) = 0 USD データアップロード料金: 10 KB / 1,048,576 x 1,000,000 x 0.0032 USD = 0.03 USD
データ取得料金: 10 KB / 1,048,576 x 9,000,000 x 0.0006 USD = 0.05 USD
合計料金 = 1.10 USD + 1.13 USD + 0.27 USD + 0.03 USD + 0.05 USD = 2.58 USD 例 2:
毎日 8 時間のワークロードのために、機械学習トレーニング用に 10 TB のデータを保存し、その後にそのデータを削除したとします。8 時間のワークロードでは、2 MB のリクエストサイズに対して 5,242,880 回の書き込みと 10,485,760 回の読み取りを行います。これを 30 日間 (1 か月) 行います。ストレージ料金
バイト-時間の合計使用量 = [10,995,116,277,760 バイト x 30 日間 x (8 時間/日)] = 2,638,827,906,662,400 バイト-時間 = 3303.77 GB-月
合計ストレージコスト = 3303.77 GB x 0.11 USD = 363.41 USD リクエスト料金
5,242,880 件の PUT リクエスト/日: 5,242,880 件のリクエスト x 30 x 0.00113 USD/1,000 = 177.73 USD
10,485,760 件の GET リクエスト/日: 10,485,760 件のリクエスト x 30 x 0.00003 USD/1,000 = 9.44 USD
5,242,880 件の DELETE リクエスト/日: 5,242,880 件のリクエスト x 0.00 USD (無料) = 0 USD データアップロード料金: 2MB/1024 x 5,242,880 x 30 x 0.0032 USD = 983.04 USD
データ取得料金: 2MB/1,024 x 10,485,760 x 30 x 0.0006 USD = 368.64 USD
合計料金 = 363.41 USD + 177.73 USD + 9.44 USD + 983.04 USD + 368.64 USD = 1,902.26 USD

S3 Express One Zone のデータにアクセスするためのリクエスト料金には、リージョン内の AWS ネットワーク内でデータを転送するコストが含まれます。Amazon EC2 (または任意の AWS サービス) と S3 Express One Zone 間で転送されるデータ (例えば、米国東部 (バージニア北部) リージョン内で転送されるデータ) には、追加のデータ転送料金はかかりません。

S3 Express One Zone のデータにアクセスするためのリクエスト料金には、ゲートウェイ VPC エンドポイントの使用料金が含まれており、S3 Express One Zone でゲートウェイエンドポイントを使用する場合に追加料金はかかりません。

S3 Standard-Infrequent Access (S3 Standard-IA)

すべて開く

Amazon S3 Standard-Infrequent Access (S3 Standard-IA) は、低頻度でアクセスされるものの、必要なときにすぐにアクセスできることが必要なデータのための Amazon S3 ストレージクラスです。S3 Standard–IA は、Amazon S3 Standard ストレージクラスと同じ高い耐久性、スループット、低レイテンシーを低価格のストレージ料金 (GB 単位) および取り出し料金 (GB 単位) で提供します。低コストかつ高パフォーマンスのこの組み合わせは、S3 Standard – IA を長期ストレージ、バックアップ、災害対策のためのデータ保存として理想的なものにします。S3 Standard-IA ストレージクラスはオブジェクトレベルで設定され、S3 Standard または S3 One Zone-IA ストレージクラスとして同じバケットに存在できるため、S3 ライフサイクルポリシーを使用して、アプリケーションの変更をすることなくストレージクラス間のオブジェクトの移行を自動的に行えます。

S3 Standard-IA は、低頻度でアクセスされるものの、必要なときにすぐにアクセスできることが必要なデータに適しています。S3 Standard-IA は長期間のファイル格納、古い同期および共有ストレージ、その他の古いデータに最適です。

S3 Standard-IA は、S3 Standard ストレージクラスと同じミリ秒単位のレイテンシーと高スループットのパフォーマンスを提供します。

S3 Standard-IA への入力方法は 2 つあります。x-amz-storage-class ヘッダーに STANDARD_IA を指定することで、S3 標準 – 低頻度アクセスに直接 PUT することができます。また、オブジェクトを S3 Standard から S3 Standard-IA に移行するライフサイクルポリシーを設定することもできます。

S3 Standard (宛先ストレージクラス) のコピーリクエストと S3 Standard-IA (ソースストレージクラス) のデータ取り出しには料金が発生します。詳細については、Amazon S3 の料金のページにアクセスしてください。

S3 Standard-IA は、長期間使用し、頻繁にアクセスしないデータを月単位や年単位にわたって保持するために設計されています。S3 標準 – IA からデータが 30 日以内に削除される場合、30 日分の料金を請求されることになります。S3 Standard-IA の料金に関する情報については、Amazon S3 の料金のページをご覧ください。

S3 Standard-IA は大オブジェクト用に設計され、最小オブジェクトストレージ料金は 128KB です。128 KB 未満のサイズのオブジェクトには、128 KB のオブジェクトのストレージ料金が発生します。例えば、S3 Standard – IA にある 6 KB のオブジェクトには、6 KB の S3 標準 – IA ストレージ料金と、S3 標準 – IA ストレージ料金の 122 KB と同等の、追加の最小オブジェクトサイズ料金が発生します。S3 Standard-IA の料金に関する情報については、Amazon S3 の料金のページをご覧ください。

はい。ライフサイクルポリシーを使用して S3 Standard から S3 Standard-IA にオブジェクトを移行するほかに、S3 Standard-IA から S3 One Zone-IA、S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive ストレージクラスにオブジェクトを階層化するライフサイクルポリシーを設定することもできます。

S3 One Zone-Infrequent Access (S3 One Zone-IA)

すべて開く

S3 1 ゾーン – 低頻度アクセスストレージクラスはひとつのアベイラビリティーゾーンにオブジェクトを保存するよう選択できる Amazon S3 ストレージクラスです。S3 1 ゾーン – 低頻度アクセスストレージはそのひとつのアベイラビリティーゾーンにデータを冗長的に保存し、地理的に冗長性があって、複数の地理的に離れたアベイラビリティーゾーンににわたって冗長にデータを保存する S3 標準 – 低頻度アクセスストレージに比べて 20% 少ないコストでストレージを得られます。S3 1 ゾーン – IA は、アベイラビリティ―が 99% の SLA と、アベイラビリティーゾーン内でイレブンナインの耐久性を提供します。ただし、S3 1 ゾーン – IA ストレージクラスのデータは、アベイラビリティーゾーン全体の物理的な消失に対して回復力がありません。S3 1 ゾーン – IA ストレージは、S3 標準および S3 標準 – IA と同じ Amazon S3 の特徴を提供し、Amazon S3 API、CLI、およびコンソールを通じて使用されます。S3 1 ゾーン – 低頻度アクセスストレージクラスはオブジェクトレベルでセットされ、S3 標準と S3 標準 – 低頻度アクセスストレージクラスと同じバケットに存在できます。S3 ライフサイクルポリシーを使って、アプリケーションの変更を伴わずに、ストレージクラス間でオブジェクトを自動的に移行できます。

S3 One Zone-IA は、バックアップコピー、ディザスタリカバリ用コピー、またはその他の容易に作成できるデータなどの低頻度アクセス用のストレージとしてお使いいただけます。

S3 One Zone-IA ストレージクラスは S3 Standard と S3 Standard-Infrequent Access ストレージクラスと同じレイテンシーとスループットパフォーマンスを提供します。

S3 One Zone-IA ストレージクラスは 1 つのアベイラビリティーゾーン内で 99.999999999% の耐久性を実現するように設計されています。ただし、S3 1 ゾーン – IA ストレージクラスのデータは、可用性の喪失またはアベイラビリティーゾーンの物理的な消失に対して回復力がありません。これに対して、S3 Standard、S3 Intelligent-Tiering、S3 Standard-Infrequent Access、S3 Glacier ストレージクラスはアベイラビリティーの損失やアベイラビリティーゾーンの壊滅にも耐えるように設計されています。S3 One Zone-IA はほとんどの最新の物理データセンターと同等以上の耐久性とアベイラビリティーを提供し、しかもストレージの伸縮性の利点に Amazon S3 の数々の特徴を備えています。

はい。各 AWS リージョンは別個の地理的領域です。1 つのリージョンに複数のそれぞれ独立したロケーションがあり、このロケーションを「アベイラビリティーゾーン」といいます。Amazon S3 One Zone-IA ストレージクラスは、リージョン内の個々の AWS アベイラビリティーゾーンを使用します。

各アベイラビリティーゾーンでは冗長な電源とネットワーキングを使います。AWS リージョン内では、異なるアベイラビリティーゾーンは異なる洪水域、地震断層帯にあり、火災から守るために地理的にも離れています。S3 標準と S3 標準 – IA ストレージクラスはこれらの災害に対して、お客様のデータを複数のアベイラビリティーゾーンに冗長に保存することで保護しています。S3 1 ゾーン – IA は、アベイラビリティーゾーン内の機器障害に対する保護を提供しますが、データは、地震や洪水などの災害に起因するアベイラビリティーゾーンの物理的な消失に対して回復力がありません。S3 One Zone-IA、S3 Standard、S3 Standard-IA から適宜選択することで、お客様は、ストレージのニーズに最適な耐久性と可用性のあるストレージクラスを選べます。

Amazon S3 Glacier Instant Retrieval ストレージクラス

すべて開く

S3 Glacier Instant Retrieval ストレージクラスは、アクセスされることがほとんどなく、ミリ秒単位の取得が必要な、長期間有効なデータ用に最低コストのストレージを提供します。S3 Glacier Instant Retrieval は、S3 Standard および S3 標準 – IA ストレージクラスと同じスループットとミリ秒でのアクセスによる、アーカイブストレージへの最速のアクセスを提供します。S3 Glacier Instant Retrieval は、物理的に分離された最低 3 つの AWS アベイラビリティーゾーンにデータを冗長的に保存することにより、99.999999999% (11 9s) のデータの耐久性と 99.9% の可用性を実現できるように設計されています。

S3 Glacier Instant Retrieval は、滅多にアクセスされない (四半期に一度)、ミリ秒単位の取り出し時間が必要なデータがある場合に最適です。S3 Standard-IA と同じ低レイテンシー、高スループットのパフォーマンスを求めつつ、S3 Standard-IA よりもアクセス頻度の低いデータを保存し、ストレージ料金は低く、データアクセスコストは若干高くなる場合に最適なストレージクラスです。

S3 Glacier Instant Retrieval は、S3 Standard-IA と同様に、99.999999999% (イレブンナイン) の耐久性と 99.9% の可用性を実現するよう設計されており、任意の請求サイクルにおいても可用性が 99% を下回った場合にはサービスクレジットを提供するサービスレベルアグリーメントが適用されます。

S3 Glacier Instant Retrieval は、S3 Standard および S3 Standard-IA ストレージクラスと同様に、ミリ秒単位のレイテンシーと高スループットのパフォーマンスを提供します。非同期アクセス用に設計された S3 Glacier Flexible Retrieval や S3 Glacier Deep Archive ストレージクラスとは異なり、S3 Glacier Instant Retrieval に保存されたオブジェクトにアクセスする前に Restore リクエストを発行する必要はありません。

S3 Glacier Instant Retrieval へのデータの入力方法は 2 つあります。x-amz-storage-class ヘッダーに GLACIER_IR を指定して S3 Glacier Instant Retrieval に直接 PUT するか、S3 Standard または S3 Standard-IA から S3 Glacier Instant Retrieval にオブジェクトを移行する S3 ライフサイクルポリシーを設定することができます。

S3 Glacier Instant Retrieval は、長期間使用し、ほとんどアクセスしないデータを月単位や年単位にわたって保持するために設計されています。S3 Glacier Instant Retrieval にアーカイブされたオブジェクトの保存期間は最低で 90 日間です。90 日が経過する前にオブジェクトが削除、上書き、移行された場合、その 90 日の残りのストレージ料金が日割りで請求されます。Amazon S3 Glacier Instant Retrieval の料金に関する情報については、Amazon S3 の料金のページをご覧ください。

S3 Glacier Instant Retrieval は大オブジェクト用に設計され、最小オブジェクトストレージ料金は 128 KB です。128 KB 未満のサイズのオブジェクトには、128 KB のオブジェクトのストレージ料金が発生します。例えば、S3 Glacier Instant Retrieval にある 6 KB のオブジェクトには、6 KB の S3 Glacier Instant Retrieval ストレージ料金と、S3 Glacier Instant Retrieval ストレージ料金の 122 KB と同等の、追加の最小オブジェクトサイズ料金が発生します。Amazon S3 Glacier Instant Retrieval の料金に関する情報については、Amazon S3 の料金のページをご覧ください。

S3 Glacier Instant Retrieval は、毎月のストレージ、リクエストタイプに応じたリクエスト、データの取り出しに対して課金されます。ある月の請求対象となるストレージの量は、その月全体の使用ストレージの平均に基づいて決定され、月あたりのギガバイト「GB-月」単位で表します。PUT、COPY、GET などのリクエストタイプに応じて、リクエストに対して課金されます。また、返されたデータのギガバイトごとに、GB あたりの料金が発生します。

Amazon S3 Glacier Flexible Retrieval ストレージクラス

すべて開く

S3 Glacier Flexible Retrieval ストレージクラスは、1 年に 1〜2 回アクセスされ、無料の一括検索で非同期で取り出されるアーカイブデータに対して、(S3 Glacier Instant Retrieval よりも) 最大 10% 低いコストのストレージを提供します。バックアップやディザスタリカバリのユースケースなど、すぐにアクセスする必要はないものの、大量のデータを無料で取り出せる柔軟性が必要なアーカイブデータにとって、S3 Glacier Flexible Retrieval は理想的なストレージクラスです。S3 Glacier Flexible Retrieval は、コストと数分から数時間のアクセス時間、および無料の一括検索とのバランスをとる、最も柔軟性が高い取り出しオプションを提供します。バックアップ、災害対策、オフサイトのデータストレージのニーズ、および一部のデータを数分で取り出す必要があり、コストの心配をしたくない場合に理想的なソリューションです。S3 Glacier Flexible Retrieval は、特定の 1 年間に、物理的に分離された複数の AWS アベイラビリティーゾーンにデータを冗長的に保存することにより、99.999999999% (11 9s) のデータの耐久性と 99.99% の可用性を実現できるように設計されています。

バックアップやディザスタリカバリのユースケースなど、すぐにアクセスする必要はないものの、大量のデータを無料で取り出せる柔軟性が必要なアーカイブデータにとって、S3 Glacier Flexible Retrieval は理想的なストレージクラスです。S3 Glacier Flexible Retrieval は、コストと数分から数時間のアクセス時間、および無料の一括検索とのバランスをとる、最も柔軟性が高い取り出しオプションを提供します。バックアップ、ディザスタリカバリ、オフサイトのデータストレージのニーズ、および一部のデータを数分で取り出す必要があり、データを取り出すためのコストの心配をしたくない場合に理想的なソリューションです。

S3 Glacier Flexible Retrieval へのデータの入力方法は 2 つあります。x-amz-storage-class ヘッダーに GLACIER を指定することで、S3 Glacier Flexible Retrieval に直接 PUT することができます。また、S3 ライフサイクルルールを使用して、オブジェクトの年齢に基づいて、アクティブデータの S3 ストレージクラス (S3 Standard、S3 Intelligent-Tiering、S3 標準 – IA、S3 1 ゾーン – IA、S3 Glacier Instant Retrieval) から Amazon S3 Glacier Flexible Retrieval にオブジェクトを転送することができます。Amazon S3 マネジメントコンソール、AWS SDK、または Amazon S3 API を使用して、Amazon S3 Glacier に直接 PUT したり、アーカイブのルールを定義したりします。

注: S3 Glacier Flexible Retrieval は、オリジナルのダイレクト Glacier API や Amazon S3 Glacier マネジメントコンソールからも利用できます。ライフサイクル管理、S3 Replication、S3 ストレージレンズなどを含む完全な S3 機能セットへのアクセスを含む強化されたエクスペリエンスのためには、S3 API と S3 マネジメントコンソールを使用して S3 Glacier 機能を使用することをお勧めします。

S3 Glacier Flexible Retrieval にアーカイブされたオブジェクトは、非同期的にアクセスされます。S3 Glacier Flexible Retrieval に保存されているデータを取り出すには、Simple Storage Service (Amazon S3) API または Simple Storage Service (Amazon S3) コンソール経由で取り出しリクエストを起動します。取り出しリクエストはお客様のデータの一時的なコピーを S3 Standard ストレージクラスに作成し、一方アーカイブされたデータはそのまま S3 Glacier Flexible Retrieval に残しておきます。一時的なコピーを Simple Storage Service (Amazon S3) に保存しておく期間は日単位で指定できます。その後、アーカイブされたオブジェクトに対して Amazon S3 GET リクエストを使用すると、S3 内の一時的なコピーにアクセスできるようになります。低冗長化ストレージが S3 Standard よりも低価格の AWS リージョンでは、一時的に利用可能なデータは低冗長性ストレージとして請求されます。ただし、低冗長化請求ストレージクラスにはデータの保存方法が反映されません。復元通知では、オブジェクトが S3 Glacier Flexible Retrieval から正常に復元され、一時コピーが入手できるようになると、S3 イベント通知で通知されるようになりました。バケット所有者 (または IAM ポリシーで許可されている他のユーザー) は、通知が Amazon Simple Queue Service (SQS) または Amazon Simple Notification Service (SNS) に発行されるように設定できます。通知は、Lambda 関数で処理できるように AWS Lambda に配信することもできます。

取り出しジョブの処理では、まず Amazon S3 がリクエストしたデータが S3 Glacier Flexible Retrieval から取り出されます。次に、リクエストされたデータの一時的なコピーが Amazon S3 内に作成されます。これには通常、数分かかります。リクエストのアクセス時間は、選択したオプション ([迅速]、[標準]、または [大容量] 取り出し) によって異なります。最大オブジェクト (250 MB 以上) を除くすべてのオブジェクトについては、[迅速] 取り出しを使用してアクセスされるデータは通常 1～5 分で使用できるようになります。標準取り出しを使用して取り出されるオブジェクトは通常 3～5 時間で完了します。S3 バッチオペレーションを使用して開始すると、通常、標準取り出しは数分で開始されます。一括取り出しは通常、5～12 時間以内に完了し、無料でご利用いただけます。S3 Glacier Flexible Retrieval のオプションの詳細については、S3 ユーザーガイドのアーカイブされたオブジェクトの復元を参照してください。
S3 Glacier ストレージクラスプロビジョンドキャパシティーユニットを使用すると、所定の月の固定前払い料金を支払うことで、S3 Glacier Flexible Retrieval からの迅速な取得のための取得キャパシティーの可用性を確保できます。月ごとに、2 個のプロビジョンドキャパシティーユニットを購入して、取得できるデータの量を増やすことができます。容量単位ごとに、少なくとも 3 回の迅速取り出しを 5 分ごとに実行できることが保証され、最大 150 MB/秒の取り出しスループットが得られます。ワークロードが、データのサブセットに数分でアクセスできる高い信頼性と予測可能性を必要とする場合は、プロビジョンド取得キャパシティーを購入する必要があります。プロビジョンドキャパシティーがないと、需要が高い時期に迅速な取得ができない場合があります。いかなる状況下でも迅速な取得へのアクセスが必要な場合は、プロビジョンド取得キャパシティーの購入をお勧めします。
プロビジョンドキャパシティーは、Amazon S3 コンソール、プロビジョンドキャパシティーの購入、REST API、AWS SDK、または AWS CLI を使用して購入できます。プロビジョンドキャパシティーユニットは、購入した日時 (開始日) から 1 か月間持続します。ユニットの有効期限は、開始日からほぼ秒単位でちょうど 1 か月後になります。プロビジョンドキャパシティの料金に関する情報については、Amazon S3 の料金をご覧ください。

ある月の請求対象となるストレージの量は、その月全体の使用ストレージの平均に基づいて決定され、ギガバイト-月 (GB-月) 単位で表します。Amazon S3 では、保存されたデータの量に S3 Glacier データの 32 KB を加え、さらに 8 KB の Amazon S3 Standard ストレージクラスデータを加えることでオブジェクトサイズを計算します。S3 Glacier Flexible Retrieval では、データを特定して取り出しができるように、S3 Glacier のインデックスとメタデータに対してオブジェクトあたり 32 KB のデータがさらに必要とされます。Amazon S3 では、S3 Glacier Flexible Retrieval にアーカイブされるオブジェクトのユーザー定義名とメタデータを保存して維持するために 8 KB が必要です。これにより、S3 Glacier Flexible Retrieval を使用して保存したものを含む、すべての Amazon S3 オブジェクトのリアルタイムのリストを、Amazon S3 LIST API または S3 インベントリレポートを用いて取得できるようになります。たとえば、1 つあたり 1 GB のオブジェクトを 100,000 個アーカイブした場合、課金対象となるストレージは以下のようになります。
オブジェクト 1 つあたり 1.000032 GB x 100,000 個のオブジェクト = 100,003.2 GB の S3 Glacier ストレージ。
オブジェクト 1 つあたり 0.000008 GB x 100,000 個のオブジェクト = 0.8 GB の S3 Standard ストレージ。
この料金は、Amazon S3 の料金のページにある AWS リージョンの現在の料金に基づいて計算されます。追加の Amazon S3 の料金の例については、S3 の請求に関するよくある質問をご覧いただくか、AWS 料金見積りツールを使用してください。

S3 Glacier Flexible Retrieval にアーカイブされたオブジェクトは、最低 90 日間保存されます。90 日以前にオブジェクトが削除、上書き、移行された場合、残りの日数分の保管料と同額の日割り料金が発生します。

また、S3 Glacier Flexible Retrieval では、アーカイブされた各オブジェクトに対して 40 KB の追加メタデータが必要です。これには、データの特定と取り出しに必要な S3 Glacier Flexible Retrieval の料金で課金される 32 KB のメタデータが含まれます。そして、S3 Glacier Flexible Retrieval にアーカイブされたオブジェクトのユーザー定義名とメタデータを維持するために必要な S3 Standard レートで請求される追加の 8 KB のデータです。これにより、S3 LIST API または S3 インベントリレポートを使用して、すべての S3 オブジェクトのリアルタイムリストを取得できます。Amazon S3 Glacier Flexible Retrieval の料金情報については、Amazon S3 の料金のページをご覧ください。

S3 Glacier Flexible Retrieval からデータを取り出すには、Expedited、Standard、Bulk Retrievals の 3 つの方法があります。Expedited と Standard には、GB あたりの取り出し料金とリクエストあたりの料金があります (つまり、Amazon S3 オブジェクトに対して行われたリクエストに対して料金が発生します)。S3 Glacier Flexible Retrieval からの大容量取り出しは無料です。AWS リージョンによる S3 Glacier の料金の詳細は、Amazon S3 の料金のページにアクセスしてください。

Amazon S3 Glacier ストレージクラスは、データアーカイブ専用に設計されており、クラウドで最高のパフォーマンス、最高の検索の柔軟性、最低のコストのアーカイブストレージを提供します。さまざまなアクセスパターンやストレージ期間に最適化された 3 種類のアーカイブストレージクラスから選択できるようになりました。医療画像、ニュースメディアアセット、ゲノミクスデータなど、すぐにアクセスする必要のあるアーカイブデータであれば、ミリ秒レベルの取得時間で最低コストのストレージを提供するアーカイブストレージクラスである S3 Glacier Instant Retrieval ストレージクラスを選択できます。バックアップやディザスタリカバリのユースケースなど、すぐにアクセスする必要はないものの、大量のデータを無料で取得できる柔軟性が必要なアーカイブデータであれば、S3 Glacier Flexible Retrieval を選択すれば、数分での検索、または 5〜12 時間での無料での一括検索が可能です。コンプライアンスアーカイブやデジタルメディア保存などの長寿命のアーカイブストレージにかかるコストをさらに節約するには、S3 Glacier Deep Archive をお選びください。12 時間以内にデータを取得でき、クラウドで最も低コストのストレージです。

Amazon は、お客様のパフォーマンス、耐久性、可用性、およびセキュリティの成果を重視しています。ただし、この質問はお客様から頻繁に寄せられています。AWS では、現在の提供価格を可能にするさまざまなテクノロジーを使用しています。AWS のサービスは、AWS が開発したソフトウェアを使用し、専用のコスト最適化システムに特別に組み込まれた一般的なデータストレージテクノロジーを使用して構築されています。S3 Glacier ストレージクラスは、インプットとアウトプットのシーケンスを最適化し、基盤となるストレージへのアクセスの効率性を最大化する AWS の機能を活用しています。

Amazon S3 Glacier Deep Archive

すべて開く

S3 Glacier Deep Archive は Amazon S3 のストレージクラスで、年に 1、2 回アクセスされるデータの長期保持に向けて安全で耐久性の高いオブジェクトストレージを提供します。わずか 0.00099 USD/GB-月 (1 セントの 10 分の 1 未満、または約 1 USD/TB-月) から、S3 Glacier Deep Archive は最もコストが低いストレージをクラウドで提供します。この料金は、オンプレミスの磁気テープライブラリにデータを保持する場合やオフサイトにデータをアーカイブする場合よりも大幅に低額です。

S3 Glacier Deep Archive は、企業の極めて重要なデータアセットをオフラインで保護するための、または企業ポリシー、契約、規制コンプライアンスの要件に基づいてデータの長期保存が要求される場合の最適なストレージクラスです。特に金融サービス、医療、石油およびガス、公共部門など、規制が厳しい業界のお客様には、核となる知的財産、金融および医療の記録、研究結果、法的文書、地震探査結果、長期バックアップを保護するために S3 Glacier Deep Archive が最適な選択です。さらに、メディアやエンターテイメント企業などの組織は、核となる知的財産のバックアップコピーを保持したいと考えています。通常、S3 Glacier Deep Archive を使用するお客様はオンプレミスの磁気テープライブラリやオフプレミスのテープアーカイブサービスの利用を削減するか、中断できます。

S3 Glacier Deep Archive によって AWS のデータアーカイブサービスを拡張し、保存と取り出しのコスト、取り出し時間に基づいて最適なストレージクラスを選択することが可能となります。低コストのアーカイブデータにミリ秒単位でアクセスする必要がある場合に、S3 Glacier Instant Retrieval ストレージクラスを選択します。バックアップやディザスタリカバリのユースケースなど、すぐにアクセスする必要はないものの、大量のデータを無料で取得できる柔軟性が必要なアーカイブデータであれば、S3 Glacier Flexible Retrieval を選択すれば、数分での検索、または 5〜12 時間での無料での一括検索が可能です。それに対して S3 Glacier Deep Archive は、ほとんどアクセスされないものの、耐久性が高く、長期のストレージが必要なコールドデータに向けて設計されています。S3 Glacier Deep Archive は S3 Glacier Flexible Retrieval よりも最大 75% 安価で、標準取り出し階層で 12 時間以内にデータを取り出します。S3 バッチオペレーションを使用して標準取り出しを開始した場合、通常 9 時間以内に開始されます。また、48 時間以内にデータを取り出す大容量取り出しを選択することでも取り出しコストを削減できます。

S3 Glacier Deep Archive にデータを保存する最も簡単な方法は、S3 API を使用して直接データをアップロードすることです。ストレージクラスとして "S3 Glacier Deep Archive" を指定するだけです。これを実行するには、AWS マネジメントコンソール、S3 REST API、AWS SDK、AWS コマンドラインインターフェイスのいずれかを使用します。また、S3 ライフサイクルを使用してデータを移行するポリシーを作成することで S3 Glacier Deep Archive の使用を開始することもできます。これによってオブジェクトのライフサイクルを定義し、ストレージのコストを削減できます。これらのポリシーは、経過時間に基づいてオブジェクトを S3 Glacier Deep Archive に移行するように設定できます。S3 バケットに対して、または特定のプレフィックスに対してポリシーを設定できます。ライフサイクル移行は、S3 Glacier Deep Archive のアップロード料金で請求されます。AWS Storage Gateway のクラウドベースの仮想テープライブラリ機能である Tape Gateway が S3 Glacier Deep Archive と統合されました。これにより、仮想テープベースの長期バックアップとアーカイブを S3 Glacier Deep Archive に保存することが可能となり、クラウド内でこのデータに向けた最もコストの低いストレージとなります。利用を開始するには、AWS Storage Gateway コンソールまたは API を使用して新しい仮想テープを作成し、S3 Glacier Flexible Retrieval または S3 Glacier Deep Archive のいずれかにアーカイブストレージターゲットを設定します。バックアップアプリケーションがテープを放出すると、テープは選択したストレージターゲットにアーカイブされます。

既存のテープアーカイブから S3 Glacier Deep Archive にデータを移行するには複数の方法があります。AWS Tape Gateway を使用し、仮想テープライブラリ (VTL) インターフェイスを使用して既存のバックアップアプリケーションと統合できます。このインターフェイスが、バックアップアプリケーションに仮想テープを提供します。これらを使用して、すぐにデータを Amazon S3、S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive に保存できます。
AWS Snowball を使用してデータを移行することもできます。Snowball は、安全な転送のために設計された物理ストレージデバイスを使用して、AWS との間のテラバイトからペタバイト規模のデータの移動を加速します。Snowball を使用すると、ネットワークのコストが高い、転送時間が長い、セキュリティに懸念があるといった、大規模なデータ転送で直面する可能性のある課題を解決できます。最後に、AWS Direct Connect を利用して、自社の施設から AWS への専用ネットワーク接続を確立できます。多くの場合、Direct Connect によってネットワークのコストを削減し、帯域幅スループットを向上し、インターネットベースの接続よりも一貫したネットワーク体験を実現できます。

S3 Glacier Deep Archive に保存したデータを取り出すには、Amazon S3 API または Amazon S3 マネジメントコンソールを使用して [復元] リクエストを開始します。復元によって S3 Standard ストレージクラスにデータの一時的なコピーが作成され、S3 Glacier Deep Archive のアーカイブデータは影響を受けません。一時的なコピーを S3 に保存しておく期間は日単位で指定できます。その後、アーカイブされたオブジェクトに対して Amazon S3 GET リクエストを使用すると、S3 内の一時的なコピーにアクセスできるようになります。アーカイブされたオブジェクトを復元する場合、リクエスト本文の [階層] 要素で以下のオプションのいずれかを指定できます。[標準] はデフォルトの階層で、アーカイブされたすべてのオブジェクトに 12 時間以内にアクセスできます。S3 バッチオペレーションを使用して開始した場合、取り出しは通常 9 時間以内に開始されます。一括処理では、ペタバイト単位のデータを含む大量のデータを低コストで取得でき、通常は 48 時間以内に完了します。

S3 Glacier Deep Archive ストレージは、保存したデータ量 (GB)、PUT/ライフサイクル移行リクエストの数、取得 (GB)、復元リクエストの数に基づいて課金されます。この料金モデルは S3 Glacier Flexible Retrieval と似ています。S3 Glacier Deep Archive の料金情報については、Amazon S3 の料金のページをご覧ください。

S3 Glacier Deep Archive の使用量とコストは、月々の AWS の請求書で Amazon S3 の使用量とコストとは別に、独立したサービスの明細項目として表示されます。ただし、AWS コスト管理ツールを使用している場合、S3 Glacier Deep Archive の使用量とコストは別の明細項目として細分化されずに、詳細月間使用料レポートで Amazon S3 の使用量とコストに含まれます。

S3 Glacier Deep Archive にアーカイブされるオブジェクトは、最低 180 日間保存されます。180 日以前にオブジェクトが削除、上書き、移行された場合、残りの日数分の保管料と同額の日割り料金が発生します。また、S3 Glacier Deep Archive では、アーカイブされた各オブジェクトに対して 40 KB の追加メタデータが必要です。これには、データの特定と取り出しに必要な S3 Glacier Deep Archive の料金で課金される 32 KB のメタデータが含まれます。そして、S3 Glacier Deep Archive にアーカイブされたオブジェクトのユーザー定義名とメタデータを維持するために必要な S3 Standard レートで請求される追加の 8 KB のデータです。これにより、S3 LIST API または S3 インベントリレポートを使用して、すべての S3 オブジェクトのリアルタイムリストを取得できます。S3 Glacier Deep Archive の料金情報については、Amazon S3 の料金ページをご覧ください。

S3 Glacier Deep Archive は、S3 オブジェクトのタグ付け、S3 ライフサイクルポリシー、S3 Object Lock 、S3 レプリケーションなどの Amazon S3 の機能と統合されています。S3 ストレージ管理機能で、単一の Amazon S3 バケットを使用して S3 Glacier Deep Archive、S3 Standard、S3 標準 – IA、S3 1 ゾーン – IA、S3 Glacier Flexible Retrieval のデータを混合で保存できます。これにより、ストレージ管理者はデータの性質とデータアクセスパターンに基づいて判断できます。お客様は Amazon S3 ライフサイクルポリシーを使用して、データの経過時間に応じて自動的により安価なストレージクラスにデータを移行したり、S3 クロスリージョンレプリケーションまたはセイムリージョンレプリケーションのポリシーを使用して、データを同じリージョンや別のリージョンにレプリケートしたりできます。AWS Storage Gateway サービスは、Tape Gateway と S3 Glacier Deep Archive ストレージクラスを統合します。これによって仮想テープを最もコストの低い Amazon S3 ストレージクラスに保存し、長期のデータをクラウドに保存する月々のコストを 75% 削減できます。この機能により、Tape Gateway は新しい仮想テープの S3 Glacier Flexible Retrieval および S3 Glacier Deep Archive への直接アーカイブをサポートするため、お客様はバックアップ、アーカイブ、リカバリの要件を満たすことができます。Tape Gateway を使用して、既存のバックアップワークフローに変更を加えずに、テープベースのバックアップを AWS に移行できます。テープゲートウェイは、Veritas、Veeam、Commvault、Dell EMC NetWorker、IBM Spectrum Protect (Windows OS 用)、Microsoft Data Protection Manager など、主要なバックアップアプリケーションの大半をサポートしています。

S3 on Outposts

すべて開く

Amazon S3 on Outposts により、オンプレミス環境でのオブジェクトストレージを、AWS で現在使用しているのと同じ S3 API と機能を使用して実現できます。AWS Outposts は、AWS のインフラストラクチャ、AWS のサービス、API、およびツールを、データセンター、コロケーションスペース、オンプレミス施設のほぼすべてに拡張するフルマネージドサービスです。S3 on Outposts の使用すると、オンプレミスで生成された顧客データを AWS リージョンに移行する前に安全に処理および保存したり、オンプレミスで実行するアプリケーションからデータをローカルにアクセスしたり、データレジデンシーの要件がある地域の企業や規制がある業界の企業が、Outpost にデータを保存したりできます。S3 on Outposts の詳細については、概要ページをご覧ください。

ストレージ管理

すべて開く

S3 オブジェクトタグとは S3 オブジェクトに適用されるキーと値のペアのことで、オブジェクトの存続期間中にいつでも作成、更新、または削除できます。これによって、AWS Identity and Access Management (IAM) ポリシーを作成したり、Amazon S3 ライフサイクルポリシーを設定したり、ストレージメトリクスをカスタマイズしたりできるようになります。その後、これらのオブジェクトレベルのタグにより、ストレージクラス間での移行を管理したり、バックグラウンドでオブジェクトを有効期限切れにしたりできます。新しいオブジェクトをアップロードするときにタグを追加することも、既存のオブジェクトにタグを追加することもできます。各 S3 オブジェクトには 10 個までのタグを追加できます。また、オブジェクトタグを追加するときは AWS マネジメントコンソール、REST API、AWS CLI、または AWS SDK のいずれかを使用できます。
詳細については、S3 オブジェクトタグのユーザーガイドにアクセスしてください。

オブジェクトタグは、S3 ストレージを簡単に管理できるツールです。オブジェクトの存続期間中にいつでもタグを作成、更新、および削除できることで、ビジネスのニーズにストレージを適合させることができます。これらのタグによって特定のキーと値のペアでタグ付けされたオブジェクトへのアクセスを制御できるため、特定のグループやユーザーにのみ利用が許可された機密データをさらに安全に保護できます。オブジェクトタグは特定のプロジェクトや部署に属するオブジェクトへのラベル付けにも使用でき、S3 ライフサイクルポリシーと連動して使用することで、S3 Standard-IA、S3 One Zone-IA、Amazon S3 Glacier Instant Retrieval、Amazon S3 Glacier Flexible Retrieval、および Amazon S3 Glacier Deep Archive ストレージ層への移行を管理できます。また、S3 レプリケーションを使用して AWS リージョン間で特定のデータをレプリケートできます。

オブジェクトタグは S3 オブジェクトの存続期間中はいつでも変更でき、オブジェクトタグを変更するときは AWS マネジメントコンソール、REST API、AWS CLI、または AWS SDK のいずれかを使用できます。AWS マネジメントコンソールの外部のタグに対する変更はすべて、タグセット全体に対して行われることに注意してください。特定のオブジェクトに 5 個のタグがアタッチされていて、6 個目を追加したい場合は、そのリクエストに元の 5 個のタグを含める必要があります。

オブジェクトタグの料金は、タグの数量と、タグ追加のリクエストコストに基づいています。オブジェクトタグの追加と更新に関連するリクエストには、従来のリクエスト料金と同じ料金がかかります。詳細については、Amazon S3 の料金ページをご覧ください。

AWS マネジメントコンソールまたは S3 PUT Bucket Analytics API を用いると、ストレージクラス分析ポリシーを設定して、S3 Standard-IA または S3 One Zone-IA のストレージクラスに移動したり、S3 Glacier ストレージクラスにアーカイブしたりできる、アクセスが頻繁ではないストレージを特定できます。S3 コンソールの [管理] タブに移動すると、ストレージクラス分析、S3 インベントリ、および CloudWatch メトリクスを管理できます。

SQL を使用して S3 オブジェクトに関する情報をクエリし、生成 AI、分析、その他のユースケースで特定のデータセットを迅速に特定したい場合は、Amazon S3 Metadata を使用すべきです。S3 Metadata はメタデータをほぼリアルタイムで最新の状態に維持するため、Iceberg 互換クライアントを使用して SQL クエリを実行し、オブジェクトのメタデータでオブジェクトを検索できます。例えば、SQL クエリを使用して、バケット全体で過去 30 日間に追加されたオブジェクトなど、特定のフィルターに一致するオブジェクトのリストを返すことができます。

S3 Metadata は、バケットにアップロードされたオブジェクトに関する追加情報を提供するメタデータを自動生成し、そのメタデータを読み取り専用テーブルでクエリ可能にするように設計されています。これらのメタデータテーブルは、Apache Iceberg 上に構築された Amazon S3 Tables に保存され、S3 内で表形式データを保存およびクエリするための管理された方法を提供します。S3 Metadata は、オブジェクトサイズなどのシステムレベルのメタデータ、オブジェクトのアップロード中のタグやユーザー定義メタデータなどのカスタムメタデータ、リクエストを送信した IP アドレスなどのイベントメタデータを作成および維持します。バケット内のデータが変更されると、S3 Metadata は、ほぼリアルタイムで更新され、最新の変更が反映されます。その後、Amazon Athena、Amazon QuickSight、Apache Spark などのさまざまな AWS 分析サービスやオープンソースツール (Iceberg 互換) を使用してメタデータテーブルをクエリできます。

S3 コンソールで数回クリックするだけで S3 Metadata を使い始めることができます。S3 Metadata を有効にする汎用 S3 バケットを選択するだけで、S3 はバケット内のデータを分析し、すべてのオブジェクトのメタデータを含むフルマネージド Apache Iceberg テーブルを構築します。Apache Iceberg をサポートする任意のクエリエンジンまたはツールを使用して、数分以内にメタデータのクエリを開始できます。

S3 Metadata テーブルは、AWS アカウントの AWS マネージドテーブルバケット (aws-s3) に保存されます。テーブルは読み取り専用であり、メタデータの書き込み、更新、削除の許可は S3 にのみ付与されます。

S3 Metadata は、アカウント内の 2 つのマネージドテーブル (ジャーナルテーブルとライブインベントリテーブル) にメタデータを保存します。

S3 Metadata ジャーナルテーブルは、バケット内で行われた変更のビューを提供します。汎用 S3 バケットにオブジェクトが追加、更新、削除されると、対応する変更がジャーナルテーブルにほぼリアルタイムで反映されます。ジャーナルテーブルは、アプリケーションの動作を理解し、データセットに加えられた変更を特定するのに役立ちます。例えば、ジャーナルテーブルについて SQL クエリを記述して、過去 30 日間に追加されたオブジェクト、アクティブなリクエスタによって追加されたオブジェクト、過去 1 週間にメタデータが変更されたオブジェクトなど、フィルターに一致する S3 オブジェクトを見つけることができます。

S3 Metadata ライブインベントリテーブルには、バケット内のすべてのオブジェクトの完全なリストが含まれます。ライブインベントリテーブルは 1 時間ごとに更新され、S3 がオブジェクトについて認識しているすべての情報が含まれます。ライブインベントリテーブルは、オブジェクトメタデータで生成された特性に基づいて、バケット内のデータセットを検出または識別するのに役立ちます。例えば、ライブインベントリテーブルを使用して、機械学習用のトレーニングデータセットを特定したり、ストレージコストの最適化演習で使用したり、ガバナンスコントロールを強制適用するのに役立てたりできます。

バケットに新しいオブジェクトを追加すると、数分以内にジャーナルテーブルにエントリが表示され、次の 1 時間ごとの更新時にライブインベントリテーブルにエントリが表示されます。既存のバケットで S3 Metadata を有効にすると、S3 は自動的にバックフィルオペレーションを開始し、既存のすべてのオブジェクトについてのメタデータを生成します。このバックフィルは通常数分で完了しますが、既存のデータセットに数百万または数十億の S3 オブジェクトが含まれている場合は、数時間かかることがあります。

はい。カスタムメタデータを含むテーブルバケットに独自の Iceberg テーブルを作成し、簡単な SQL クエリを使用して S3 Metadata が生成するテーブルにそれらを結合できます。

S3 インベントリレポートは、Amazon S3 同期リスト API の定期的な代替を提供します。S3 インベントリを設定することで、S3 バケットまたはプレフィックスについて、オブジェクトとそれに対応するメタデータの CSV ファイルまたは ORC ファイルを、日単位または週単位で出力できます。S3 インベントリを使用すれば、ビジネスのワークフローやビッグデータのジョブを簡素化してスピードアップできます。S3 インベントリを使用してオブジェクトの暗号化やレプリケーションのステータスを検証することで、ビジネス、コンプライアンス、規制のニーズに応えることもできます。詳細については、Amazon S3 インベントリのユーザーガイドをご覧ください。

AWS マネジメントコンソールまたは PUT バケットインベントリ設定 API を使用すると、S3 バケット内のすべてのオブジェクト、または共有プレフィックスの下のオブジェクトのサブセットについて、日単位または週単位のインベントリレポートを設定できます。設定の一部として、S3 インベントリレポートの保存先の S3 バケット、出力ファイルの形式 (CSV、ORC、Parquet)、ビジネスアプリケーションに必要な特定のオブジェクトメタデータ (オブジェクト名、サイズ、最終更新日、ストレージクラス、バージョン ID、削除マーカー、固定バージョンフラグ、マルチパートアップロードフラグ、レプリケーションステータス、暗号化ステータスなど) を指定できます。 S3 インベントリを使用すれば、アプリケーションのワークフローやビッグデータのジョブに直接入力することができます。また、標準 SQL 言語を使用して、Amazon Athena、Amazon Redshift Spectrum、その他の Presto、Hive、Spark などのツールで S3 インベントリにクエリを実行することもできます。詳細については、Amazon S3 インベントリのユーザーガイドをご覧ください。

S3 インベントリの料金については、Amazon S3 の料金のページをご覧ください。SSE-KMS を使用した暗号化を設定すると、暗号化についての KMS 料金が発生します。詳細については、KMS の料金のページをご覧ください。