Amazon Redshift では、大規模な高速、簡単、安全なクラウドデータウェアハウジングにより、インサイトを取得するまでの時間を短縮します。

特徴と利点

毎年、お客様の導入事例やフィードバックに基づいて数百個の機能と製品の改善項目をリリースしています。 最新情報についてはこちらをご覧ください。

すべてのデータを分析する

運用データベース、データレイク、データウェアハウス、数千のサードパーティデータセットにわたる複雑でスケーリングされたデータに対してリアルタイムの予測分析を実行し、統合された洞察を取得します。

横串検索: Amazon Redshift の新しい横串検索機能を使用すれば、運営に関するリレーショナルデータベースにアクセスできます。1 つ以上の Amazon Relational Database Service (RDS)、Aurora PostgreSQL、RDS MySQL、Aurora MySQL データベースでライブ データをクエリして、データの移動を必要とせずにビジネス オペレーション全体を即座に可視化します。Redshift データウェアハウスからのデータ、データレイク内のデータ、運用ストア内のデータを結合して、より優れたデータ駆動型の意思決定を行うことができます。Amazon Redshift は、ネットワーク上のデータ移動を削減する最適化を提供し、高性能クエリのための超並列データ処理でそれを補完します。詳細はこちら。

データ共有: Amazon Redshift データ共有により、データを共有しながら、単一クラスターでの Amazon Redshift の使いやすさ、パフォーマンス、およびコスト上の利点をマルチクラスターデプロイに拡張できます。データ共有により、データをコピーまたは移動することなく、Redshift クラスター全体で瞬時に詳細かつ高速なデータアクセスが可能になります。データ共有はデータへのライブアクセスを提供するため、データウェアハウスで更新されるときに、ユーザーは常に一貫性のある最新情報を確認することができます。同じまたは異なる AWS アカウントの Redshift クラスターと、リージョン間でライブデータを安全に共有できます。詳細はこちら。

AWS Data Exchange for Amazon Redshift: データの抽出、変換、ロード (ETL) を行わずに、独自の Redshift クラスターから Amazon Redshift データセットをクエリします。AWS Data Exchange で Redshift クラウドのデータウェアハウス製品をサブスクライブできます。プロバイダーが更新を行うと、変更はすぐにサブスクライバーに表示されます。データプロバイダーの場合、アクセスはサブスクリプションの開始時に自動的に許可され、サブスクリプションの終了時に取り消されます。また、支払い期日に請求書が自動的に生成され、AWS を通じて支払いが収納されます。フラットファイル、Amazon Redshift のデータ、API 経由で配信されるデータへのアクセスを、すべて 1 つのサブスクリプションでライセンス化できます。詳細はこちら。

Redshift 機械学習: Redshift 機械学習は、データアナリストやデータサイエンティスト、ビジネスインテリジェンスのプロフェッショナル、およびデベロッパーが SQL を使用して Amazon SageMaker モデルを簡単に作成、トレーニング、デプロイできるようにします。Redshift 機械学習では、SQL ステートメントを使用して、Amazon Redshift のデータで Amazon SageMaker モデルを作成およびトレーニングしてから、そのモデルを使って、直接クエリやレポートでチャーン検出や財務予測、パーソナライゼーション、リスクスコアリングなどの予測を取得することができます。詳細はこちら。

Amazon Redshift Integration for Apache Spark: この機能により、Amazon Redshift データで Apache Spark アプリケーションを簡単に構築および実行できるようになり、顧客はデータウェアハウスを開いて、より広範な分析および機械学習ソリューションのセットを利用できるようになります。Amazon Redshift Integration for Apache Spark を使用すると、Amazon EMR、AWS Glue、Amazon Athena Spark、Amazon SageMaker などの AWS 分析および機械学習サービスを使用する開発者は、数秒で開始し、Amazon との間で読み書きする Apache Spark アプリケーションを簡単に構築できます。アプリケーションのパフォーマンスやデータのトランザクションの一貫性を損なうことなく、Redshift データウェアハウスを使用できます。Amazon Redshift Integration for Apache Spark により、Amazon Redshift を使用する場合の Apache Spark アプリケーションのパフォーマンスの問題の監視とトラブルシューティングも容易になります。

Amazon Aurora Zero-ETL から Amazon Redshift: これは、Amazon Aurora と Amazon Redshift 間のコードなしの統合であり、Amazon Aurora のお客様は、Amazon Redshift を使用してペタバイト規模のトランザクション データでほぼリアルタイムの分析と機械学習を行うことができます。トランザクションデータが Amazon Aurora に書き込まれてから数秒以内に、Amazon Aurora Zero-ETL to Amazon Redshift は Amazon Redshift でシームレスにデータを利用できるようにするため、お客様は抽出、変換、ロード (ETL) 操作を実行する複雑なデータパイプラインを構築および維持する必要がなくなります。この統合により、運用上の負担とコストが削減され、顧客はアプリケーションの改善に集中できるようになります。トランザクションデータへのほぼリアルタイムのアクセスにより、お客様は Amazon Redshift の分析および機械学習機能を活用して、トランザクション データやその他のデータから洞察を導き出し、重要で時間に敏感なイベントに効果的に対応できます。

ストリーミングインジェスト: データエンジニア、データアナリスト、およびビッグデータ開発者は、リアルタイムストリーミングエンジンを使用して、お客様の応答性を向上させています。Amazon Redshift の新しいストリーミング取り込み機能により、SQL (Structured Query Language) を使用して、Amazon Kinesis Data Streams および Amazon Managed Streaming for Apache Kafka (MSK) に接続し、そこからデータを直接取り込むことができます。また、Amazon Redshift ストリーミングインジェストでは、ストリームの上にマテリアライズドビューを直接作成できるため、ダウンストリームパイプラインの作成と管理が簡単になります。マテリアライズドビューには、ELT (Extract Load Transform) パイプラインの一部として SQL 変換を含めることもできます。定義されたマテリアライズドビューを手動で更新して、最新のストリーミングデータを照会できます。このアプローチにより、既存の使い慣れたツールを使用してストリーミング データのダウンストリーム処理と変換を追加費用なしで実行できます。

データレイクとの間でデータのクエリとエクスポート: 他のクラウドデータウェアハウスでは、データのクエリとデータレイクへのデータの書き込みをオープンな形式で簡単に行うことができません。使い慣れた ANSI SQL を使用して、Amazon S3 で Parquet、ORC、JSON、Avro、CSV などのオープンファイル形式を直接クエリできます。データをデータレイクにエクスポートするには、SQL コードで Amazon Redshift UNLOAD コマンドを使用し、ファイル形式として Parquet を指定するだけです。Amazon Redshift は、データのフォーマットと S3 へのデータの移動を自動的に処理します。これにより、高度に構造化され、頻繁にアクセスされるデータと半構造化データを Amazon Redshift データウェアハウスに格納する柔軟性が得られ、Amazon S3 で最大エクサバイトの構造化、半構造化、および非構造化データを維持できます。Amazon Redshift からデータレイクにデータをエクスポートして戻すと、Amazon Athena、Amazon EMR、Amazon SageMaker などの AWS サービスを使用してデータをさらに分析できます。

AWS サービスの統合: AWS のサービス、データベース、および機械学習サービスとのネイティブな統合により、完全な分析ワークフローを摩擦なく簡単に処理できます。例えば、AWS Lake Formation は、安全なデータレイクを数日で簡単にセットアップできるサービスです。AWS Glue を使用すると、Amazon Redshift にデータを抽出、変換、ロード (ETL) することができます。Amazon Kinesis Data Firehose を使用すると、最も簡単な方法で Amazon Redshift にストリーミングデータをキャプチャ、変換、ロードでき、ほぼリアルタイムで分析を行えます。Amazon EMR を使用すると、Hadoop/Spark を使用してデータを処理し、出力を Amazon Redshift にロードしてビジネスインテリジェンスや分析を行えます。Amazon QuickSight は、セッション単位の料金で利用できる初の BI サービスで、Redshift データに関するレポートやダッシュボードを作成することや、可視化することができます。Amazon Redshift を使用してデータを準備し、Amazon SageMaker で機械学習 (ML) ワークロードを実行できます。AWS Schema Conversion Tool と AWS Database Migration Service (DMS) を使用して、Amazon Redshift への移行を加速させることができます。また、Amazon Redshift は、セキュリティ、モニタリング、コンプライアンスを実現するために Amazon Key Management Service (KMS)、Amazon CloudWatch と緊密に統合されています。Lambda ユーザー定義関数 (UDF) を使用して、Amazon Redshift でユーザー定義関数を呼び出す場合と同じように、SQL クエリから Lambda 関数を呼び出すこともできます。Lambda UDF を記述して、AWS パートナー サービスと統合し、Amazon DynamoDB や Amazon SageMaker などの他の一般的な AWS サービスにアクセスできます。

パートナー コンソールの統合: Amazon Redshift コンソールで選択したパートナーソリューションと統合することで、データのオンボーディングを加速し、貴重なビジネスインサイトを数分で作成できます。これらのソリューションを使用すると、Salesforce、Google Analytics、Facebook Ads、Slack、Jira、Splunk、Marketo などのアプリケーションから、効率的かつ合理的な方法で Redshift データウェアハウスにデータを取り込むことができます。また、これらの異なるデータセットを結合して一緒に分析し、実用的な洞察を生み出すこともできます。

Amazon S3 からの自動コピー: Amazon Redshift は自動コピーをサポートしており、Amazon S3 からのデータのロードを簡素化および自動化して、カスタムソリューションの構築やサードパーティサービスの管理にかかる時間と労力を削減します。この機能により、Amazon Redshift は、ファイルの取り込みを自動化し、内部で継続的なデータの読み込み手順を処理することにより、コピー手順を手動で繰り返し実行する必要がなくなります。自動コピーのサポートにより、データ エンジニアリングの知識がなくても基幹業務ユーザーやデータ アナリストが簡単に取り込みルールを作成し、Amazon S3 からロードするデータの場所を設定できます。新しいデータが指定された Amazon S3 フォルダーに到着すると、ユーザー定義の構成に基づいて取り込みプロセスが自動的にトリガーされます。Redshift copy コマンドでは、CSV、JSON、Parquet、Avro など、すべてのファイル形式がサポートされています。 

高度な分析のネイティブ サポート: Amazon Redshift は、NUMBER、VARCHAR、DATETIME などの標準的なスカラー データ型をサポートし、次の高度な分析処理のネイティブ サポートを提供します。

  • 空間データ処理: Amazon Redshift は、ポイント、ラインストリング、ポリゴンなどの複数の幾何学的形状をサポートするポリモーフィックデータ型ジオメトリを提供します。Amazon Redshift は、幾何学的形状の構築、空間データのインポート、エクスポート、アクセス、および処理を行うための空間 SQL 関数も提供します。GEOMETRY 列を Redshift テーブルに追加し、空間データと非空間データにまたがる SQL クエリを作成できます。この機能により、お客様は空間データを保存、取得、処理できるため、空間データを分析クエリに統合することでビジネスインサイトをシームレスに強化できます。データレイクをシームレスにクエリする Amazon Redshift の機能を使用すると、空間クエリに外部テーブルを統合することで、空間処理をデータレイクに簡単に拡張することもできます。詳細については、ドキュメントを参照してください。
  • HyperLogLog スケッチ: HyperLogLog は、データセット内の異なる値のおおよその数を効率的に推定する新しいアルゴリズムです。HLL スケッチは、データセット内の個別の値に関する情報をカプセル化するコンストラクトです。HLL スケッチは、大規模なデータセットの近似カーディナリティを計算するクエリに対して大幅なパフォーマンスの利点を実現するために使用することができ、平均的な相対エラーは 0.01~0.6% です。Amazon Redshift は、HyperLogLog スケッチを生成、永続化、および組み合わせるために、第一級データ型の HLLSKETCH と関連する SQL 関数を提供します。Amazon Redshift の HyperLogLog 機能はバイアス修正技術を使用し、少ないメモリフットプリントで高い精度を提供します。詳細については、ドキュメントを参照してください。
  • DATE & TIME データ型: Amazon Redshift は、複数のデータ型 DATE、TIME、TIMETZ、TIMESTAMP、および TIMESTAMPTZ を提供して、データ/時刻データをネイティブに保存および処理します。TIME 型と TIMESTAMP 型はタイム ゾーン情報を含まない時刻データを格納しますが、TIMETZ 型と TIMESTAMPTZ 型はタイムゾーン情報を含む時刻データを格納します。さまざまな日付/時刻 SQL 関数を使用して、Redshift クエリの日付と時刻の値を処理できます。詳細については、ドキュメントを参照してください。
  • 半構造化データ処理: Amazon Redshift SUPER データ型は、JSON およびその他の半構造化データを Redshift テーブルにネイティブに保存し、PartiQL クエリ言語を使用して半構造化データをシームレスに処理します。SUPER データ型は本質的にスキーマレスであり、Redshift スカラー値、ネストされた配列、ネストされた構造を含むネストされた値を格納できます。PartiQL は SQL の拡張機能で、オブジェクトと配列のナビゲーション、配列のネスト解除、動的型付け、スキーマレスセマンティクスなどの強力なクエリ機能を提供します。これにより、従来の構造化 SQL データと半構造化 SUPER データを組み合わせた高度な分析を、優れたパフォーマンス、柔軟性、使いやすさで実現できます。詳細については、ドキュメントを参照してください。
  • サードパーティツールとの統合: 業界をリードするツールや専門家と協力してデータの読み込み、変換、視覚化を行うことで、Amazon Redshift を強化する多くのオプションがあります。パートナーの広範なリストは、自社のソリューションが Amazon Redshift と連携することを認定しています。
  • データをロードして変換するデータ統合パートナー。
  • データを分析して組織全体でインサイトを共有するビジネスインテリジェンスパートナー。
  • 分析プラットフォームのアーキテクチャを設計して実装するシステム統合およびコンサルティングパートナー。
  • クエリおよびデータ モデリング パートナーのツールとユーティリティを使用して、データのクエリ、調査、モデル化を行います。

あらゆる規模での価格性能比

クエリ速度を向上させる自動最適化により、他のクラウドデータウェアハウスよりも最大 5 倍優れたコストパフォーマンスを実現します。

RA3 インスタンス: RA3 インスタンスは、クラウドデータウェアハウスサービスの最大 5 倍のコストパフォーマンスを提供します。これらの Amazon Redshift インスタンスは、必要なインスタンスの数を指定することにより、ストレージとは別にコンピューティングに対して個別に支払う柔軟性を備え、大量のコンピューティング容量を必要とするパフォーマンス集約型のワークロードの速度を最大化します。詳細はこちら

効率的なストレージと高性能のクエリ処理: Amazon Redshift は、ギガバイトからペタバイトまでのサイズのデータセットに対して高速なクエリ パフォーマンスを提供します。列指向ストレージ、データ圧縮、ゾーンのマッピングによって、クエリ実行に必要な I/O の量が削減されます。また、Amazon Redshift では、LZO、Zstandard などの業界標準のエンコーディングだけでなく、数値と日付/時刻型向けの専用の圧縮エンコーディング AZ64 も提供しており、それによりストレージの節約とクエリパフォーマンスの最適化を実現できます。

無制限の同時実行: Amazon Redshift は、Redshift データウェアハウスでデータをクエリするか、Amazon S3 データレイクで直接データをクエリするかに関係なく、数千の同時クエリであっても、一貫して高速なパフォーマンスを提供します。Amazon Redshift 同時実行スケーリングは、同時実行数の増加に応じて数秒で一時的な容量を追加することで、一貫したサービス レベルで事実上無制限の同時ユーザーと同時クエリをサポートします。詳細はこちら。

マテリアライズドビュー: Amazon Redshift マテリアライズドビューを使用すると、ダッシュボードやビジネスインテリジェンス (BI) ツールからのクエリなどの反復的または予測可能な分析ワークロードのクエリパフォーマンスを大幅に高速化し、ELT データ処理ジョブを抽出、変換、ロードできます。マテリアライズドビューを使用すると、外部テーブルを含む 1 つ以上のテーブルを参照する可能性がある、選択したステートメントの事前計算済みの結果を簡単に格納および管理できます。事前に計算された結果を再利用することで、マテリアライズドビューを参照する後続クエリは、はるかに高速に実行できます。Amazon Redshift では、マテリアライズドビューを増分で効率的に維持できるため、低レイテンシーパフォーマンスの利点を利用し続けることができます。詳細はこちら

自動化されたマテリアライズドビュー: 組織は、これまで以上に多くのデータに依存するアプリケーション、ダッシュボード、レポート、およびアドホッククエリを構築しています。各アプリケーションは調整および最適化する必要があり、これには時間、リソース、および資金が必要です。マテリアライズドビューはクエリのパフォーマンスを高める強力なツールであり、ワークロードを十分に把握できている場合にセットアップすることが可能です。しかし、ワークロードが増えたり変化したりして、クエリのパターンを予測できないこともあります。自動化されたマテリアライズドビューは、自動リフレッシュ、自動クエリ書き換え、増分リフレッシュ、Amazon Redshift クラスターの継続的なモニタリングにより、クエリのスループットを向上し、クエリのレイテンシーを下げ、実行時間を短縮します。Amazon Redshift は、最小限のリソース使用で AutoMV の作成と管理をバランスを取ります。詳細はこちら

スループットとパフォーマンスを最大化するための機械学習: Amazon Redshift の高度な機械学習機能は、さまざまなワークロードや同時ユーザー アクティビティがあっても、高いスループットとパフォーマンスを提供します。Amazon Redshift は、洗練されたアルゴリズムを使用して、実行時間とリソース要件に基づいて着信クエリを予測および分類し、パフォーマンスと同時実行性を動的に管理すると同時に、ビジネス クリティカルなワークロードの優先順位付けを支援します。ショートクエリアクセラレーション (SQA) では、ダッシュボードなどのアプリケーションから高速キューに短いクエリを送信し、大規模なクエリの後ろで長い間待機するのではなく、即座に処理されるようにします。自動ワークロード管理 (WLM) では、機械学習を使用してメモリと同時実行を動的に管理することで、クエリのスループットを最大限に高めます。また、数百件のクエリが送信されていても、最も重要なクエリを優先するように簡単に設定できるようになりました。Amazon Redshift は、ユーザーのワークロードを観察し、使用量の増加に応じてパフォーマンスを向上させる機会を判断し、シームレスに最適化を適用し、Redshift のパフォーマンスをさらに加速するために明示的なユーザーアクションが必要な場合に Redshift Advisor を通じて推奨事項を作成する自己学習システムでもあります。

結果のキャッシュ: Amazon Redshift は、結果のキャッシュを使用して、繰り返しのクエリに対して 1 秒未満の応答時間を提供します。繰り返しクエリを実行するダッシュボード、視覚化、およびビジネス インテリジェンスツールでは、パフォーマンスが大幅に向上します。クエリを実行すると、Amazon Redshift はキャッシュを検索し、以前の実行でキャッシュされた結果がないか確認します。キャッシュされた結果が見つかり、データが変更されていない場合は、クエリを再実行する代わりに、キャッシュされた結果がすぐに返されます。

ペタバイト規模のデータウェアハウス: コンソールで数回クリックするか、単純な API 呼び出しを行うだけで、データ ウェアハウス内のノードの数や種類を簡単に変更し、ニーズの変化に応じてスケールアップまたはスケールダウンできます。マネージドストレージでは、容量が自動的に追加され、最大 8 PB の圧縮データのワークロードをサポートします。Amazon Redshift Spectrum 機能を使用して、データのロードや変換を行うことなく、Amazon S3 にあるペタバイト規模のデータに対してクエリを実行できます。可用性が高く、安全で、コスト効率が高いデータレイクとして S3 を使用し、オープンデータフォーマットで無制限にデータを保存できます。Redshift Spectrum は、クエリの複雑さやデータ量に関係なく、数千の並列化されたノードでクエリを実行して、迅速に結果を提供します。

柔軟な料金オプション: Amazon Redshift は最も費用対効果の高いデータウェアハウスであり、支払い方法を最適化できます。コミットメントなしで 1 時間あたり 0.25 USD から開始でき、1 年間、1 テラバイトあたり 1,000 USD までスケールアウトできます。Amazon Redshift は、初期費用なしのオンデマンド料金体系を提供する唯一のクラウドデータウェアハウスです。リザーブドインスタンスの料金体系の場合、1 年契約または 3 年契約で最大 75% コストを節約できます。また、クエリ単位の料金体系の場合、Amazon S3 データレイクでスキャンされたデータ量に応じて料金が発生します。Amazon Redshift の料金には、組み込みセキュリティ、データ圧縮、バックアップストレージ、データ転送が含まれています。データサイズの増加に伴い、RA3 インスタンスでマネージドストレージを使用して、1 か月あたり 0.024 USD/GB という高いコスト効率でデータを保存できます。

予測不可能なワークロードでも予測可能なコスト: Amazon Redshift では、各クラスターが 1 日あたり最大 1 時間の無料の同時実行スケーリングクレジットを獲得できるため、コストへの影響を最小限に抑えてスケーリングできます。これらの無料クレジットは、97% のお客様の同時実行性に関するニーズを十分に満たすものです。これにより、分析需要が変動している期間でも、月ごとのコストを予測することができます。

ノードタイプを選択して、ワークロードに最適な価値を得る: 3 つのインスタンスタイプから選択して、データウェアハウジングのニーズに合わせて Amazon Redshift を最適化できます: RA3 ノード、高密度コンピューティングノード、および高密度ストレージノード。

RA3 ノードでは、コンピューティングとは別にストレージをスケールできます。RA3 を使用すると、個別のストレージレイヤーにデータを保存する高パフォーマンスのデータウェアハウスを実現できます。必要なクエリのパフォーマンスに合わせてデータウェアハウスのサイズを決定するだけです。

Dense Compute (DC) ノードでは、高速 CPU、大容量 RAM、SSD (Solid-State Disk) を使用してきわめて高パフォーマンスのデータウェアハウスを作成できます。これは、データが 500 GB を超える場合に最適な選択肢です。

Dense Storage (DS2) ノードでは、3 年間のリザーブドインスタンスを購入すると、ハードディスクドライブ (HDD) を使用して大規模なデータウェアハウスを低コストで作成できます。DS2 クラスターで実行しているほとんどのお客様は、ワークロードを RA3 クラスターに移行して、DS2 と同じコストで最大 2 倍のパフォーマンスとストレージの増加を実現できます。

クラスターのスケーリングやノードタイプの切り替えに必要なのは、API コール 1 回のみ、または AWS マネジメントコンソールで数回クリックすることのみです。詳細については料金表ページを参照してください。

簡単で安全、そして信頼できる

データウェアハウスの管理について心配することなく、数秒以内に、データからインサイトを得て、ビジネスの成果を実現することに専念できます。

Amazon Redshift Serverless: Amazon Redshift Serverless は、Amazon Redshift のサーバーレスオプションであり、データウェアハウス インフラストラクチャをセットアップおよび管理する必要なく、分析を数秒で簡単に実行してスケーリングできます。Amazon Redshift サーバーレスを使用すると、データ アナリスト、開発者、ビジネスプロフェッショナル、データサイエンティストを含むすべてのユーザーが、データウェアハウスにデータを読み込んでクエリを実行するだけで、データから洞察を得ることができます。詳細はこちら。

Query Editor v2: SQL を使用して、データの探索と分析のためのウェブベースのアナリストワークベンチを使用して、データアナリスト、データエンジニア、およびその他の SQL ユーザーが Amazon Redshift のデータとデータレイクにアクセスしやすくします。Query Editor v2 を使用すると、1 回のクリックでクエリ結果を視覚化し、スキーマとテーブルを作成して、データを視覚的にロードし、データベースオブジェクトを参照できます。また、SQL クエリ、分析、視覚化、および注釈を作成および共有し、それらをチームと安全に共有するための直感的なエディターも提供します。

自動化されたテーブル設計: Amazon Redshift はユーザーのワークロードを監視し、高度なアルゴリズムを使用してデータの物理レイアウトを改善し、クエリ速度を最適化する方法を見つけます。自動テーブル最適化は、クラスターのワークロードのパフォーマンスを最適化するために、最適な並べ替えおよび分散キーを選択します。Amazon Redshift が、キーを適用するとクラスターのパフォーマンスが向上すると判断した場合、管理者の介入を必要とせずに、テーブルが自動的に変更されます。追加機能の自動バキューム削除、自動テーブルソート、および自動分析により、Redshift クラスターを手動でメンテナンスおよび調整する必要がなくなり、新しいクラスターと本番ワークロードで最高のパフォーマンスを得ることができます。

独自のツールを使用したクエリ: Amazon Redshift は、コンソール内でクエリを実行したり、SQL クライアントツール、ライブラリ、または Amazon QuickSight、Tableau、PowerBI、QueryBook、Jupyter Notebook などのデータサイエンス ツールに接続したりする柔軟性を提供します。

Amazon Redshift とやり取りするためのシンプルな API: Amazon Redshift を使用すると、あらゆる種類の従来型、クラウドネイティブ、コンテナ化されたサーバーレス Web サービスベースのアプリケーション、およびイベント駆動型アプリケーションでデータに簡単にアクセスできます。Amazon Redshift Data API は、AWS SDK でサポートされているプログラミング言語とプラットフォーム (Python、Go、Java、Node.js、PHP、Ruby、C++ など) からのデータアクセス、取り込み、送信を簡素化します。Data API を使用すれば、ドライバーを構成したり、データベース接続を管理したりする必要がなくなります。それらの管理を行う代わりに、ユーザーは Data API が提供する安全な API エンドポイントを呼び出すだけで、Amazon Redshift クラスターに SQL コマンドを実行することができます。データベース接続の管理とデータのバッファリングは Data API が行います。Data API は非同期であるため、後で結果を取得できます。クエリ結果は 24 時間保存されます。

耐障害性: データウェアハウスクラスターの信頼性を高める複数の機能があります。例えば、Amazon Redshift では、耐障害性を実現するために、クラスターの状態は常時モニタリングされており、障害があるドライブから自動的にデータが再度レプリケートされ、必要に応じてノードの交換が行われます。クラスターは、データの損失やアプリケーションの変更なしに、代替のアベイラビリティーゾーン (AZ) に再配置することもできます。

AWS には、最も厳しい要件を満たすことができる包括的なセキュリティ機能が備わっているため、Amazon Redshift では、追加料金なしですぐにデータのセキュリティを確保できます。

詳細なアクセス制御: 詳細な行および列レベルのセキュリティ制御により、ユーザーはアクセスできる必要があるデータのみを表示できます。Amazon Redshift は AWS Lake Formation と統合されており、Lake Formation の列レベルのアクセス制御が、データレイク内のデータに対する Redshift クエリにも適用されます。

Amazon Redshift のデータ共有は、AWS Lake Formation による一元化されたアクセス制御をサポートし、Amazon Redshift から共有されるデータのガバナンスを簡素化します。AWS Lake Formation (LF) は、安全なデータレイクのセットアップ、すべての消費サービスにわたるデータへのきめ細かなアクセスの集中管理、および行レベルと列レベルの制御の適用を容易にするサービスです。

動的データマスキング: 動的データマスキングを使用すると、顧客は、ユーザーに表示される識別可能なデータの量を制限することにより、機密データを簡単に保護できます。また、これらのフィールドに複数レベルのアクセス許可を定義できるため、さまざまなユーザーやグループがデータの複数のコピーを作成することなく、Redshift の使い慣れた SQL インターフェースを介してさまざまなレベルのデータアクセスを行うことができます。

マルチ AZ: 新しい Redshift マルチ AZ 構成は、復旧時間を短縮し、データを失うことなく自動的に復旧する容量を保証することで、復旧機能をさらに拡張します。Redshift マルチ AZ データウェアハウスは、スタンバイリソースを使用することなく高可用性を実現することで、パフォーマンスと価値を最大化します。

エンドツーエンドの暗号化: いくつかのパラメータ設定を行うだけで、SSL を使用して転送中のデータを保護し、ハードウェアで高速化された AES-256 暗号化を保管中のデータに使用するように Amazon Redshift をセットアップできます。保管中のデータの暗号化を有効にすることを選択した場合、ディスクに書き込まれたすべてのデータとバックアップが暗号化されます。デフォルトでは、Amazon Redshift でキー管理を行います。

ネットワークの分離: Amazon Redshift では、ファイアウォールルールを設定して、データウェアハウスクラスターへのネットワークアクセスを制御できます。Amazon 仮想プライベートクラウド (VPC) 内で Amazon Redshift を実行して、データウェアハウス クラスターを独自の仮想ネットワークに分離し、業界標準の暗号化された IPsec VPN を使用して既存の IT インフラストラクチャに接続できます。

監査とコンプライアンス: Amazon Redshift は AWS CloudTrail と統合されているため、すべての Redshift API 呼び出しを監査できます。Redshift は、接続試行、クエリ、データウェアハウスへの変更など、すべての SQL 操作をログに記録します。このログにアクセスするには、システムテーブルに対する SQL クエリを使用するか、Amazon S3 上の安全な場所にログを保存します。Amazon Redshift は、SOC1、SOC2、SOC3、および PCI DSS Level 1 の要件に準拠しています。詳細については、AWS クラウドコンプライアンスをご覧ください。

トークン化: Amazon Lambda ユーザー定義関数 (UDF) を使用すると、AWS Lambda 関数を Amazon Redshift で UDF として使用し、Redshift SQL クエリから呼び出すことができます。この機能を使用すると、SQL クエリのカスタム拡張機能を記述して、他のサービスやサードパーティ製品とのより緊密な統合を実現できます。Lambda UDF を記述して、Protegrity などのベンダーと統合することにより、外部トークン化、データマスキング、データの識別または匿名化を有効にし、クエリ時にユーザーのアクセス許可とグループに基づいて機密データを保護または保護解除できます。

最新情報についてはこちらをご覧ください。

詳しい製品情報については、Amazon Redshift のドキュメントをご覧ください。

Amazon Redshift 料金の詳細

料金ページを見る
構築を始めましょう。
Amazon Redshift の使用を開始する
ご不明な点がおありですか?
お問い合わせ