Amazon Web Services ブログ

Amazon Redshift Data Sharing が一般提供開始となり、東京リージョンでもご利用可能

みなさん、こんにちは。アマゾン ウェブ サービス ジャパン、シニアエバンジェリストの亀田です。

2020 年 12 月にプレビューとして発表されたAmazon Redshift の新しい機能である、Data Sharing が東京リージョンでプレビューとして利用可能でしたが、一般提供開始となりましたのでお知らせいたします。

Amazon Redshift Data Sharing

Amazon Redshift は最も高速で最も広く使用されているクラウドデータウェアハウスです。2020 年 4 月には Federated Query の機能が一般提供開始となり、Redshift 内部のデータだけではなく、運用データベース、およびデータレイクにあるペタバイト規模の構造化データと半構造化データを、標準的な SQL を使用して複数データソースを用いたデータ分析が可能となりました。さらに、Apache Parquet のようなオープンフォーマットでクエリの結果を S3 データレイクに保存することも可能で、Hadoopなどのビッグデータフレームワークを簡単に実行可能な Amazon EMR、Amazon S3などにクエリをサーバレスで発行可能な Amazon Athena、データサイエンティストとデベロッパーのための機械学習マネージドサービスであるAmazon SageMaker といった他の分析サービスを使ってさらに分析を実施することができます。2020 年 12 月には Redshift ML 機能がプレビューとしてリリースされ、使い慣れた SQL コマンドを使用して機械学習 (ML) モデルを作成、トレーニング、デプロイすることができるようになりました。

本日一般提供開始となったRedshift Data Sharing は、Redshift クラスター間でライブデータを共有するための安全で簡単な方法が提供されます。データの重要性が語れるようになって久しいですが、企業が既存ビジネスから送出するデータは、時にはユーザーの変わりゆく需要変動などの傾向を見出し、そして時には新しいビジネスを生み出す可能性がある重要なものとなりつつあります。各事業単位、各部門単位での個別に管理されるサイロ化されたデータ管理を廃止、統合したデータストアを構築し分析を行っていくことが、よりデータ分析の価値を高める可能性があります。

Redshiftを利用して単一のデータウェアハウスクラスターに複数部門から多くのアナリストがアクセスを行った場合、その処理優先度の調整やセキュリティ設定などが課題となるケースがあります。Data Sharing機能を使えば、データをコピーまたは移動することなく、AWS アカウント内の Amazon Redshiftクラスター間で瞬時にきめ細かく高性能なデータアクセスを実現させることが可能になります。データ共有はデータへのライブアクセスを提供するため、データウェアハウスで更新されるときに、アナリストは常に最新で一貫性のある情報を見ることができます。Data Sharing機能は、Amazon Redshift RA3ノードタイプで動作しているクラスターでご利用いただくことができます。

Data Sharing の機能により、データのコピーやデータ移動に関連する複雑さや遅延なしに、これらのクラスター間で Redshift マネージドストレージを活用することで、トランザクション整合性のあるデータを共有しながら、異なる AmazonRedshift クラスター間で多様なワークロードを分離できます。コンシューマークラスターのエンドポイントへアクセスするクエリは、コンシューマークラスターのコンピューティングリソースを使用して実行され、プロデューサークラスターのパフォーマンスに影響を与えません。データ共有により、新しい分析ワークロードを迅速にオンボーディングし、柔軟なコンピューティングリソースをプロビジョニングして、個々のワークロード固有のパフォーマンス SLA を満たすことができます。さらに、すべてのコンシューマー間でデータ共有のアクセス許可と使用状況を監視し、必要に応じてアクセスを即座に取り消すための詳細な監査機能が提供されます。

RA3 ノードタイプ

RA3 ノードタイプは従来の DC2 などと異なり、ストレージコストを増やすことなく、コンピューティング容量を柔軟に拡張することができ、コンピューティング容量を過剰にプロビジョニングすることなく、ストレージを拡張できます。ホットなデータには高性能 SSD を使用し、コールドデータには AmazonS3 を使用することで、費用効果の高いストレージ、および高いクエリパフォーマンスを提供します。RA3 ノードタイプは AWS Nitro System をベースとして動作するため、高帯域幅ネットワークを使用して、AmazonS3 へのデータのオフロードと AmazonS3 からのデータの取得にかかる時間をさらに短縮させることも可能です。Redshift クラスターを RA3 ノードタイプへ変更させることを検討する場合、こちらの手順をご覧ください。

– シニアエバンジェリスト 亀田