Amazon Web Services ブログ

Amazon Redshift Data Sharing が一般提供開始となり、東京リージョンでもご利用可能

みなさん、こんにちは。アマゾン ウェブ サービス ジャパン、シニアエバンジェリストの亀田です。

2020年12月にプレビューとして発表されたAmazon Redshiftの新しい機能である、Data Sharing が東京リージョンでプレビューとして利用可能でしたが、一般提供開始となりましたのでお知らせいたします。

Amazon Redshift Data Sharing

Amazon Redshiftは最も高速で最も広く使用されているクラウドデータウェアハウスです。2020年4月にはFederated Query の機能が一般提供開始となり、Redshift内部のデータだけではなく、運用データベース、およびデータレイクにあるペタバイト規模の構造化データと半構造化データを、標準的な SQL を使用して複数データソースを用いたデータ分析が可能となりました。さらに、Apache Parquet のようなオープンフォーマットでクエリの結果を S3 データレイクに保存することも可能で、Hadoopなどのビッグデータフレームワークを簡単に実行可能なAmazon EMR、Amazon S3などにクエリをサーバレスで発行可能なAmazon Athena、データサイエンティストとデベロッパーのための機械学習マネージドサービスであるAmazon SageMaker といった他の分析サービスを使ってさらに分析を実施することができます。2020年12月にはRedshift ML機能がプレビューとしてリリースされ、使い慣れた SQL コマンドを使用して機械学習 (ML) モデルを作成、トレーニング、デプロイすることができるようになりました。

本日一般提供開始となったRedshift Data Sharingは、Redshiftクラスター間でライブデータを共有するための安全で簡単な方法が提供されます。データの重要性が語れるようになって久しいですが、企業が既存ビジネスから送出するデータは、時にはユーザーの変わりゆく需要変動などの傾向を見出し、そして時には新しいビジネスを生み出す可能性がある重要なものとなりつつあります。各事業単位、各部門単位での個別に管理されるサイロ化されたデータ管理を廃止、統合したデータストアを構築し分析を行っていくことが、よりデータ分析の価値を高める可能性があります。

Redshiftを利用して単一のデータウェアハウスクラスターに複数部門から多くのアナリストがアクセスを行った場合、その処理優先度の調整やセキュリティ設定などが課題となるケースがあります。Data Sharing機能を使えば、データをコピーまたは移動することなく、AWSアカウント内のAmazon Redshiftクラスター間で瞬時にきめ細かく高性能なデータアクセスを実現させることが可能になります。データ共有はデータへのライブアクセスを提供するため、データウェアハウスで更新されるときに、アナリストは常に最新で一貫性のある情報を見ることができます。Data Sharing機能は、Amazon Redshift RA3ノードタイプで動作しているクラスターでご利用いただくことができます。

Data Sharingの機能により、データのコピーやデータ移動に関連する複雑さや遅延なしに、これらのクラスター間でRedshiftマネージドストレージを活用することで、トランザクション整合性のあるデータを共有しながら、異なるAmazonRedshiftクラスター間で多様なワークロードを分離できます。コンシューマークラスターのエンドポイントへアクセスするクエリは、コンシューマークラスターのコンピューティングリソースを使用して実行され、プロデューサークラスターのパフォーマンスに影響を与えません。データ共有により、新しい分析ワークロードを迅速にオンボーディングし、柔軟なコンピューティングリソースをプロビジョニングして、個々のワークロード固有のパフォーマンスSLAを満たすことができます。さらに、すべてのコンシューマー間でデータ共有のアクセス許可と使用状況を監視し、必要に応じてアクセスを即座に取り消すための詳細な監査機能が提供されます。

RA3 ノードタイプ

RA3ノードタイプは従来のDC2などと異なり、ストレージコストを増やすことなく、コンピューティング容量を柔軟に拡張することができ、コンピューティング容量を過剰にプロビジョニングすることなく、ストレージを拡張できます。ホットなデータには高性能SSDを使用し、コールドデータにはAmazonS3を使用することで、費用効果の高いストレージ、および高いクエリパフォーマンスを提供します。RA3ノードタイプはAWS Nitro Systemをベースとして動作するため、高帯域幅ネットワークを使用して、AmazonS3へのデータのオフロードとAmazonS3からのデータの取得にかかる時間をさらに短縮させることも可能です。RedshiftクラスターをRA3ノードタイプへ変更させることを検討する場合、こちらの手順をご覧ください。

– シニアエバンジェリスト 亀田