投稿日: Jul 13, 2022
※本プレスリリースは、2022 年 7 月 12 日に米国で発表されたプレスリリースをもとに作成しています。
- Amazon EMR Serverless、Amazon MSK Serverless に加え、Amazon Redshift Serverless の新しいサーバーレスオプションにより、お客様は基盤となるインフラの設定、拡張・管理をせずに膨大なデータ量の分析が可能に
- この新たなサーバーレス分析オプションを Informatica、NextGen Healthcare、Huron を含むお客様およびパートナーが採用
Amazon.com, Inc. の関連会社である Amazon Web Services, Inc.(AWS)は本日、基盤となるインフラストラクチャの設定や拡張・管理をすることなく、お客様が膨大なデータをより簡単に分析できる新しいサーバーレス(※)分析サービス群を提供開始することを発表しました。新たに提供を開始するサーバーレス分析サービスは、基盤となるインフラを管理することなく、オープンソースのビッグデータフレームワーク(Apache Spark およびApache Hive)を活用した分析アプリケーションを実行できるようにする Amazon EMR、リアルタイムデータの取り込みとストリーミングを簡素化する Amazon Managed Streaming for Apache Kafka(AmazonMSK)、そして今回新たにクラスタを管理することなくペタバイト規模のデータに対する高速なデータウェアハウスおよび分析ワークロードを可能にする Amazon Redshift が加わり、3 つとなります。これらは、ビジネスインテリジェンスサービスである Amazon QuickSight やデータ統合サービスの AWS Glue など、AWS が提供するさまざまなサーバーレス分析サービスとともに、お客様がキャパシティプランニングを気にしたり、ピーク需要に対して過剰なプロビジョニングを行うことによって超過コストを発生させることなく、より簡単かつコスト効果の高い方法でインフラストラクチャの最適化と膨大なデータ分析を行えるよう支援します。 Amazon EMR Serverless、Amazon MSK Serveless、Amazon Redshift Serveless の利用には、先行投資や追加費用は不要で、お客様は分析ワークロードに必要な容量に対してのみ料金を支払うことになります。
※ 抄訳版の注釈:「サーバーレス」とは:サーバーを管理することなく、コードの実行、データの管理、アプリケーションの統合を行うための技術。サーバーレス技術には、オートスケーリング、ビルトインの高可用性、使用量に応じた課金モデルなどの特徴があり、俊敏性の向上とコストの最適化を実現します。参考サイト:https://aws.amazon.com/jp/serverless/
AWS データベース 兼 アナリティクス 兼 機械学習 バイスプレジデント スワミ・シヴァスブラマニアン(Swami Sivasubramanian)は、次のように述べています。
AWS のお客様は、膨大な非構造化データを処理するための Amazon EMR(Apache Spark や Apache Hive などオープンソースのビッグデータフレームワークを使用)、リアルタイムのデータストリームを取り込むための Amazon MSK、データウェアハウス用の Amazon Redshift など、組織が保有するデータから最大の価値を引き出すために、さまざまな利用目的に応じた分析サービスから選択することが可能です。多くのお客様は、これらのサービスが提供するきめ細かいコントロールを高く評価していますが、非常に変動的な、または断続的なワークロードを持つ一部のお客様は、アプリケーションのニーズに基づいてリソースを自動的に追加または削減することで、AWS が基礎となるインフラストラクチャを管理することを求めています。インフラの拡張と管理の複雑さを取り除くために、AWS は 2014 年にサーバーレス、いわゆるイベン駆動型コンピューティングの概念を導入しました。以来、多くのお客様が、リアルタイムデータストリーミングの Amazon Kinesis Data Streams、データ統合の AWS Glue、インタラクティブなダッシュボードや可視化の Amazon QuickSight などのサーバーレス技術を AWS に採用し、自動プロビジョニング、オンデマンドスケーリング、利用量に応じた従量課金などの利点を活用しています。Amazon EMR、Amazon MSK、Amazon Redshift 向けの新しいサーバーレスサービスにより、AWS はクラウド上で最も幅広いサーバーレスの分析ケイパビリティを提供し、お客様のコスト削減とより多くのユーザーに分析を拡大し、データの価値を最大化することを容易にします。
- Amazon EMR Serverless によるサーバーレス・ビッグデータ分析:何万人ものお客様が Amazon EMR を使用して、Apache Spark や Apache Hive などのオープンソースフレームワークを実行し、大規模な分散データ処理ジョブ、インタラクティブな SQL クエリ、機械学習アプリケーションを実行しています。Amazon EMR は、クラウド上で最も多くのビッグデータフレームワークをサポートしており、お客様はオンプレミスソリューションの半分以下のコストで、ビッグデータアプリケーションやペタバイト規模のデータ分析をより迅速に実行することができます。Amazon EMR Serverless では、お客様は実行したいフレームワークを指定するだけで、ワークロードの需要の変化に応じて、必要なコンピュートおよびメモリリソースを自動的にプロビジョニング、管理、拡張することができます。お客様は、オープンソースのフレームワークを選択し、Amazon EMR アプリケーションプログラミングインターフェース(API)、AWS コマンドラインインターフェース(AWS CLI)、または Amazon EMR Studio の統合開発環境(IDE)を使用してジョブを送信するだけで、Amazon EMR Serverless を開始することが可能です。Amazon EMR Serverless は、米国東部(ノースバージニア州)、米国西部(オレゴン州)、アジア太平洋(東京)、ヨーロッパ(アイルランド)で Amazon EMR を実行しているお客様に対して本日より一般提供が開始され、その他の AWS リージョンでも近日提供される予定です。Amazon EMR Serverless の利用開始については、aws.amazon.com/emr/serverless をご覧ください。
- Amazon MSK Serverless によるサーバーレスデータストリーミング:昨今、モノのインターネット(IoT)デバイス、ウェブサイトのクリックストリーム、データベースログなど、動的なデータが継続的に生成される多くのソースからリアルタイムのデータストリームを取得・分析するために、Apache Kafka を採用する企業が増えています。この新しいサーバーレスオプションにより、Amazon MSK Serverless がクラスタのプロビジョニング、管理、スケーリングを自動的に行うため、お客様はキャパシティプランニングや予測不可能なストリーミングワークロードを気にする必要がなくなります。Amazon MSK Serverlessは、Amazon MSK コンソールでクラスターを作成し、プライベートで安全な Apache Kafka エンドポイントを設定、そして新規または既存の Apache Kafka クライアントを使用してデータのストリーミングを行うだけで利用することができます。Amazon MSK Serverless は、米国東部(オハイオ州)、米国東部(ノースバージニア州)、米国西部(オレゴン州)、アジア太平洋(シンガポール)、アジア太平洋(シドニー)、アジア太平洋(東京)、欧州(フランクフルト)、欧州(アイルランド)、欧州(ストックホルム)で Amazon MSK を実行しているお客様に対して本日より一般提供が開始され、その他の AWS リージョンでも近日提供される予定です。Amazon MSK Serverless の利用開始については、aws.amazon.com/msk/features/msk-serverless をご覧ください。
- Amazon Redshift Serverless によるサーバーレスデータウェアハウス:数万社のお客様が、Amazon Redshift で毎日 2 エクサバイト以上のデータをまとめて処理しています。Amazon Redshift は、他のエンタープライズ向けクラウドデータウェアハウスと比較して最大3倍の価格性能比を実現しており、お客様に低コストで高速なデータ分析を提供することができます。Amazon Redshift Serverless は、データウェアハウスのインフラを管理する必要がなく、データからインサイトをスピーディーに取得することをより一層容易にしています。現在、Amazon Redshift クラスターを独自に管理しているお客様は、アプリケーションに変更を加えることなく、Amazon Redshift コンソールまたは API を使用して、新しいサーバーレスオプションへの移行を選択することができます。Amazon Redshift Serverless は、米国東部(オハイオ州)、米国東部(ノースバージニア州)、米国西部(オレゴン州)、アジア太平洋(シンガポール)、アジア太平洋(シドニー)、アジア太平洋(ソウル)、アジア太平洋(東京)、欧州(フランクフルト)、欧州(アイルランド)、欧州(ロンドン)および欧州(ストックホルム)で Amazon Redshift を実行しているお客様に対して本日より一般提供が開始され、その他の AWS リージョンでも近日提供される予定となっています。Amazon Redshift Serverless の利用開始については、aws.amazon.com/redshift/redshift-serverless をご覧ください。
Apache Kylin を搭載した Kyligence Cloud は、企業のビッグデータに関するビジネスインテリジェンスと分析を促進しています。 Kyligence Cloud 共同創業者 兼 CEOのルーク・ハン(Luke Han)氏は、次のように述べています。「お客様が膨大な量のデータからビジネス上の重要な意思決定を行えるようにするために、当社のプラットフォームでは Spark ジョブを使って大量のデータを読み込み、処理しています。これを大規模に行うにはコストがかかり、運用上のオーバーヘッドが必要になります。私たちは Amazon EMR Serverless を採用することで、クラスタの維持とチューニングにかかるコストと管理作業を削減することができました。Amazon EMR Serverless は、ワークロード需要の変化に応じてクラスタの管理、チューニング、パフォーマンスの最適化といった時間のかかる作業を代行し、複雑さを軽減します。また、以前のソリューションよりも低コストで利用できるため、コスト削減分を顧客に還元することができます。」
Glas Data は、農業分野でのデータ管理を簡素化しています。Glas Data CTO 兼 創業者の ロバート・サンダース(Robert Sanders)氏は、次のように述べています。「私たちは、Amazon MSK を利用してリアルタイムによるデータの取り込み、処理、分析、そしてアラートの自動化をお客様に提供しています。私たちのワークロードは非常に変動的で、予測不可能です。あるアクションでは、少量の容量を必要とする少数のメッセージしか生成されず、別のアクションでは、はるかに多くの容量を必要とする多数のメッセージが生成されます。このワークロードの変動性により、どのアクションがどのタイミングで実行されるかを予測することが難しく、予期せぬ容量の制約を避けるために、常に容量を監視して調整する必要がありました。Amazon MSK Serverless は、ワークロードの要件に基づいて自動的に容量を増減するため、システム管理のオーバーヘッドがなくなり、メモリやストレージの制約を気にすることなく、また過剰なコストをかけることなく、自由にソリューション開発を行えるようになりました。」
NextGen Healthcare は、医療従事者とその患者の生活を向上させることを使命として、革新的な医療技術ソリューションを提供するリーディングカンパニーです。NextGen Healthcare アプリケーションデリバリー担当 兼 副社長 オーウェン・ザッカリアス(Owen Zacharias)氏は、次のように述べています。「当社の NextGen Population Health ソリューションは、さまざまなデータソースから取得したデータを集約・変換することにより、実用的なインサイトを直接ケアチームに提供してます。データウェアハウスインフラの設定や管理といった手作業を減らすためにシステムを最適化することは、私たちの成功にとって非常に重要です。Amazon Redshift Serverless を使用することで、複雑なデータウェアハウス統合システムの管理が不要になりました。Amazon Redshift Serverless はワークロードのパフォーマンスを向上させ、その自動スケーリング機能により、使用した分だけ支払いながら、最もダイナミックなワークロードにも Amazon Redshift の俊敏性を活用できます。さらに私たちは、追加のワークロードを Amazon Redshift Serverless に移行することに期待しています。これこそまさに、ゲームチェンジャーとなるサービスです。」
インフォマティカは、データの接続、管理、統合、管理を行うエンドツーエンドのクラウドデータ管理プラットフォームを提供し、企業のデータ戦略のモダナイゼーションと推進を支援しています。インフォマティカエコシステムズ担当上級副社長であるリック・タム-ダニエルズ((Rik Tamm-Daniels)氏は、次のように述べています。「今日の組織は、データとアナリティクスの拡大を模索していますが、データサイロ、コスト制約、インフラ管理などの課題に直面しています。Amazon Redshift Serverless は、ニーズに応じてリソースを自動的にプロビジョニングおよびスケーリングすることで、これらの課題に対応し、データウェアハウスインフラのセットアップや管理の必要性、ピーク需要に合わせた過剰プロビジョニングによる過剰コストの心配なく、簡単に分析を実行できるようにします。AWS上のインテリジェントデータ管理クラウドとともに、Amazon Redshift Serverless は、インフォマティカのお客様に、ビジネスに不可欠な取り組みを強化するサーバーレスデータおよび分析基盤を提供する上で役立っています。」
Rail Delivery Group(RDG)は、英国の鉄道を運営する企業を 1 つのチームにまとめ、より良い鉄道体験を提供することを目的としています。Rail Delivery Group データ&アナリティクス責任者 トビー・エアー(Toby Ayre)氏は、次のように述べています。「Amazon Redshift Serverless は、私たちのチームに高いパフォーマンスを提供し、基盤となるデータウェアハウスを自動的に規定・管理するため、より多くのビジネスユーザーが迅速かつ容易にデータからインサイトを得ることができます。Amazon Redshift Serverless は、データウェアハウスの容量を自動的に拡張し、当社の最も要求が高く予測不可能なワークロードにも対応できるため、コストの削減と組織全体での分析の活用拡大を支援するものです。」
Huron は、顧客と協業して、健全な戦略の策定、オペレーションの最適化、デジタル変革の加速、企業とその従業員が自らの未来を切り開くための能力強化を実現するグローバルなプロフェッショナルサービス企業です 。Huron データエンジニアのハリー・ゴラコタ(Harry Gollakota)氏は、次のように述べています。「私たちは、Amazon Redshift Serverless をデータ分析ワークフロー追加機能に加えることができ、大変嬉しく思っています。このサービスは、私たちの以前のインフラのいくつかの部分をシームレスに置き換え、そのシンプルさによって非常に使いやすくなっています。Amazon Redshift Serverless は、データエンジニアリングのレイテンシーを劇的に削減し、開発を加速させる力強い味方となっています。Amazon Redshift Serverless を導入することで、データエンジニアリングのバックログを削減し、今ではデータからインサイトを収集することに多くの時間を割くことができています。」