投稿日: Dec 9, 2020

AQUA (Advanced Query Accelerator) for Amazon Redshift:画期的なハードウェアにより高速化された新しい分散型キャッシュを提供し、他のクラウドデータウェアハウスに比べ最大 10 倍のクエリパフォーマンスを実現

AWS Glue Elastic Views:複数のデータストアのデータを自動的に組み合わせ、レプリケートできるマテリアライズドビューを簡単に構築

Amazon QuickSight Q:機械学習を活用した Amazon QuickSight の新機能により、ビジネスデータに関する自然言語での質問に対し、正確な回答を数秒で提供

Capital One、Best Western Hotels & Resorts、NTTドコモ、Audible、パナソニック アビオニクスをはじめとするお客様が、新機能を活用

(シアトル発、2020年12月1日発表)Amazon.com, Inc.(NASDAQ: AMZN)の関連会社であるAmazon Web Services, Inc.(AWS)は、「AWS re:Invent」にて、3 つの新たなアナリティクスに関する新機能を発表しました。これらの新機能により Amazon Redshift データウェアハウスの機能が飛躍的に向上し、お客様は複数のデータストア間でのデータ移動や組み合わせをより容易に実施できるようになります。またエンドユーザーは、機械学習を利用することで、非常に簡単にビジネスデータの価値を高められます。

• AQUA for Amazon Redshift は、画期的なハードウェアにより高速化された新しい分散型キャッシュによってクエリを加速します。これにより、ストレージにコンピュート機能を付加し、他のクラウドデータウェアハウスと比較して最大 10 倍のクエリパフォーマンスを向上します。2021 年 1 月に一般提供を開始します。
• AWS Glue Elastic Views は、複数のデータストアのデータを使用してアプリケーションを構築する開発者をサポートします。複数のストレージ、データウェアハウス、データベースのデータを自動的に組み合わせ、レプリケートするマテリアライズドビューを実装できます。
• Amazon QuickSight Q は、Amazon QuickSight に機械学習ベースの機能を追加します。ユーザーは Amazon QuickSight Q 検索バーにビジネスに関する質問を自然言語で入力すると、数秒で正確な回答が得ることができます。

20 年前であれば 1 年分に相当する量のデータが、現在は 1 時間で生成されています。事実、今後 3 年間に生成されるデータ量は、過去 30 年の間に生成されたデータ量よりも多くなる見込みです。従来のツールでは、このような新たなデータの時代に対応できません。AWS のお客様は、サーバーレスクエリには Amazon Athena、ログデータの検索と可視化には Amazon Elasticsearch Service、リアルタイムデータストリームには Amazon Kinesis、データウェアハウスには Amazon Redshift、Apache Spark、Hive、Presto、その他のビッグデータフレームワークには Amazon EMR など、目的別に多様なアナリティクスツールを利用しており、こうしたサービスによって AWS のお客様はニーズに適したツールを選択できます。今回新たに発表するアナリティクス機能は、これらを基盤に、お客様の全データストアにおいて、より高速で費用対効果に優れた、アクセシビリティの高いデータ分析を可能にします。詳細は https://aws.amazon.com/big-data/datalakes-and-analytics/ をご覧ください。

AWS のアナリティクス担当バイスプレジデント ラフール・パターク(Rahul Pathak)は、次のように述べています。「本日発表した機能により、Amazon Redshiftのパフォーマンスは格段に向上し、複数データストア間でのデータ移動を、より柔軟な方法で用意に行うことができます。また、お客様はビジネスダッシュボードで自然言語を使って質問すると、数秒でその回答を得られます。これらの機能により、スピードや使い勝手が大幅に向上し、お客様は規模を問わずにデータの価値を高めることができます。」

AQUA (Advanced Query Accelerator) for Amazon Redshift:ストレージレイヤーにコンピュート機能を付加し、他のクラウドデータウェアハウスよりも最大 10 倍速いクエリパフォーマンスを実現
2012 年に従来のデータウェアハウスの10分の1のコストで構築できる、初のクラウド用データウェアハウスとして登場した Amazon Redshift は、最も支持されるクラウドデータウェアハウスになりました。AWS は、今年初頭に Amazon Redshift RA3 インスタンスの一般提供を開始し、お客様はコンピュートとストレージを別々に拡張することで、他のクラウドデータウェアハウスに比べて最大3倍優れたパフォーマンスの実現が可能になりました。しかし、データウェアハウスで処理が必要なデータ量の急増により、RA3 インスタンスを活用してもパフォーマンスと費用対効果のバランスがとれた拡張が難しくなっています。アーキテクチャのビルドアウトにより、一元化された大量のストレージを待機中のコンピュートノードに移動し、データを処理することが、データウェアハウスに対する一般的なアプローチです。しかしこのアプローチには、大量のデータを共有データノードとコンピュートデータノード間で移動する必要があるという課題があります。データが急増し続けることで、こうしたデータ移動がネットワーク帯域幅の飽和を招き、パフォーマンスを低下させます。また、ネットワークのボトルネックだけでなく、CPU もストレージ機能の急拡大に追い付くことができず(SSD ストレージスループットは、CPU のデータ処理能力よりも6倍高速になりました)、新たな CPU ボトルネックが発生するか、作業をスピードアップするためにコンピュートのオーバープロビジョニングを余儀なくされるお客様が増えてしまいます。

AQUA for Amazon Redshiftは、Amazon Redshift 用のハードウェアにより高速化された新しい分散型キャッシュです。AQUA はこれまでにない規模でアナリティクスパフォーマンスを向上する画期的な機能で、ストレージレイヤーにコンピュート機能を付加することにより、2 つの間におけるデータ移動が不要となります。これにより、Amazon Redshift は、他のクラウドデータウェアハウスに比べて最大 10 倍速い速度での実行を実現します。そして、AQUAのキャッシュは複数のノードで同時にスケールアウトし、データの処理を可能にし、各ノードにはAWSが設計したアナリティクスプロセッサから構成されたハードウェアモジュールを搭載します。このプロセッサがデータ圧縮、暗号化、スキャン、アグリゲーション、フィルタリングなどのデータ処理タスクにおける大幅なスピードアップを実現します。AQUAは、お客様にストレージレイヤー内でのコンピュート能力追加というメリットをもたらし、これにより、これまでデータの移動に要していた時間が不要になります。この新しいアーキテクチャとそれがもたらす大幅なパフォーマンス向上により、Redshift をご利用のお客様は最新のダッシュボードの入手、開発時間の短縮が可能になり、システムメンテナンスも容易になります。現在、AQUA プレビュー版はすべてのお客様にご利用いただけます。AQUA は 2021 年 1 月に一般提供開始を予定しており、Redshift RA3 インスタンス上で追加コストなしでご利用いただけます。お客様はコードの変更なしに AQUA によるパフォーマンス向上を利用可能です。AQUA プレビュー版の詳細は、https://pages.awscloud.com/AQUA_Preview.html をご覧ください。

AWS Glue Elastic Views:開発者は複数のデータストアのデータを自動的に組み合わせ、レプリケートするマテリアライズドビューを簡単に構築
現在、多くの企業ではデータレイクを構築中または構築済みであり、適切なセキュリティやアクセスコントロールによって個別のシステムから全データを集約し、アナリティクスや機械学習を容易に実行できます。しかし、レイテンシや運用上の理由から、こうしたデータレイクの外に目的別に設置する専用データストアに保存するデータ量の増加に直面する企業も多く想定されます。こうしたデータレイクや専用データストアに保存されるデータが増加するにつれ、より簡単にデータを移動する方法が求められます。

AWS Glue Elastic Views では、開発者にマテリアライズドビューを簡単に構築するための新機能を提供します。仮想テーブルとも呼ばれるこのマテリアライズドビューは、複数のデータストア間で自動的にデータを組み合わせ、レプリケートします。AWS Glue はサーバーレスのデータ準備サービスで、アナリティクスや機械学習用に抽出、変換、読み込み(ETL)ジョブを簡単に実行できます。AWS Glue Elastic Views の利用により、お客様は SQL を使って各種データストアから好みのデータを抽出して組み合わせ、データのマテリアライズドビューを作成できます。また、AWS Glue Elastic Views はデータをコピーし、各種ソースからマテリアライズドビューを作成します。たとえば、Amazon Aurora からレストランの位置情報を抽出し、Amazon DynamoDB に保存された顧客レビューと組み合わせ、Amazon Elasticsearch Service 上でレストランの所在地別レビューを検索できるエンジンを構築したい場合などが想定できます。AWS Glue Elastic Views は各ソースデータベースからターゲットデータベースにデータをコピーし、ターゲットデータベース内のデータを自動で最新の状態に維持します。Elastic Viewsはソースデータベースに変更がないか継続的に監視し、数秒以内にターゲットデータベースを更新します。いずれかのソースデータベースに変更があった場合、Elastic Views からのアラートで、開発者は変更に応じたマテリアライズドビューの調整ができます。Elastic Viewsを使用して基幹業務処理に関するデータを業務データベースからデータレイクにコピーし、ほぼリアルタイムでのアナリティクスの実行も可能です。AWS Glue Elastic Views はワークロードの増減に応じて自動的にキャパシティの拡大、縮小を行うことで、ターゲットデータベース内のマテリアライズドビューを常に最新の情報に維持します。AWS Glue Elastic Views プレビュー版の詳細は、http://aws.amazon.com/glue/features/elastic-views をご覧ください。

Amazon QuickSight Q:機械学習に基づく Amazon QuickSight 向けの機能であり、ビジネスデータに関する自然言語での質問に対し、正確な回答を数秒で提供
Amazon QuickSight は、クラウド用に構築された機械学習ベースのビジネスインテリジェンス(BI)サービスで、スケーラブル、サーバーレス、組み込み可能という特長を備え、先進的かつインタラクティブなセルフサービスの BI ソリューションによるあらゆるメリットを提供します。このソリューションでは、アプリケーションにダッシュボードを簡単に組み込むことができ、費用対効果の高い方法で拡張し、数千規模の顧客をサポートできます。Amazon QuickSightのAuto-Narratives(自動説明文)は、BI ダッシュボードのデータを解釈して平易な言葉の要約を自動生成し、お客様に提供するため、すべてのユーザー間でデータの解釈を共有できます。平易な表現のため、お客様は共有するダッシュボード内のデータをすぐに理解し、最も重要なインサイトに焦点を絞ることができます。一方で、お客様からは普段使う言語を用いた、ビジネスデータに関する質問にほぼリアルタイムに回答を得られる機能への関心も寄せられています。自然言語クエリ(NLQ)によってこの課題を解決しようとする BI ツールやベンダーもありますが、こうした既存のアプローチでは、お客様は最初に数か月を要してモデルの準備と構築を行う必要があり、それでもなおデータモデルで事前に定義されていないような新たな計算が必要な質問はできません。たとえば「前年比での成長率は?」という質問をするには、「成長率」をモデル内の計算式として事前に定義しておく必要がありますが、既存のBIツールでは、ユーザーは BI チームと協力して新しい計算やデータに備えてモデルを更新しておく必要があり、それには数日または数週間の作業が必要になることがあります。

Amazon QuickSight Q では、あらゆるデータに関する質問を自然言語で行い、数秒で回答を得ることができます。Amazon QuickSight Q の検索バーに入力するだけで質問でき、ユーザーが質問を入力し始めると、Amazon QuickSight Q が主なフレーズやビジネス用語をもとにオートコンプリートの提案し、スペルチェックや略語、類義語の照合も自動で行うため、ユーザーは入力ミスを気にしたり、正確なビジネス用語を覚える必要がありません。Amazon QuickSight Q はディープラーニングと機械学習(自然言語処理、スキーマ理解、SQL コード生成のためのセマンティック解析)を使用してビジネスデータの意味と関係を自動的に理解するデータモデルを生成します。そのため、ユーザーはビジネスに関する質問に対して非常に正確な回答を得ることができ、データモデルが構築されるまで数日、または数週間も待つ必要がありません。Amazon QuickSight Q では BI チームによるデータモデル構築は不要なため、ユーザーは特定の質問に限定されることなく、自由に質問できます。また、事前に設定されたモデル内のデータセットだけでなく、すべてのデータにクエリが適用されるため、完全かつ正確な回答を得られます。Amazon QuickSight Q は営業、マーケティング、業務支援、小売、人事、医薬品、保険、エネルギーなど、様々なドメインのデータを使い、事前にトレーニングされた状態で提供されるため、複雑なビジネス用語も理解できるように最適化されています。たとえば、営業部門のユーザーによる「ノルマに対してどの程度の売上を達成しているのか」といった質問や、小売業のユーザーによる「地域別にみた週単位の売上トップ商品は」という質問が想定できます。さらに、Amazon QuickSight Q では、ユーザーとのインタラクションから学び、継続的に精度を高めます。Amazon QuickSight Q が質問に含まれているフレーズを理解できなかった場合、検索バーのドロップダウンメニューから候補となるフレーズを選択するようにユーザーに促し、次回のインタラクション用にフレーズを記憶します。Amazon QuickSight Q の詳細は https://aws.amazon.com/quicksight/q をご覧ください。

NTTドコモは、日本最大の携帯電話会社で、8000 万人以上の顧客にサービスを提供しています。NTTドコモのサービスイノベーション部長、太田 賢氏は次のように語っています。「2014 年の Amazon Redshift への移行以来、Amazon Redshift は弊社のアナリティクス環境の中核を成しています。以前のオンプレミスシステムに比べて 10 倍ものパフォーマンス向上を実現し、10 ペタバイト以上の非圧縮データへと拡張できました。データとデータ量に対するお客様のニーズは高まっており、システム拡張に必要な柔軟性と操作性を Amazon Redshiftによる継続的なイノベーションによって得られています。当社は Amazon Redshift データウェアハウスのパフォーマンス向上と規模拡大を引き続き行う予定であり、AQUA for Amazon Redshift の発表を歓迎しています。」

アクセンチュアはデジタル、クラウド、セキュリティ分野に精通したグローバルなプロフェッショナルサービス企業です。アクセンチュアの北米データ & AI AWS 担当リード、A.K. ラドハクリシュナン(A.K. Radhakrishnan)氏は次のように語っています。「アクセンチュアは、世界中のお客様がデータを活用し、リアルタイムでの意思決定を行うためのサービスとソリューションを提供しています。しかし、データやインサイトへのニーズが急増する中、データの定義、優先付け、処理が難しくなっています。最大 10 倍速のクエリパフォーマンスにより、データウェアハウジングに対する画期的な方法を提供する AQUA for Amazon Redshift で、弊社はデータドリブンな企業の実現に向けたサポートを行いやすくなります。」

Audible はオリジナルのスポークン・ワードエンターテイメントとオーディオブックのトッププロデューサであり、プロバイダとして、毎日数百万人のリスナーの暮らしを豊かにしています。Audible のプリンシパルソフトウェア開発エンジニアのシャイレシュ・ヴィアス(Shailesh Vyas)氏は次のように語っています。「Audible ではお客様が複数のカテゴリーでオリジナルのエンターテイメントやオーディオブックを検索し、見つけることができます。こうしたエクスペリエンスを提供するためには、複数のデータベースからデータを迅速に分析し、パーソナライズされた結果を提供する必要があります。弊社内の各種データベースのデータからマテリアライズドビューを作成するために、AWS Glue Elastic Views をサーバーレスソリューションとして利用したいと考えています。AWS Glue Elastic Views によって、開発者の作業がスピードアップし、複雑なデータ統合パイプラインの管理ではなく、お客様のためのイノベーションに専念できるようになると期待しています。」

アリゾナ州フェニックスに本拠地を置く Best Western Hotels & Resorts は世界中の 100 以上の国と地域に約 4,700 のホテルを所有する株式非公開のグローバルホテルネットワークブランドです。Best Western はあらゆる市場のデベロッパーやゲストのニーズに合わせて 18 のホテルブランドを提供しています。Best Western Hotels & Resorts のデータベースおよびエンタープライズアナリティクス担当シニア・マネージャのジョセフ・ランドゥッチ(Joseph Landucci)氏は次のように語っています。「Amazon QuickSight の従量課金設定とサーバーレスのアーキテクチャにより、Best Western のリーンアナリティクスチームのアジリティが高まり、以前のアナリティクスアーキテクチャの半分未満のコストでアジリティとビジネスバリューを向上できました。そして、Amazon QuickSight Q によってビジネスパートナーが自分自身で質問することで、個別リクエストの対応に要するチームの運用経費も削減できると期待しています。パートナーは平易な言葉で質問を入力するだけで、重要なビジネス上の質問に対する回答をすぐ得られるでしょう。」

パナソニック アビオニクスは、インフライトエンターテイメントと通信システムの世界的トップサプライヤです。パナソニック アビオニクスのクラウドオペレーション責任者のアナンド・デシカン(Anand Desikan)氏は次のように語っています。「当社のクラウドベースソリューションは匿名化された大量のデータを収集し、パートナーである航空会社とその乗客のエクスペリエンス最適化に役立てています。インフライト Wi-Fi パフォーマンスの報告において Amazon QuickSight の利用を始めましたが、豊富な API と従量制の価格設定、優れたスケーラビリティによって、Amazon QuickSight ダッシュボードを数百のユーザーにすぐに導入できました。このプラットフォームの継続的な進化は目覚ましいものがあります。機械学習ベースの異常検出、Amazon SageMakerの統合、組み込み、テーマ設定、クロスビジュアルフィルタリング、そして今回の Amazon QuickSight Q の追加により、ユーザーは検索バーにビジネスに関する質問を入力するだけで Amazon QuickSight Q がビジネスコンテキストの解釈、類語の提示、そしてわかりやすい回答を提供するため、インサイトを活用しやすくなります。 」