Amazon Web Services ブログ

サンプルデータを使用して Amazon QuickSight で試用する 10 の視覚化

Amazon QuickSight を使って視覚化を構築し、ビジネスに関する詳細な情報に素早くアクセスできる方法をまだ知らないなら、ぜひこれを読んでみてください。この記事では、サンプルデータセットを使用して、よくあるシナリオをいくつか紹介しながら、データを接続して高度な分析を行い、ウェブブラウザやモバイルデバイスから結果にアクセスする方法についての概要を解説します。

次の視覚化は、下のリンクで公開されているデータセットから作成されています。その前に、サポートするデータソース、ファイル形式、および典型的な QuickSight ワークフローを見ながら、視覚化をいろいろ構築してみましょう。

Amazon QuickSight はどのデータソースをサポートしていますか?

この記事の公開時には、次のデータメソッドを使用できます。

  • 次のような AWS データソースに接続します。
    • Amazon RDS
    • Amazon Aurora
    • Amazon Redshift
    • Amazon Athena
    • Amazon S3
  • Excel スプレッドシートまたはフラットファイル (CSV、TSV、CLF、および ELF) をアップロードする
  • Teradata、SQL Server、MySQL、PostgreSQL などのオンプレミスデータベースに接続する
  • Salesforce や Snowflake などの SaaS アプリケーションからデータをインポートする
  • Spark や Presto のようなビッグデータ処理エンジンを使用する

このリストは現在も増え続けています。詳細については、「サポートされているデータソース」を参照してください。

瞬時に答える

SPICE は Amazon QuickSight の超高速並列インメモリ計算エンジンで、アドホックなデータの視覚化用に特別に設計されています。SPICE は、高可用性のために設計されたシステムにデータを保存します。このシステムでは、削除するまで保存されます。直接データベースクエリを使用するのではなく、SPICE にデータをインポートして、データベースデータセットのパフォーマンスを向上します。データセットに必要な SPICE の容量を計算するには、「SPICE 容量の管理」を参照してください。

一般的な Amazon QuickSight のワークフロー

分析を作成する際の一般的なワークフローは、次のとおりです。

  1. データソースに接続し、新しいデータセットを作成するか、既存のデータセットを選択します。
  2. (オプション) 新しいデータセットを作成した場合は、(例えば、フィールド名やデータ型を変更して) データを準備します。
  3. 新しい分析を作成します。
  4. 視覚化するフィールドを選択して、ビジュアルを分析に追加します。特定のビジュアルタイプを選択するか、AutoGraph を使用して、選択したフィールドの番号とデータタイプに基づいて、最も適切なビジュアルタイプを Amazon QuickSight に選択させます。
  5. (オプション) 要件を満たすようにビジュアルを変更します (例えば、フィルタを追加する、またはビジュアルタイプを変更するなど)。
  6. (オプション) 解析にさらにビジュアルを追加します。
  7. (オプション) デフォルトのストーリーにシーンを追加して、分析データのいくつかの側面についての説明を作成します。
  8. (オプション) 他のユーザーと正しい情報を共有するため、分析をダッシュボードとして公開します。

次の図は、一般的な Amazon QuickSight ワークフローを示しています。

サンプルデータセットを使用して Amazon QuickSight で作成された視覚化

データアナリストのための視覚化

出典 : https://data.worldbank.org/

ダウンロードとリソース : https://datacatalog.worldbank.org/dataset/world-development-indicators

データカタログ : 世界銀行は、国、地域、および世界レベルで複数の開発プロジェクトに投資しています。ですので、データアナリストにとっては素晴らしい情報源となります。

次のグラフは、2000 年にアジア、アフリカ、中東、中南米で電力にアクセスできる人口 (田舎と都市) の割合を示しています。

次のグラフは、現金で支払われる医療費の割合 (私立と公立) を示しています。さらにグラフを操作して、詳細な統計を一目で確認することも可能です。

トレーディングアナリストのための視覚化

出典 : Deutsche Börse Public Dataset (DBG PDS)

ダウンロードとリソース : https://aws.amazon.com/public-datasets/deutsche-boerse-pds/

データカタログ : DBG PDS プロジェクトは、ドイツ取引所の取引市場システムから派生したリアルタイムデータを一般の人々に無料で提供しています。このような詳細な金融市場データが、出典提供者から自由にかつ継続的に共有されるのは、これが初めてです。

次のグラフは、EU の各銀行の最大貿易量の市場動向を表しています。これは、様々な株式、ファンド、派生証券で構成される XETRA エンジン上で利用可能なデータを基にしています。このグラフをスクロールして 1 時間以上行われた取引を視覚化することができます。

次のグラフは、セキュリティタイプ別にグループ化されており、普通株で残りの市場での最大取引量を一定期間上回っているものを示しています。

データサイエンティストのための視覚化

出典 : https://catalog.data.gov/

ダウンロードとリソース : https://catalog.data.gov/dataset/road-weather-information-stations-788f8

データカタログ : 街の橋の上や路上に置かれた異なるセンサーステーションから得られたデータは、主要な情報源です。道路上の気象情報ステーションは、路面の温度を測定する温度センサーを有します。ステーションの周囲温度を、毎秒測定するセンサーも備えています。

以下のグラフは、異なる RWI ステーションセンサーから来る、シアトルの現在の最大気温を示しています。

次のグラフは、異なる時間での路面の最低温度を示しており、その年の特定時刻の道路状況を予測するのに役に立ちます。

データエンジニアのための視覚化

出典 : https://www.kaggle.com/

ダウンロードとリソース : https://www.kaggle.com/datasnaek/youtube-new/data

データカタログ : Kaggle はオープンデータセットを寄付できるプラットフォームを作り出しました。データエンジニアや他のコミュニティメンバーは、これらのデータセットにオープンにアクセスでき、オープンなデータ移動に貢献することができます。全部で 350 以上のデータセットがあり、200 以上は特別なデータセットです。プラットフォーム上には、他の場所にはない興味深いデータセットがいくつかあり、プラットフォームで他のデータ愛好家とつながることができます。

次のグラフは、流行っている YouTube 動画で、最もお気に入りされている上位 20 チャンネルを表しています。データエンジニアの間で最も人気のあるデータセットの 1 つです。

次のグラフは、特定の期間に公開された動画タイトルの最大視聴回数を示した YouTube の 1 日の統計情報です。

ビジネスユーザーのための視覚化

出典 : ニューヨークのタクシーデータ

ダウンロードとリソース : https://data.cityofnewyork.us/Transportation/2016-Green-Taxi-Trip-Data/hvrh-b6nb

データカタログ : ニューヨーク市のオープンデータは、ニューヨーカーの間で大変人気のあるオープンデータセットをホストしています。このプラットフォームで、データセットを詳しく知り、役に立つ視覚化を構築することができます。2016 年グリーンタクシー走行データセットには、その 1 年にニューヨークのグリーンタクシーで行われたすべての走行記録が含まれています。記録には、乗車と下車の日付と時刻、乗車と下車の場所、走行距離、項目別運賃、レートタイプ、支払いタイプ、運転手が報告した旅客数などがあります。

次のグラフは、1 日の期間中の乗客数で分類された最大運賃額を示しています。これは、ビジネス上での必要性に基づいて、その月の別の日を追跡するといった拡張も行えます。

次のグラフは、2016 年 1 月からのニューヨークのタクシーデータを示しています。2016 年 1 月 23 日にすべてのタクシータイプにわたり乗車のあったタクシー数が減少していることが分かります。

その日付と場所を簡単に検索すると、次のニュースレポートが表示されます。

まとめ

Amazon QuickSight を用いて、視覚化を構築し、アドホック分析を実行し、迅速に正しい情報を生成することで、時系列データ全体のパターンを確認することができます。ぜひ今日、試してみてください!

 


その他の参考資料

この記事が役に立ったのであれば、「Amazon QuickSight でコンボチャートと行レベルのセキュリティのサポートを追加」と「Visualize AWS Cloudtrail Logs Using AWS Glue and Amazon QuickSight」をぜひチェックしてみてください。


著者について

Karthik Odapally はAWS のシニアソリューションアーキテクトです。コスト効率とスケーラビリティの高いソリューションをクラウド上に構築するのに、情熱を傾けています。暇があれば、ここパシフィックノースウェストで、家族や友人にクッキーやカップケーキを焼いています。ヴィンテージのレーシングカーを愛しています。

 

 

 

Pranabesh Mandal は AWS のソリューションアーキテクトです。10 年以上の IT 経験があります。クラウド技術に情熱を注ぎ、特に分析分野に取り組んでいます。仕事以外では、彼の妻と一緒に、米国中の神聖な国立公園をハイキングし、美しい自然と野生生命を探索するのが大好きです。