AWS での分析

すべてのユーザーが、すべてのデータから最速で回答を得るための方法
スケーラブルなデータレイク
数万におよぶお客様が、AWS 上でデータレイクを実行しています。今日のデータレイクの設定や管理には、時間のかかる手作業のタスクが数多く必要となります。AWS Lake Formation により、そういった設定タスクが自動化できます。お客様は数か月ではなく数日の内に、データレイクを安全にビルドすることができます。Amazon S3 は、データレイク用としてストレージを配置するには最良の場所です。他に類を見ないその耐久性は 11 桁の 9 で表されるもので、また可用性も 99.99% を確保します。オブジェクトレベルの監査ログインやアクセスコントロールを備えた、セキュリティ、コンプライアンス、監査のための最高の機能もあります。最高の柔軟性があるストレージは 5 つの階層で構成されています。さらに、料金は 1 月で 1 TB ごとに 1 USD からという、最低レベルのコストでご使用いただけます。
専用分析サービス
AWS では、お客様固有の分析ユースケースに最適化できる、最も広範で奥の深い専用分析サービスのポートフォリオをご用意しています。これらのサービスは、クラスで最高の性能を実現するために設計されています。したがって、これをご使用になるお客様は、性能、規模、そしてコストの面で、一切の妥協をする必要はありません。例えば、Amazon Redshift では、他のクラウドデータウェアハウスと比較した場合、3 倍高速で動作し、費用は最小でも 50% 低く抑えられます。Spark on Amazon EMR では、標準的な Apache Spark 3.0 の 1.7 倍という高速で動作し、ペタバイト規模の分析を、従来のオンプレミスソリューションのコストに対し半分以下で実行できます。
シームレスなデータ移動
データレイクと専用データストア内でデータ量が増加していくと、しばしば、1 つのデータストアから別の場所へと、データの一部を簡単に移動するための手段が必要になることがあります。AWS では、複数のデータストアとデータレイクの間で、データを統合、移動、複製するための、簡単な方法が用意されています。例えば AWS Glue では、データ統合のための包括的な機能がご利用になれます。この機能では、分析、機械学習、アプリケーション開発などのために、簡単にデータを発見、準備、統合できるようにします。また、Amazon Redshift を使用すれば、S3 データレイクの中のデータを、簡単にクエリできます。最も必要とされている場所への大規模なデータの移動が、これ程、容易に行える分析プロバイダーは他に存在しません。
統合されたガバナンス
現代の分析アーキテクチャにおいて、最も重要な要素の 1 つは、データへのアクセスを認証、管理、監査するための能力を、ユーザーに与えるということです。これは簡単なことではありません。何故なら、組織内のすべてのデータストアについて、セキュリティやアクセスコントロール、そして証跡の監査などを管理することは、複雑で時間を要し、さらにエラーの原因ともなる作業だからです。一元化したアクセスコントロールやポリシー、そして、列レベルでのデータのフィルタリングなどの機能により、他の分析プロバイダーにはない管理機能が提供されます。データレイクや専用データストア全体でのデータに対するアクセスを、単一的な場所から管理できます。
高いパフォーマンスと低コスト
AWS は、すべての分析サービスにおいて、最低のコストで最良のパフォーマンスをご提供することにコミットしています。また、サービスにおけるコストパフォーマンスを改善するためのイノベーションにも、継続的に取り組んでいます。この、分析サービスにおける業界でもトップレベルのコストパフォーマンスに加え、S3 Intelligent Tiering をご利用のお客様は、データレイクへのデータの保存において、最大 70% のコストダウンが図れます。また Amazon EC2 では、業界トップクラスとなる 200 を超えるインスタンスタイプ数の中から選択が可能です。ネットワークの帯域幅は最大 100Gbps で、インスタンスはオンデマンド、リザーブド、スポットの各種から選択が可能です。

AWS の分析サービス

カテゴリ
ユースケース
AWS のサービス
分析
インタラクティブ分析

Amazon Athena

SQL を使用した S3 でのデータクエリ。

ビッグデータ処理

Amazon EMR

ホストされた Hadoop フレームワーク。

データウェアハウジング

Amazon Redshift

高速かつシンプルで、費用対効果の高いデータウェアハウジング。

リアルタイム分析

Amazon Kinesis

リアルタイムの動画とデータストリームを分析。

運用上の分析

Amazon Elasticsearch Service

Elasticsearch クラスターを実行し、スケールする。

ダッシュボードと可視化

Amazon QuickSight

高速なビジネス分析サービス。

ビジュアルデータの準備

AWS Glue DataBrew

データのクリーニングと正規化を 80% まで高速化します。

データの移動
リアルタイムのデータ移動

Amazon Managed Streaming for Apache Kafka (MSK)

完全マネージド型で可用性が高くセキュアな Apache Kafka サービス

Amazon Kinesis Video Streams

分析と機械学習のために動画ストリームをキャプチャ、処理、保存。

Amazon Kinesis Data Firehose

リアルタイムのデータストリームを準備し、データストアや分析ツールにロード。

Amazon Kinesis Data Streams

リアルタイム分析向けにストリーミングデータを大規模に収集。

データレイク
オブジェクトストレージ

Amazon S3

どこからでもお好みの量のデータの保存と取得が簡単に行えるオブジェクトストレージ。

AWS Lake Formation

安全なデータレイクを数日で構築。

バックアップとアーカイブ

Amazon S3 Glacier

クラウド上の低コストなアーカイブストレージ

AWS Backup

AWS のサービス全体にわたる一元管理型バックアップ

データカタログ

AWS Glue

データを準備してロードする。

AWS Lake Formation

安全なデータレイクを数日で構築。

サードパーティーのデータ

AWS Data Exchange

クラウド内サードパーティーのデータを見つけてサブスクリプションします。

予測分析と機械学習
フレームワークとインターフェイス

AWS 深層学習 AMI

Amazon EC2 でのディープラーニング

プラットフォームサービス

Amazon SageMaker

機械学習モデルを大規模に構築、トレーニング、デプロイ。

AWS の分析サービス

カテゴリ ユースケース AWS のサービス
分析 インタラクティブ分析 Amazon Athena
ビッグデータ処理 Amazon EMR
データウェアハウジング Amazon Redshift
リアルタイム分析 Amazon Kinesis Data Analytics
運用上の分析 Amazon Elasticsearch Service
ダッシュボードと可視化 Amazon QuickSight
ビジュアルデータの準備 Amazon Glue DataBrew
データの移動 リアルタイムのデータ移動 Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Video Streams | AWS Glue
データレイク オブジェクトストレージ Amazon S3 | AWS Lake Formation
バックアップとアーカイブ Amazon S3 Glacier | AWS Backup
データカタログ
AWS Glue | AWS Lake Formation
サードパーティーのデータ AWS Data Exchange
予測分析と機械学習 フレームワークとインターフェイス AWS 深層学習 AMI
プラットフォームサービス Amazon SageMaker

ユースケース

Page-Illo_Data-warehousing
データウェアハウジング

データウェアハウスやデータレイク内の構造化データおよび非構造化データに対して SQL や複雑な分析クエリを実行します。この際、不必要なデータ移動を行う必要はありません。

Amazon Redshift を試す »
Page-Illo_Big-data-processing
ビッグデータ処理

データエンジニアリング、データサイエンス開発、コラボレーションのために、データレイクまたはオンプレミスの大量のデータをすばやく簡単に処理します。

Amazon EMR を試す »
Page-Illo_Real-time-analytics
リアルタイム分析

ストリーミングデータを収集、処理、分析し、データストリームを直接データレイク、データストア、および分析サービスにロードして、リアルタイムな応答を可能にします。

Amazon MSK を試す » Amazon Kinesis を試す »
Page-Illo_Data-visualization
運用上の分析

アプリケーションのモニタリング、ログ分析、クリックストリーム分析を行う場合に、データの検索、調査、フィルタリング、集計、可視化をほぼリアルタイムで実行できます。

Amazon Elasticsearch Service を試す »

お客様

JD-Power_Logo_@1x

「私たちは、Glue、Redshift、Athena といった AWS の分析サービスを広範に使用し、1500 の異なるスキーマからなる 120 TB のデータレイクを Amazon S3 に構築しました。サイロ化した多くのデータベースとデータウェアハウスからはこのようなインサイトは得られませんでした。S3 規模のデータレイクが必要だったのです」

– Bernardo Rodriguez 氏
J.D. Power、最高デジタル責任者

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
エピックゲームズ
Equinox.svg
Adobe_Customer-Reference_Logo
Pfizer
お客様をすべて表示 »

その他のリソース

AWS Data Lab

具体的な成果物の作成を通じて、データや分析のモダナイズを加速します。AWS Data Lab は、お客様のビルダーチームと AWS のテクニカルリソースとの間で行われる 4 日間の集中プログラムです。

詳細はこちら »