Amazon Web Services ブログ

Category: Analytics

AWS サーバーレスサービスを使用してクリックストリームデータをキャプチャする

クリックストリームデータとは、ユーザーと Web サイトまたはモバイルアプリケーションとの間で発生するデジタルインタラクションを収集したものです。リアルタイムにユーザーデータを収集し有用なインサイトを作成することは困難な場合があります。アマゾン ウェブ サービス(AWS)のサーバーレスサービスは、クリックストリームデータをシームレスにキャプチャ、処理、視覚化し、分析基盤に取り込むためのスケーラブルなアーキテクチャを提供するために役立ちます。本ブログでは、AWS のサービスによって、サーバーのプロビジョニングや管理を必要とせずにクリックストリームデータを簡単に収集して処理する方法について詳しく見ていきます。

クリックストリームデータによるビジネス成果の促進

今日のビジネス環境は変化が速いため、タイムリーなビジネス意思決定では、新しいデータに何時間も何日もアクセスするのではなく、リアルタイムでアクセスする必要があります。競争力を維持し、現在の市場の状況に合わせて十分な情報に基づいた意思決定を行うためには、組織はリアルタイムの情報を自由に利用できなければなりません。市場が急速に変動し、顧客の好みが変化すると、古くなったデータによって機会を逃したり、インサイトが古くなったりして、顧客体験が最適ではなくなる可能性があります。企業は、自社のデータ(ファーストパーティデータ)の所有権を取り戻し、顧客や見込み客の情報の力を活用して競争力を高め、より顧客体験をもたらすべく取り組む必要があることを認識しています。ファーストパーティデータの例としては、企業が顧客の行動や好みについての理解を深めるための大きな可能性を秘めたクリックストリームデータがあります。

カヤバ株式会社における Amazon Quantum Ledger Database を活用した品質データ管理システムのモダナイゼーション

本稿では カヤバ株式会社 (以下、カヤバ)のデジタル変革推進本部が中心となり、オンプレミスに存在したシステム群 […]

AWS サービスを活用して代替商品を提案するためのガイダンス

完璧な世界であれば、小売業者は決して在庫切れを起こすことはありませんが、予期せぬ需要により最善の状況にならない場合もあります。食料品店は平均して営業時間の 8.2% は在庫切れの状態になっており、さらにプロモーション品では 15% にもなるため、70 億ドルから 120 億ドルの売上機会損失の危機にさらされています。次善の策は、おそらく顧客のニーズを満たす同様の商品を提供することです。注文をピッキングする従業員に自動でおすすめの代替商品を提案することで、顧客体験を向上させ、売上減少を防ぐことができます。

2020 年、米国のオンライン食料品売上は 54% 増加し、その注文の半分以上において注文した商品の内少なくとも 1 つが在庫切れになっていました。その商品は売れずにスキップされて売上減少につながることもあれば、注文をピッキングする従業員が代替品を推測することもありますが、その代替品が顧客のニーズを全く満たしていないこともあります。いずれにせよ、顧客体験は悪影響を受け、企業ブランドは傷つきます。

より良いアプローチは、異なるブランド、色、フレーバー、サイズなどの類似の商品を推奨することです。これがインテリジェントに行われれば、良好な顧客体験が保たれ、問題は回避されます。大量の商品に代替ルールを作成することは非効率的で効果的ではありません。その代わりに、Amazon Web Services (AWS) はおすすめの代替商品を提案するソリューションを構築しガイダンスとして公開しています。

Amazon OpenSearch Service を使うと、在庫切れ商品からおすすめの代替商品を提案できます。商品名と説明は、テキスト埋め込みアルゴリズムを使用して数値ベクトルに変換され、OpenSearch Service の K 最近傍 (k-NN) インデックスに挿入されます。代替商品を要求する際、候補商品は OpenSearch Service の事前フィルタリングを使用して絞り込まれ、探していた商品からの数値表現の近さに基づいてランク付けされます。

AWS DMS、Amazon Kinesis、AWS Glue ストリーミング ETL ジョブを用いて Apache Hudi ベースのニアリアルタイムトランザクションデータレイクを構築し、Amazon QuickSight で可視化

最近、AWS Glueバージョン4.0でストリーミングの抽出、変換、およびロード(ETL)ジョブのサポートが発表されました。これは、AWSにおけるデータ統合ワークロードを加速する新しい AWS Glue のバージョンです。AWS Glue のストリーミングETLジョブは、ストリーミングソースから連続的にデータを取り込み、データを逐次的にクリーンアップおよび変換し、数秒で分析可能なデータにします。AWSはさまざまなサービスを提供しており、AWS Database Migration Service(AWS DMS)などのデータベースレプリケーションサービスを使用して、ソースシステムからデータを Amazon Simple Storage Service(Amazon S3)に複製することができます。これは通常、データレイクのストレージレイヤーとして使用されます。この投稿では、Amazon Relational Database Service(Amazon RDS)や他のリレーショナルデータベースからの CDC(Change Data Capture)変更を S3 データレイクに適用する方法を示し、データの非正規化、変換、およびリッチ化をほぼリアルタイムで柔軟に行う構築手順を説明しています。