Analytics | Amazon Web Services ブログ

レイクハウスアーキテクチャの構築: Yggdrasil Gaming の BigQuery から AWS への移行

Yggdrasil Gaming が Google BigQuery から AWS 分析サービスへ移行し、Apache Iceberg ベースのレイクハウスアーキテクチャを構築した事例を紹介します。AWS パートナーの GOStack と連携し、データ処理コストの 60% 削減、分析レイテンシーの 75% 改善を実現した段階的な移行アプローチを解説します。

CloudWatch アラームを使用した Amazon MSK の本番環境向けモニタリングの設定

本記事では、Amazon CloudWatch を使用した Amazon MSK クラスターの本番環境向けモニタリングの設定方法を解説します。ブローカーの健全性、リソース使用率、コンシューマーラグなどの主要メトリクスのカテゴリ分類と、推奨される CloudWatch アラームのしきい値を紹介し、ストリーミングワークロードの問題を早期に検知するためのプラクティスを説明します。

Amazon OpenSearch Serverless のコレクショングループでマルチテナントワークロードのコストを最適化

Amazon OpenSearch Serverless のコレクショングループ機能が一般提供開始されました。マルチテナントワークロードで、テナントごとの暗号化によるセキュリティ境界を維持しながら、異なる KMS キーを持つコレクション間で OCU リソースを共有し、コンピューティングコストを最大 90% 削減できます。

Amazon OpenSearch Service のセマンティック検索で注文履歴検索を改善する

Amazon の注文履歴検索チームが、Amazon OpenSearch Service と Amazon SageMaker を使ってレキシカル検索にセマンティック検索機能を追加し、顧客体験を改善した方法を紹介します。セルベースアーキテクチャによるスケーラビリティ向上、エンベディングモデルの評価と選定、ハイブリッド検索の実装について解説します。

アプリケーションを変更せずに Amazon SageMaker Catalog でデータメッシュパターンを実装する

Amazon SageMaker Catalog を使用してデータメッシュパターンを実装する方法を説明します。既存のアプリケーションやデータリポジトリを変更せずに、Amazon SageMaker Unified Studio でデータをオンボード、公開、サブスクライブする手順を紹介します。

Integral Ad Science における Amazon OpenSearch Service を使った日次 1 億件超のドキュメント処理の紹介

Integral Ad Science (IAS) が Amazon OpenSearch Service を活用し、日次 1 億件以上のドキュメントを処理するスケーラブルな SaaS 型 ML プラットフォームを構築した事例を紹介します。ベクトル検索の最適化により、複雑な検索オペレーションで 40〜55% のパフォーマンス向上を達成しました。

Amazon DynamoDB データに対する検索を Amazon OpenSearch Service とのゼロ ETL 統合を使用して実装する

この記事では、Amazon DynamoDB データに対する検索を Amazon OpenSearch Ser […]

AWS Weekly Roundup: Amazon EC2 M8azn インスタンス、Amazon Bedrock の新しいオープンウェイトモデルなど (2026 年 2 月 16 日)

2021 年に AWS に入社して以来、私は Amazon Elastic Compute Cloud (Am […]

BMW Group が AWS 上のエージェンティック検索でペタバイト規模のデータからインサイトを引き出す

BMW Group が AWS 上でエージェント検索ソリューションを構築し、ペタバイト規模のデータからインサイトを引き出す取り組みを紹介します。同社の Cloud Data Hub は 20 PB のデータを保存し、1 日平均 110 TB を取り込んでいますが、従来は専門知識がないユーザーにとってデータ分析が困難でした。AWS Professional Services と協力し、Amazon S3 Vectors、Amazon Bedrock、Strands Agents を組み合わせたソリューションを開発。ハイブリッド検索、網羅的検索、SQL クエリの 3 つのアプローチにより、技術スキルに関係なく自然言語でデータにアクセス可能になりました。サーバーレスアーキテクチャによりコスト効率も実現しています。

Amazon Managed Service for Apache Flink でよく使われるストリーミングデータエンリッチメントパターン

本記事では、Amazon Managed Service for Apache Flink でよく使われるストリーミングデータエンリッチメントパターンを解説します。参照データの事前ロード、レコード単位の非同期ルックアップ、外部キャッシュの活用、別ストリームとの結合、Table API の利用など、各パターンの利点と欠点を比較し、ユースケースに応じた最適な選択を支援します。

Amazon Web Services ブログ

Category: Analytics