Amazon Web Services ブログ

Category: General

TROCCO の CDC 機能をつかった RDB と Apache Iceberg on AWS の連携

データベースの変更をリアルタイムに分析基盤へ反映したいというニーズに高まりを感じています。実際に多くのお客様から相談をいただいております。またデータベースの差分をもとに連携することが望まれる場面も多くあります。そういう場合の選択肢の一つが CDC(Change Data Capture)と呼ばれる MySQL の binlogなどの変更履歴をもとにデータを連携する手法になります。しかし、CDC での実装は、データ取得・キャッシュレイヤー・コンシューマーの実装とコンポーネントが多くなる場合も多く技術的なハードルが高く、ソースデータベースのスキーマの変更をターゲットの分析基盤に滞りなく連携する必要があるなど運用負荷も大きいワークロードになります。

CDC のターゲットの選択肢の1つとして、Iceberg を利用することで多様なエンジンから利用することができ、ソーススキーマの変更にも柔軟に対応ができるコスト効率の良い、DB のデータをソースにしたデータレイクハウスを構築することができます。

本記事では、AWS パートナーである primeNumber 社が提供するデータ統合プラットフォーム「TROCCO」の CDC 機能を使って、MySQL から AWS 上の Apache Iceberg テーブルへのリアルタイムレプリケーションを実現する方法をご紹介します。実際に検証した内容をもとに、セットアップから運用まで詳しく解説していきます。

AWS Transform discovery tool の紹介

AWS Transform discovery tool の紹介

AWS Transform discovery tool は、VMware 環境に展開する検出ツールで、サーバーインベントリ、データベースインスタンス、ネットワーク依存関係を自動的に収集し、クラウド接続不要でローカルに動作するため、厳格なデータガバナンス要件を持つ組織でも安全に使用でき、収集したパフォーマンスデータとネットワークデータをもとに最適な AWS インスタンスタイプの推奨や TCO 分析を行い、移行リスクを低減しながら AWS への移行計画を支援します。

週刊生成AI with AWS – re:Invent 2025 特別号 part 1 (2025/12/8週)

AWS re:Invent 2025 開催期間中に発表された生成AI関連の新サービス、新機能、また公開されたブログをダイジェストでお届けする特別号です。
AWS re:Invent 2025 に参加出来なかった方、ライブを見逃してしまった方、イベントを振り返りたい方などにお勧めです。