Amazon Aurora PostgreSQL-Compatible クラスターがフェイルオーバーした理由を教えてください。

所要時間1分
0

Amazon Aurora PostgreSQL-Compatible エディションの DB クラスターがフェイルオーバーした原因を知りたいです。

簡単な説明

Aurora PostgreSQL Compatible は、以下のシナリオでクラスターリーダーの 1 つへのインスタンスフェイルオーバーを自動的に実行します。

  • ライターインスタンスに関するインフラストラクチャの問題です。これには、物理ホストへのネットワーク接続の喪失、クラスターのボリュームへのネットワーク接続の喪失、または物理コンピューティングリソースの問題が含まれます。
  • ライターインスタンスにアクセスできません。この問題は、過剰なワークロードに関連しており、パフォーマンスのボトルネックやリソースの競合の原因となります。
  • ライターの DB インスタンスクラスタイプは、DB インスタンスの垂直スケーリングアクティビティの一環として変更されます。
  • Aurora ライターインスタンスの基盤となるホストは、特定のメンテナンス期間中にソフトウェアパッチ、ハードウェアメンテナンス、または OS アップデートが適用されています。詳細については、「Amazon Aurora DB クラスターのメンテナンス」を参照してください。
  • インスタンスは、インスタンスレベルでフェイルオーバーオプションを使用してフェイルオーバーされました。

クラスターのライターがヘルスチェックに応答しない場合、クラスターは割り当てられた優先順位に基づいて、クラスターのリーダーの 1 つへのフェイルオーバーを開始します。詳細については「Amazon Aurora PostgreSQL のフェイルオーバー」を参照してください。

解決方法

フェイルオーバーの原因を特定するには、Aurora PostgreSQL-Compatible クラスターの次のログとメトリクスを確認してください。

Amazon RDS イベント

計画外停止の根本原因を特定するには、フェイルオーバー期間中のすべての Amazon Relational Database Service (Amazon RDS) イベントを表示します。デフォルトでは、すべてのイベントが UTC/GMT 時間で登録されます。イベントを長期間保存したい場合は、Amazon RDS イベントを Amazon CloudWatch Events に送信します。詳細については、「Amazon Aurora イベントでトリガーするルールの作成」を参照してください。

Amazon CloudWatch メトリクス

Aurora PostgreSQL-Compatible クラスターの Amazon CloudWatch メトリクスを表示し、データベースの負荷が高いために停止したかどうかを確認します。詳細については、「Amazon CloudWatch を使用した Amazon Aurora メトリクスのモニタリング」を参照してください。クラスター/インスタンスの可用性と正常性を示す次の主要メトリクスの急増を確認します。

  • DatabaseConnections
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth

拡張モニタリング

Amazon Aurora インスタンスの拡張モニタリングをオンにするには、「拡張モニタリングの設定と有効化」を参照してください。

Amazon RDS では、DB インスタンスが実行している OS のメトリクスをリアルタイムで提供しています。PostgreSQL インスタンスのすべてのシステムメトリクスとプロセス情報をコンソールで表示できます。各インスタンスについてモニタリングするメトリクスを管理し、必要に応じてダッシュボードをカスタマイズすることができます。拡張モニタリングのメトリクスの説明については、「拡張モニタリングの OS メトリクス」を参照してください。

Performance Insights

Performance Insights は、既存の Amazon Aurora モニタリング機能を拡張したもので、クラスターのパフォーマンスを示して分析するのに役立ちます。Performance Insights ダッシュボードを使用すると、Aurora PostgreSQL-Compatible クラスター負荷のデータベース負荷を視覚化できます。待機時間、SQL ステートメント、ホスト、またはユーザーごとに負荷をフィルタリングできます。

詳細については、「Amazon Aurora での Performance Insights を使用したDB 負荷のモニタリング」と「Performance Insights ダッシュボードを使用してメトリクスを分析する」を参照してください。

Aurora データベースログ

オンプレミスデータベースでは、DB ログはファイルシステムにあります。Amazon RDS と Amazon Aurora では、Aurora PostgreSQL-Compatible クラスターのファイルシステム上の DB ログへにホストアクセスすることはできません。Amazon CloudWatch Logs を使用してログデータを分析できます。詳細については、Amazon CloudWatch Logs への Aurora PostgreSQL ログの発行を参照してください。

AWS マネジメントコンソールを使用してログファイルを見ることもできます。詳細については、「データベースログファイルのモニタリング」を参照してください。

Amazon Aurora PostgreSQL-Compatible による高速フェイルオーバー

DB クラスターでフェイルオーバーができるだけ早く行われるようにするには、「Amazon Aurora PostgreSQL による高速フェイルオーバー」を参照してください。

Aurora PostgreSQL-Compatible クラスターキャッシュ管理によるフェイルオーバー後の高速リカバリ

ライター DB インスタンスがフェイルオーバー後の高速リカバリーを確認するには、「Aurora PostgreSQL のクラスターキャッシュ管理によるフェイルオーバー後の高速リカバリ」を参照してください。


関連情報

Amazon Aurora の高可用性

Amazon Aurora クラスターのメトリクスのモニタリング

Amazon RDS のイベントカテゴリとイベントメッセージ

AWS公式
AWS公式更新しました 1年前
コメントはありません

関連するコンテンツ