Amazon Web Services ブログ

Category: Management Tools

AWS Systems Manager の新機能である Incident Manager で IT インシデントを迅速に解決

IT エンジニアは、アプリケーションやインフラストラクチャを構築する自らの能力と配慮に誇りを持っています。しかし、私たちの誰もが、どれほど認めることを嫌がったとしても、100% のアップタイムのようなものは存在しません。ものは、いつしか故障します。そして、その故障が最悪の瞬間に重なることもよくあります。その結果、1 日の終わりや誕生日パーティー、果ては結婚式が台無しになる (ご興味があれば詳しくお話しましょう) ことも多々あります。 静けさを切り裂くポケットベルの音に、当番のエンジニアはサービスを復旧させるため急行します。1 分、1 秒も無駄にできません。たとえば、エンジニアは大量の監視アラートを迅速にフィルタリングし、インシデントの根本原因を特定できなくてはなりません。そんな一刻を争うとき、インシデントの解決に必要な用途別のランブックや手順を探し回って無駄な時間を費やす余裕などありません。午前 3 時、津波のように次から次へと押し寄せる真っ赤なアラートを前に、「どこかに書いておいたはずの」魔法のコマンドを必死に探しているところを想像してみてください。 これは決して心地よいものではありません。 深刻な問題では、エスカレーションが必要な場合もよくあります。チームメンバーの助けが得らることは素晴らしいことですが、コラボレーションと迅速な解決には、効率的なコミュニケーションが欠かせません。それがなければ、まとまりのない行動は、状況を混乱させたり、悪化させたりする要因になりかねません。 最後にもう 1 つ、インシデントとその対応方法を文書化することも同様に重要です。インシデントが解決され、全員がしっかりと睡眠をとったあと、その状況をもう一度見直し、プラットフォームとインシデント対応手順を継続的に改善します。 これらすべてには、業界のベストプラクティスと適切なツールの用意など、多くの準備が必要です。ほとんどの企業や組織では、繰り返されるインシデントの中で、インシデントから学ぶ余裕がありません。これは、インシデントの準備と対応策を構築する上で、非常にいら立たしい状況です。 それゆえに、多くのお客様からこの課題に何か手立てはないかとお問い合わせをいただきました。そして、本日、Indicent Manager を発表できることを大変嬉しく思います。Indicent Manager は、 AWS Systems Manager の新機能であり、アプリケーションとインフラストラクチャのインシデントへの効率的な準備と対応を支援します。 すぐにでもお試しになりたい方は、Incident Manager コンソールにアクセスしてください。さらに詳しく知りたい方は、このままお付き合いください。 AWS Systems Manager に Incident Manager が登場 1995 年に Amazon.com を立ち上げて以来、Amazon チームはサービスのインシデント対応を担ってきました。長年にわたり、大規模なアプリケーションとインフラストラクチャの問題への多様な経験を積み重ねてきました。Amazon の Major Incident Management (主要インシデント管理) チームは、これらの長年の経験を活かして、すべての AWS のお客様がインシデントの準備と解決を迅速化できるように Incident Manager を設計しました。 この過程では準備が重要な要素であるため、Incident Manager では、アラームがなったときにすぐに使用できるインシデント対応リソース集を簡単に作成できます。これらのリソースには、次のものがあります。 […]

Read More
Chime SDK Monitoring and Troubleshooting

Amazon Chime SDK ミーティングイベントでのモニタリングとトラブルシューティング

ミーティングイベントを利用することでAmazon Chime SDKで構築されたオーディオ、ビデオ、および画面共有アプリケーションからクライアントのメトリクスデータを収集できます。さらにミーティングイベントをAmazon CloudWatchと統合することで、重要な情報のスナップショットをAmazon CloudWatchダッシュボードで見ることができます。例えば、ユーザーがミーティングに参加中に障害が発生した場合、ダッシュボードでAmazon Chime SDKのミーティングステータスコードとエラーメッセージの確認ができます。このデータを使用してクライアントログを提供するような追加作業をユーザーに要求することなく、障害の理由を特定することができます。また接続の問題がユーザーの通話品質に影響するかどうかを判断するためのレイテンシーメトリクスもあります。

Read More

大阪リージョンに AWS Service Catalog が対応しました

みなさん、こんにちは。アマゾン ウェブ サービス ジャパン、シニアエバンンジェリストの亀田です。 AWS Service Catalog が大阪リージョンでご利用いただける用になりました。 AWS Service Catalog Service Catalog はAWSアカウント内で使用できる、 IT サービスのカタログを作成および管理するサービスです。AWSサービスに関連する仮想マシンイメージ、サーバー、データベース、だけではなく、ソフトウェアやさらに包括的な多層アプリケーションアーキテクチャまでを定義することができるため、一貫したガバナンスの実現、そして、コンプライアンス要件を満たすための運用構築を実現できます。エンドユーザーは管理されているカタログから必要な製品のみを選択して起動できるため、組織における俊敏性が向上します。 この機能は AWS CloudFormation との連携により実現され、テンプレートを使用するかカスタムテンプレートを作成し、 Service Catalog コンソールを使用してテンプレートをアップロードします。その後、使用する製品の詳しい説明、バージョン情報、サポート情報、タグなど、リストに掲載する製品の詳細情報を入力できます。またTerraformもサポートしており、利用をご希望される方はこちらのドキュメントをご参照ください。 AWS Service Management Connector Service Management Connector を使うと、IT サービスマネジメント (ITSM) の管理者が、プロビジョニングされた AWS やサードパーティー製品に対するガバナンスを、Service Now や Jira Service Desk等、外部サービス用いて構築している場合、Service Catalogとの連携を実現させます。例えばService Nowの管理者は、Service Catalogの管理に加え、このService Management Connectorを用いることで、ServiceNowのCMDBテーブルに基づき、新しいリソースタイプを定義し、これらをリソースの追跡とジ変更を行う AWS Configのカスタムリソースと同期させたり、AWS Systems Manager を介したプレイブックの実行、AWS Security Hub のセキュリティにまつわる調査結果をServiceNowのインシデントや問題に同期させたりすることができます。 こちらに、開始ガイドがありますのでご覧ください。 […]

Read More

AWS Service Catalog でプロビジョニング済み製品を新しい製品バージョンに更新し、AWS Step Functions、AWS Lambda、Amazon Athenaを使用して変更を報告する方法

組織は AWS Service Catalog を使って、一般的にデプロイされる AWS のサービス、およびプロビジョニングされたソフトウェア製品を一元管理できます。また、一貫したガバナンスとコンプライアンス要件の達成を支援すると同時に、必要な承認済みの AWS のサービスをご自身で迅速にデプロイできるようにします。 製品の新しいバージョンを導入して設定のドリフトを減らした後、以前にプロビジョニング済み製品を最新の状態に保てるようなしくみを希望されているお客様がいました。たとえば、最新バージョンのデータベースエンジンに変更した Amazon Relational Database Service (Amazon RDS) データベースの新しい AWS Service Catalog バージョンがあるとします。RDS インスタンスの設定を手動で変更せずに、AWS Service Catalog を介して起動した既存の RDS データベースインスタンスを更新できるようにするとしましょう。 このブログ投稿では、AWS Service Catalog で製品を設定し、以前にプロビジョニング済みである製品を自動的に更新して、新しく導入したバージョンで最新の状態に保てるようにするソリューションをご紹介します。さらに、Amazon Athena を使用してバージョンの更新とステータスを追跡し、ソリューションからログファイルをクエリする方法も解説します。このソリューションは、ソリューションをデプロイしているのと同じ AWS アカウントでプロビジョニング済みの AWS Service Catalog 製品で機能します。 ソリューションの概要 このソリューションでは、AWS CloudFormation、Amazon CloudWatch、AWS Lambda、AWS Step Functions の AWS のサービスを組み合わせて使用します。Amazon CloudWatch Events を使って、スケジュールした時間に AWS Lambda 関数をトリガーします。CloudWatch […]

Read More

Amazon SageMaker ノートブックと AWS Service Catalog を使用して、セルフサービスで安全なデータサイエンスを実現する

Sanjay Garje と Vebhhav (Veb) Singh の共著あらゆる規模の企業が AWS クラウドに移行しています。エンタープライズチームのリーダーシップから、コストを抑えながら Amazon SageMaker に簡単にアクセスできる方法を模索しているという話を耳にします。これにより、データサイエンスを使った実験を促進し、新しいビジネスチャンスを開拓して現状を打破しています。このブログ記事では、Amazon SageMaker、AWS Service Catalog、および AWS Key Management Service (KMS) を使用してセルフサービスの安全なデータサイエンスを簡単に使えるようにする方法を紹介します。 このブログ記事では、AWS Service Catalog が事前設定された AWS KMS キーを使用して、複雑で不要な詳細をデータサイエンティストに公開することなく、ノートブックインスタンスにアタッチされている機械学習 (ML) ストレージボリュームで保存されているデータを暗号化する方法を説明します。ML ストレージボリュームの暗号化は、一元化されたセキュリティチームやインフラストラクチャチームが事前設定および調整した AWS Service Catalog 製品で行われます。Amazon SageMaker ノートブックインスタンス、トレーニングジョブ、またはエンドポイントを作成するときに、AWS KMS キー ID を指定できます。そのキーが、アタッチされた ML ストレージボリュームを暗号化します。トレーニングジョブ用の出力 Amazon S3 バケットを指定できます。トレーニングジョブも、AWS KMS で管理されるキーで暗号化されます。モデルのアーティファクトをその出力 Amazon S3 バケットに格納するための KMS キー ID を渡すことができます。 […]

Read More

Dynatrace、AWS Lambda、および AWS Service Catalog を使用して、自己修復 Infrastructure-as-Code を構築する

AWS のパートナーソリューションアーキテクト、Kishore Vinjam Dynatrace の戦略的パートナーイネーブルメント&エバンジェリズム担当ディレクター、Andreas Grabner 氏 クラウド運用またはシステム管理で作業するエンジニアは、多くの場合、パフォーマンスモニタリングツールで検出された問題を修正するために手動でスクリプトを更新する必要があります。 これには、プロセスの再起動、リソースのクリーンアップ、メモリの停止、および CPU 使用率に関する問題などがあります。このような問題は頻繁に発生し、貴重な時間が取られてしまいます。 この記事では、お客様がどう Dynatrace、AWS Lambda、および AWS Service Catalog を使用して、ワークフローを構築し、Dynatrace AI で検出された問題に対して必要なインシデント対応アクションを開始するかを説明します。 Dynatrace AI は、エンドユーザーが、基礎となるシステムリソースが原因で実際のユーザーエクスペリエンス、サービスレベルアグリーメント (SLA)、またはサービスの可用性から影響を受けたときに、問題を検出して通知をトリガーします。基礎となるリソースに起因する問題には、ディスクがいっぱいである、設定の変更が不適切、負荷が増加している、または依存するサービスの問題などがあります。 AWS Service Catalog を使用すると、AWS での使用が承認されているサービスのカタログを作成および管理でき、Lambda を使用すると、サーバーをプロビジョニングまたは管理せずにコードを実行できます。 Dynatrace は、AWS パートナーネットワーク (APN) のアドバンストテクノロジーパートナーで、Migration、DevOps、Containers の AWS コンピテンシーを持っています。今日の複雑な IT 環境で成功し、明日や将来も成功し続けるには、Dynatrace などの AWS コンピテンシーパートナーと連携することがスマートな一手 (The Next Smart) です。 AWS コンピテンシープログラムでは、お客様の成功事例を紹介したり、特定のソリューション領域やセグメントで高い専門性を示したりしたトップの APN パートナーを確認、検査、精査しています。 AWS Service Catalog のアーティファクトの自動調整 AWS […]

Read More

AWS Service Catalog とAWS Marketplace の CloudEndure を使用して、AWS アカウントのプロビジョニングとサーバーの移行を自動化する

AWS クラウドに移行する予定の会社の移行プロジェクトに関与している場合は、移行の準備、ポートフォリオの発見、計画、設計など、さまざまな段階を経ることでしょう。ほとんどの場合、これらの段階の後に正念場を迎え、物理ベース、仮想ベース、またはクラウドベースのインフラストラクチャワークロードの AWS への移行を開始します。AWS のお客様は、CloudEndure (現在は AWS の会社) などのツールを使用して、アプリケーションの移行、災害復旧や AWS へのレガシーインフラストラクチャのバックアップを自動化します。移行中にお客様が直面する課題の 1 つに、サーバーを管理して、数百または数千の AWS アカウントで構成される階層的なアカウント構造に移動することがあります。このブログ記事では、新しい CloudEndure 移行プロジェクトのセットアップを自動化する方法と、お使いの環境で新しいアカウントを販売するたびに「アカウント自動販売機」を使用してこのプロセスを自動化する方法を学びます。 はじめに CloudEndure は、AWS への大規模な移行と障害復旧のデプロイを簡素化、迅速化、自動化するのに役立ちます。継続的なデータレプリケーションはバックグラウンドで行われ、アプリケーションの中断やパフォーマンスへの影響はありません。これにより、データがリアルタイムで同期され、カットオーバー/フェイルオーバーウィンドウが最小限に抑えられます。カットオーバー/フェイルオーバーが開始されると、CloudEndure は高度に自動化されたマシン変換とオーケストレーションプロセスを実行します。これにより、最も複雑なアプリケーションやデータベースでも、互換性の問題なく、最小限の IT スキルで AWS でネイティブに実行できます。AWS Marketplace から CloudEndure をデプロイできます。 このアカウントの自動販売機を作成するには、AWS Service Catalog、AWS Lambda、AWS Organizations などのネイティブの AWS のサービスを追加で使用します。また、CloudEndure との API 統合を使用して、アカウントの作成後に新しいプロジェクトをセットアップします。さらに、移行をサポートするために、販売したアカウントで AWS Direct Connect、Amazon Kinesis Data Firehose、Amazon S3 Transfer Acceleration などの追加の AWS のサービスを設定して、この参考用のサンプルソリューションを拡張できます。 このソリューションのサービス このソリューションで使用するサービスの簡単なレビューを次に示します。 […]

Read More

AWS Control Tower で AWS リソースのセルフサービスプロビジョニングを有効にする

お客様は、新しいビジネスユニットのオンボーディングやアプリケーションワークロードのセットアップを行うたびに、AWS Control Tower で新しいアカウントをプロビジョニングしています。場合によっては、組織はクラウドユーザー、開発者、およびデータサイエンティストに、新しいアカウントでセルフサービス標準化された安全なパターンとアーキテクチャをデプロイすることも求めます。以下にいくつか例を示します。 開発者またはクラウドエンジニアが、golden AMI から Amazon EC2 インスタンスを起動したいと考えています。 データサイエンティストは、承認済みの AMI とインスタンスタイプで Amazon EMR クラスターを起動したいと考えています。 データベース管理者は、新しくプロビジョニングされた AWS アカウントで承認済みの Amazon RDS データベースを起動する必要があります。 この記事では、AWS Control Tower の Account Factory を使用して新しい AWS アカウントをプロビジョニングする方法を示します。また、AWS Service Catalog を使用して、RDS データベースのポートフォリオなどのカスタム製品を新しいアカウントと共有する方法も示します。さらに、AWS Control Tower のガードレールを使用して新しいアカウントでガバナンスを実施する方法についても説明します。 このソリューションで使われる AWS のサービスは、以下のとおりです。 AWS Control Tower AWS Service Catalog AWS CloudFormation Amazon CloudWatch Amazon RDS AWS Organizations […]

Read More

AWS Service Catalog、DynamoDB、Lambda、および CloudWatch イベントを使用して、一元化されたタグのコンプライアンスを実施する

AWS のパートナーソリューションアーキテクト、Sagar Khasnis 著 Brillio のクラウドアーキテクト、Arilleendra Tiwari 著 私たちが協力しているお客様の中には、タグ値を保持する中央データベースを持っており、AWS Service Catalog のタグ実施機能を使用して、プロビジョニング時にタグを実施したいと考えているお客様もいます。 たとえば、絶えず更新されるすべてのコストセンター情報をすべて保持する中央の場所を持っていて、その情報を AWS Service Catalog ポートフォリオのタグ値として使用するお客様もいるかもしれません。 この記事では、新しいタグが Amazon DynamoDB に追加されたときにタグオプションライブラリが自動的に更新されるように、タグオプションを適用する方法を紹介します。このソリューションを使用すると、エンドユーザーが起動したすべての AWS Service Catalog 製品に、組織で定義した標準の値のセットが自動的にタグ付けされます。 Brillio は、AWS パートナーネットワーク (APN) のアドバンストコンサルティングパートナーです。 AWS と協力して、数十億ドル規模のエンタープライズ IT 運用の再構築と再編成に取り組み、最新の俊敏なデジタルインフラストラクチャ運用を実現しています。 たとえば、Brillio は最近の AWS WorkLink ローンチで紹介された 5 つの APN パートナーの 1 社であり、企業が安全なエンタープライズモビリティを促進するのをサポートすることを目指しています。 AWS のサービスと定義 以下は、必要な AWS のサービスの簡単な確認と、記事全体で使用するいくつかの専門用語です。専門用語は、このタグ実施ソリューションを理解するために必要となります。 AWS Service Catalog により、組織は AWS での使用が承認されている […]

Read More

セルフマネージド型 Active Directory を AWS Control Tower に拡張

クラウドジャーニーの初期段階によくあるユースケースの 1 つとして、既存のアイデンティティサービス (Microsoft Active Directory など) を使用することが挙げられます。このブログでは、AWS Control Tower をセットアップして、AWS Managed Microsoft AD を介してユーザー認証をセルフマネージド型 Microsoft Active Directory に委任する方法について解説します。既存のオンプレミスの Active Directory を AWS Control Tower に接続する方法を、シミュレート環境でみていきます。 背景 AWS Control Tower には、マルチアカウント環境における SSO アクセスを簡素化するクラウドベースのサービス、AWS Single Sign-on (AWS SSO) が組み込まれています。ユーザー認証の管理は、AWS SSO を使用して、AWS Control Tower に接続されたディレクトリが行います。各ユーザーに割り当てられたアカウントアクセスおよび付与されたアクセス許可のレベルによって、認証が判断されます。 AWS SSO はアクセス許可のセットを使用します。これは、ユーザーのアクセス許可が、所定の AWS アカウントにアクセスするために有効かどうかを判断する、管理者定義ポリシーのコレクションです。アクセス許可のセットには、AWS が管理するポリシーまたは AWS SSO に保存されているインラインポリシーのいずれかが含まれています。ポリシーとは、基本的に、1 つまたは複数のアクセス許可ステートメントのコンテナとして機能するドキュメントのことです。所定の AWS アカウント内でユーザーがどのアクションを実行できるかまたはできないかは、これらのステートメントが判断します。アクセス許可のセットは […]

Read More