[トップページ] [FAQ 一覧]

対象:CloudWatch

statuscheckfailedがcloudwatchでアラームされない原因と対処




statuscheckfailed が標準メトリクスでアラームされない


Windows Server 環境においてEC2インスタンスの標準メトリクスでPING監視の代替としてstatuscheckfailed を設定しました。
パラメータは1分以内で1データポイントです。

Windows Server をシャットダウンした後しばらく待ちましたが、アラームは上がって来ません。何が原因なのでしょうか

インスタンスの停止やシャットダウンはstatuscheckfailed扱いでない


実験した結果マネージメントコンソールからのインスタンス停止やWindows Server メニューからのシャットダウンで停止した場合は、CloudWatch のstatuscheckfailedでは 1 として判定されないようです。
Windows で異常が発生して停止した場合(ブルースクリーンやハングなど)で1の値が設定されるようです。
よって正しい意味でのPING監視とはならないようです。


statuscheckfailedをテストする




statuscheckfailedをテストする方法を紹介します。
必ずテスト用のインスタンスで実行してください。故意に異常を発生させるため、最悪インスタンスが破損し二度と起動しなくなる可能性があります。またEBSを破損させる可能性もあります。

EC2 Windows Server 上に管理者でログインして以下コマンドを実行します。


taskkill /f /im:svchost.exe



マネージメントコンソールからインスタンスのスクリーンショットを確認してください。画面ばブルースクリーンになっていた場合は成功です。

(注意)Windows Server はデフォルトでは ブルースクリーン後自動で再起動されます。よって場合によってはすぐに再起動され、CloudWatch ではアラーム処理されない可能性があります。ブルースクリーン後の再起動をオフにするにはWindows のコントロールパネルよりこの機能を無効化します。


svchost.exe という重要なプロセスを強制終了させるため、Windows が停止します。
マネージメントコンソールで確認すると、状態が"アラーム状態"になっていることが分かります。次のメッセージも表示されています。


awsec2-i-*****************-GreaterThanOrEqualToThreshold-StatusCheckFailed




StatusCheckFailed >= 0.99



Windows を再度開始した場合はこのアラーム状態も自動で戻るようです。ただし戻るには時間がかかるようです。
「データ不足(INSUFFICIENT_DATA)」と表示される場合はしばらく時間が経過すると表示されるようになります。

参考:CloudWatch アラームの状態が INSUFFICIENT_DATA になっているのはなぜですか?
https://aws.amazon.com/jp/premiumsupport/knowledge-center/cloudwatch-alarm-insufficient-data-state/


【超重要】本ページは情報が古くなっている可能性があります。参考程度にしてください。








[ 一覧に戻る]


【注意事項】本ページの内容は個人的に調査した結果がであり内容が正しいことは保証されません。
またAWSサービスは常に改良、アップデートされており本ページの内容が古く誤った内容になる可能性もあります。変更になっても本ページが正しく更新されるとは限りません。
あくまでも参考程度でご覧ください。内容により発生したいかなる時間的損害、金銭的損害、その他の損害に関しても何人も保証しません。