故障診斷高可用性問題 - AWSStorage Gateway

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷高可用性問題

如果發生可用性問題,您可在下列資訊中找到應採取的動作。

運作 Health 態通知

在 VMware vSphere HA 上執行閘道時,所有閘道都會對您設定的 Amazon CloudWatch 日誌組產生下列運作狀態通知。這些通知會進入名為 AvailabilityMonitor 的日誌串流。

:Notification 重新開機

當閘道 VM 重新啟動時,您可能會收到重新啟動通知。您可以使用 VM Hypervisor Management 主控台或儲存閘道主控台來重新啟動閘道 VM。您也可以在閘道維護週期期間使用閘道軟體來重新啟動。

採取動作

如果重新啟動的時間在閘道所設定之維護開始時間的 10 分鐘以內,這可能是正常的情況,而不是任何問題的徵兆。如果重新啟動很常在維護時段外發生,請檢查閘道是否已手動重新啟動。

:Notification HardReboot

當閘道 VM 意外重新啟動時,您可能會收到 HardReboot 通知。這種重新啟動可能是因為電源中斷、硬體故障或其他事件。若是 VMware 閘道,由 vSphere High Availability Application Monitoring 執行的重設可能會觸發此事件。

採取動作

當閘道在這種環境中執行時,請檢查 HealthCheckFailure 通知是否存在,並參閱 VM 的 VMware 事件記錄。

:Notification HealthCheckFailure

若是 VMware vSphere HA 上的閘道,當運作狀態檢查失敗且請求 VM 重新啟動時,您可能會收到 HealthCheckFailure 通知。此事件也會在監控可用性的測試期間發生,並顯示於 AvailabilityMonitorTest 通知中。在此情況下,則預期會收到HealthCheckFailure 通知。

注意

此通知僅適用於 VMware 閘道。

採取動作

如果此事件在沒有 AvailabilityMonitorTest 通知的情況下重複發生,請檢查您的 VM 基礎設施是否有問題 (儲存空間、記憶體等)。如果您需要其他協助,請聯絡AWS Support。

:Notification AvailabilityMonitorTest

如果是 VMware vSphere HA 上的閘道,您可以獲取AvailabilityMonitorTest當您運行測試可用性和應用程序監控系統。

指標

AvailabilityNotifications 指標可在所有閘道上使用。此指標會計算閘道產生的可用相關運作狀態通知數目。使用 Sum 統計資料,即可觀察閘道是否發生任何可用性相關事件。如需事件的詳細資訊,請參您配置的 CloudWatch 日誌組。