在 Amazon EC2 執行個體上設定簡化的自動復原 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon EC2 執行個體上設定簡化的自動復原

重要

本節說明如何在 EC2 執行個體上主動設定復原機制。這些復原機制旨在還原執行個體可用性,當 AWS 偵測到導致系統狀態檢查失敗的基礎硬體或軟體問題時。如果您目前在存取執行個體時遇到問題,請參閱對 EC2 執行個體進行故障診斷

如果 AWS 偵測到執行個體因基礎硬體或軟體問題而無法使用,簡化的自動復原可以透過將執行個體從具有基礎問題的主機移至不同的主機,自動還原執行個體可用性。

如果發生簡化的自動復原, 會根據結果 AWS Health Dashboard將下列其中一個事件 AWS 傳送至您的 :

  • 成功事件: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS

  • 失敗事件: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE

若要收到這些事件的通知,您可以設定通知。如需詳細資訊,請參閱AWS 使用者通知 《 使用者指南》中的在 中建立您的第一個通知組態 AWS 使用者通知。您也可以使用 Amazon EventBridge 規則來監控簡化的自動復原事件。

在執行個體啟動期間,所有支援的執行個體預設都會啟用簡化的自動復原。不過,只有在執行個體處於 running 狀態、 中未列出任何服務事件 AWS Health Dashboard,且執行個體類型有可用的容量時,才能運作。在某些情況下,例如重大中斷,容量限制可能會導致復原嘗試失敗。如需詳細資訊,請參閱對簡化的自動復原失敗進行故障診斷

您可以在啟動期間或之後停用簡化的自動復原,並視需要稍後重新啟用。

警告

當 因基礎硬體或軟體問題 AWS 而復原執行個體時,請注意下列後果:儲存在揮發性記憶體 (RAM) 中的資料將會遺失,且作業系統的正常運作時間會從零開始。為協助防範資料遺失,建議您定期建立重要資料的備份。如需 EC2 執行個體的備份和復原最佳實務的詳細資訊,請參閱 Amazon EC2 的最佳實務

自動執行個體復原機制專為個別執行個體而設計。如需建置彈性系統的指引,請參閱 建置彈性系統

啟用簡化自動復原的要求

符合下列條件的執行個體可以啟用簡化的自動復原:

執行個體類型
  • 一般用途:A1, M3, M4, M5, M5a, M5n, M5zn, M6a, M6g, M6i, M6in, M7a, M7g, M7i, M7i-flex, M8g, T1, T2, T3, T3a, T4g

  • 運算最佳化:C3, C4, C5, C5a, C5n, C6a, C6g, C6gn, C6i, C6in, C7a, C7g, C7gn, C7i, C7i-flex, C8g

  • 記憶體最佳化:R3, R4, R5, R5a, R5b, R5n, R6a, R6g, R6i, R6in, R7a, R7g, R7i, R7iz, R8g, U-3tb1, U-6tb1, U-9tb1, U-12tb1, U-18tb1, U-24tb1, U7i-6tb, U7i-8tb, U7i-12tb, U7in-16tb, U7in-24tb, U7in-32tb, U7inh-32tb, X1, X1e, X2iezn, X8g

  • 加速運算:G3, G5g, Inf1, P2, P3, VT1

  • 高效能運算:Hpc6a, Hpc7a, Hpc7g

租用
  • 共同

  • Dedicated Instance

如需詳細資訊,請參閱Amazon EC2 專用執行個體

限制

具有下列特性的執行個體不支援簡化的自動復原:

  • 執行個體大小:metal執行個體

  • 租用:專用主機。對於專用主機,請改用專用主機自動復原

  • 儲存體:具有執行個體儲存體磁碟區的執行個體

  • 網路:使用 Elastic Fabric Adapter 的執行個體

  • Auto Scaling:屬於 Auto Scaling 群組的執行個體

  • 維護:目前正在進行排程維護事件的執行個體

設定簡化的自動復原

當您啟動支援的執行個體時,預設會啟用簡化的自動復原。您可在啟動執行個體期間或之後將自動復原行為設定為 disabled

default 組態不會為不支援的執行個體啟用簡化的自動復原。

Console
啟動執行個體時停用簡化的自動復原程序
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體),然後選擇 Launch Instance (啟動執行個體)

  3. 進階詳細資訊區段中,針對執行個體自動復原,選擇已停用

  4. 根據需要進行剩餘的執行個體啟動設定,然後啟動執行個體。

針對執作中或已停止的執行個體停用簡化的自動復原程序
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體)。

  3. 選取執行個體,然後選取 Actions (動作)、Instance Settings (執行個體設定)、Change Shutdown Behavior (變更關機行為)。

  4. 選擇 Off (關閉),然後選擇 Save (儲存)。

為執行中或已停止的執行個體啟用簡化的自動復原
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體)。

  3. 選取執行個體,然後選取 Actions (動作)、Instance Settings (執行個體設定)、Change Shutdown Behavior (變更關機行為)。

  4. 選擇預設,然後選擇儲存

AWS CLI
啟動時停用簡化的自動復原程序

使用 run-instances 命令。

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]
針對執作中或已停止的執行個體停用簡化的自動復原程序

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled
針對執作中或已停用的執行個體將自動復原行為設定為 default

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

對簡化的自動復原失敗進行故障診斷

如果簡化的自動復原無法復原執行個體,請考慮下列問題:

  • AWS 服務事件正在執行

    簡化的自動復原不會在 AWS Health Dashboard中的服務事件期間運作。您可能不會收到此類事件的復原故障通知。如需最新的服務可用性資訊,請參閱服務運作狀態頁面。

  • 容量不足

    替換硬體暫時不足以遷移執行個體。

  • 達到每日復原嘗試次數上限

    執行個體已達到每日復原嘗試的最高限額。如果自動復原失敗,且硬體降級被判定為原始失敗系統狀態檢查的根本原因,您的執行個體後續可能會遭到淘汰。

如果執行個體系統狀態檢查在多次復原嘗試後持續未通過,請參閱對狀態檢查失敗的執行個體進行疑難排解以取得其他指引。