View a markdown version of this page

疑難排解 - Amazon Elastic VMware Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解

本章詳細說明在建立或管理 Amazon EVS 環境時遇到的一些常見問題。

Broadcom 和 AWS 支援指引

AWS 支援 Amazon EVS 及其相關聯的基礎設施服務,包括 VMware Cloud Foundation (VCF)。如需 VCF 特定的組態指導,或與 Aria Suite、HCX 或 NSX 等其他 VMware 產品相關的問題,您也可以直接使用 Broadcom 支援權利來聯絡 Broadcom。如需詳細資訊,請參閱 Broadcom 支援入口網站

故障診斷失敗的環境狀態檢查

Amazon EVS 會在您的環境中執行自動檢查,以識別問題。您可以檢視環境的狀態,以識別特定和可偵測到的問題。

檢閱環境狀態檢查資訊

使用 Amazon EVS 主控台調查受損的環境

  1. 開啟 Amazon EVS 主控台。

  2. 在導覽窗格中,選擇環境,然後選取您的環境。

  3. 選取詳細資訊索引標籤以查看環境的概觀。

  4. 檢查環境狀態。將滑鼠暫留在此欄位上,以展開包含每個環境狀態檢查個別結果的快顯視窗。

連線能力檢查失敗

連線能力檢查會驗證 Amazon EVS 是否持續連線至 SDDC Manager。如果 Amazon EVS 無法到達環境,則此檢查會失敗。

如果此檢查失敗,Amazon EVS 將無法再連接 SDDC Manager 來驗證環境狀態,並且無法再將主機加入到環境中。可連線性失敗也會導致授權金鑰重複使用,以及金鑰涵蓋範圍檢查失敗,而且主機計數檢查會傳回未知回應。

若要確保可連線性,請檢查下列項目:

  • 確認您的憑證有效且未過期。您可以使用 SDDC Manager UI 或 vSphere 用戶端來管理 VCF 環境中的憑證。部署後,建議您取代 VMware Cloud Foundation 管理網域的所有憑證。如需詳細資訊,請參閱 VMware Cloud Foundation 文件中的管理 VMware Cloud Foundation 中的憑證。 VMware

  • 確保您的 DNS 伺服器可從服務存取子網路存取、DNS 記錄有效,而且不存在重複的主機名稱或 IP 地址。

  • 如果您想要建立自己的防火牆規則,請遵循下列準則:

    • 允許 TCP/UDP 存取 DNS 伺服器。

    • 允許 HTTPS/SSH 存取主機管理 VLAN 子網路。

    • 允許 HTTPS/SSH 存取管理 VM VLAN 子網路。

如果您在遵循本指南後仍無法解決問題,我們建議您聯絡 AWS Support 以取得進一步協助。

主機計數檢查失敗

此檢查會驗證您的環境至少有四個主機,這是 VCF 5.2.x 的需求。

如果此檢查失敗,您將需要新增主機,以使您的環境符合此最低要求。Amazon EVS 僅支援具有 4 至 16 部主機的環境。

金鑰重複使用檢查失敗

此檢查會驗證 VCF 授權金鑰並未由其他 Amazon EVS 環境使用。VCF 授權只能在一個 Amazon EVS 環境中使用。如果您在已經由另一個環境使用的環境建立請求中提供 VCF 授權金鑰,則此檢查會失敗。

如果此檢查失敗,您會收到無法建立 Amazon EVS 環境的錯誤回應。若要解決此問題,請在 SDDC Manager 中檢閱授權設定,並以未使用的授權取代任何先前使用的授權。

重要

使用 SDDC Manager 使用者介面來管理 VCF 解決方案和 vSAN 授權金鑰。Amazon EVS 會要求您在 SDDC Manager 中維護有效的 VCF 解決方案和 vSAN 授權金鑰,服務才能正常運作。雖然必須使用 vSphere 用戶端將金鑰指派給主機和 vSAN 叢集,但您必須確定這些金鑰也會出現在 SDDC Manager 使用者介面的授權畫面中。

金鑰涵蓋範圍檢查失敗

此檢查會驗證指派給 vCenter Server 的 VCF 授權金鑰,是否為所有部署的主機配置足夠的 vCPU 核心和 vSAN 儲存容量 (TiB)。

如果此檢查失敗,您會收到無法建立 Amazon EVS 環境的錯誤回應。金鑰涵蓋失敗可能表示存在下列其中一個問題:

  • VCF 授權未正確指派給 vCenter 伺服器。您必須在評估期到期或目前指派的授權到期前,將授權指派給 vCenter Server。如果是這個問題,請檢閱 SDDC Manager 中的授權指派情況。

  • 目前的 VCF 授權不包含 vCPU 核心和 vSAN 儲存容量需求。VCF 解決方案金鑰 (包括最低核心計數) 和 vSAN 授權金鑰 (包括最低 vSAN 容量) 的需求會根據執行個體類型而有所不同。如需組態的特定閾值,請參閱 VCF 訂閱。如果是這個問題,請在 SDDC Manager 中新增 vSAN 授權,直到滿足您的使用需求為止。

如果上述動作無法解決問題,請聯絡 AWS Support 以取得進一步協助。

重要

使用 SDDC Manager 使用者介面來管理 VCF 解決方案和 vSAN 授權金鑰。Amazon EVS 會要求您在 SDDC Manager 中維護有效的 VCF 解決方案和 vSAN 授權金鑰,服務才能正常運作。雖然必須使用 vSphere 用戶端將金鑰指派給主機和 vSAN 叢集,但您必須確定這些金鑰也會出現在 SDDC Manager 使用者介面的授權畫面中。

此主機上的 vSphere HA 代理程式無法到達隔離地址

在 vCenter 使用者介面中,選取 ESX 主機時,您會看到「此主機上的 vSphere HA 代理程式無法到達隔離地址 <IPv6 address>」訊息。

此錯誤訊息表示主機上的 vSphere HA 代理程式無法連線到 vSphere HA 用於活動訊號檢查的預設 IPv6 隔離地址。錯誤訊息並不表示問題,只會因為 Amazon EVS 目前不支援 IPv6 而發生。Amazon EVS 缺少 IPV6 支援不會影響 vSphere HA 的核心功能。

ESX 主機叢集的 vSAN 升級預先檢查失敗

嘗試使用 SDDC Manager 升級 ESX 主機叢集時,vSAN 磁碟相關的預先檢查可能會失敗。這是因為 Amazon EVS 使用 vSAN Express Storage Architecture (ESA),且升級預先檢查不適用於 vSAN ESA。如需詳細資訊,請參閱本主題的 Broadcom 知識庫文章

新增主機因不相容的叢集映像而失敗

問題

當您將主機新增至您的環境時,主機具有最新版本的 EVS 自訂廠商附加元件。如果您的環境使用具有較舊附加元件版本的主機,新增主機會失敗,並顯示新主機與叢集映像不相容的錯誤。若要修正此問題,您必須使用 vSphere Lifecyle Manager 從新增的主機擷取最新的可用附加元件版本。

解決方案

請遵循下列步驟。

  1. 前往 VMware vCenter Server 中的主機和叢集庫存。

  2. 透過建立暫時空白叢集,從新增的主機擷取附加元件。

  3. 基本概念下,選取從 vCenter 庫存中的現有主機匯入映像,然後建立叢集。將所有其他設定保留為預設值。

  4. 使用擷取的映像建立此臨時叢集後,您可以刪除臨時叢集。附加元件現在可在 vSphere Lifecycle Manager 儲存庫中使用。

  5. 前往您的環境叢集,然後選取更新索引標籤。

  6. 編輯您的叢集映像,並將附加元件版本變更為新擷取的版本。

  7. 選擇儲存

  8. 在 SDDC Manager 中,重試失敗的新增主機任務。這將修復您的叢集主機,將所有主機更新為最新的附加元件版本。叢集映像修復需要主機重新啟動。

SDDC Manager 在主機測試期間未通過 VCF 主機驗證

問題

如果您在 Amazon EVS 環境部署之後已更新 ESX 版本,則 SDDC 管理員可能會在委託主機步驟中的 VCF 主機驗證期間失敗。若要修正此問題,您必須使用 vSphere Lifecyle Manager 在新增的主機上升級 ESX。

解決方案

請遵循下列步驟。

重要

這些步驟需要暫時將主機新增至 SDDC Manager 外部的 vCenter。將 vSphere Lifecyle Manager 用於 ESX 升級以外的任何操作可能會使您的主機無法使用,並要求您刪除和建立新的 Amazon EVS 主機。

  1. 前往 VMware vCenter Server 中的主機和叢集庫存。

  2. 將主機暫時新增至您的虛擬資料中心,確保選取使用映像管理主機。ESX 升級完成後,稍後的步驟會移除主機。如需詳細資訊,請參閱 vSphere 文件中的如何將主機新增至 vSphere 資料中心或資料夾。 vSphere

  3. 將主機新增至 vSphere 後,請升級主機上的 ESX 版本。這可以在主機的更新索引標籤中完成。編輯主機映像以符合叢集的 ESX 版本。

  4. 升級完成後,請從 vCenter 庫存中移除主機。如需詳細資訊,請參閱 vSphere 文件中的如何從 vCenter 伺服器執行個體移除 ESX 主機

  5. 在 SDDC 管理員中委託您的主機。如需詳細資訊,請參閱 VMware Cloud Foundation 文件中的 Commission Hosts

  6. 委託主機之後,請使用 SDDC Manager 將主機新增至叢集。

由於設備連線能力失敗,Windows Server 權利狀態為有風險

當關聯的 Amazon EVS 連接器無法通過 VCF 管理設備的連線能力檢查時,權利會進入處於風險狀態。對於 Windows Server 權利,從權利達到風險狀態的時間點開始,您有 8 小時的時間可以還原連線。如果在此期間內未還原連線,會自動捨棄權利,並停止 Windows Server 用量追蹤。

若要解決此問題,請檢查下列項目:

  • 確認連接器狀態為作用中,且其連線能力檢查狀態為失敗。

  • 確認存放在 AWS Secrets Manager 中的設備登入資料是最新且正確的。如果登入資料已在設備中輪換,請更新現有 Secrets Manager 秘密中的值。如果您需要指向不同的秘密,請使用 UpdateEnvironmentConnector 更新秘密識別符。

  • 確保您的 DNS 伺服器可從服務存取子網路存取、設備 FQDN 的 DNS 記錄有效,而且不存在重複的主機名稱或 IP 地址。

  • 確認防火牆規則允許 HTTPS/SSH 存取管理 VM VLAN 子網路,以及 TCP/UDP 存取 DNS 伺服器。

  • 確保設備正在執行並可存取。

連線還原後,權利會自動返回運作狀態良好的已建立狀態。如果權利已捨棄且具有已移除權利狀態,您必須在連接器返回具有已通過連線能力檢查的作用中狀態之後建立新的權利。

如果您在遵循本指南後仍無法解決問題,我們建議您聯絡 AWS Support 以取得進一步協助。

由於不支援的訪客作業系統,權限失敗

當 Amazon EVS 偵測到 VM 正在執行 Amazon EVS Windows Server 授權不支援的訪客作業系統時,權利建立失敗或現有權利遭到移除。

這可能發生在下列情況:

  • 具有現有 Windows Server 權利的 VM 會重新設定為使用不支援的作業系統版本或非 Windows 作業系統。

  • 權利建立失敗,因為 VM 已執行不支援的訪客作業系統。

若要解決此問題:

  • 確認連接器狀態為作用中,且其連線能力檢查狀態已通過。

  • 驗證在 VM 上設定的訪客作業系統。Amazon EVS Windows Server 授權支援 Windows Server 2016 或更新版本。

  • 重新設定 VM 以使用支援的 Windows Server 版本。

  • 更新訪客作業系統後,請為 VM 建立新的權利。

  • (選用) 在已移除權限狀態下刪除權利。

如果您在遵循本指南後仍無法解決問題,我們建議您聯絡 AWS Support 以取得進一步協助。

權利狀態為已移除權利

具有已移除權限狀態的權限表示 Amazon EVS 已移除 VM 的權限。移除權利時,受影響的 VM 的 Windows Server 用量追蹤會停止。

此狀態可能由幾個原因造成:

若要還原權利:

  • 檢查權利的錯誤詳細資訊,以識別移除的特定原因。

  • 解決基礎問題。

  • 在連接器處於作用中狀態且連線能力檢查處於已通過狀態時,為 VM 建立新的權利。

  • (選用) 在已移除權限狀態下刪除權利。

如果您在遵循本指南後仍無法解決問題,我們建議您聯絡 AWS Support 以取得進一步協助。

由於 VM 中斷連線、隔離或遺失庫存而移除的權限

當 Amazon EVS 偵測到 VM 已中斷連線、隔離或不再存在於設備庫存中時,就會移除權利。權利會立即移除,用量追蹤也會停止。

若要解決此問題:

  • 確認連接器狀態為作用中,且其連線能力檢查狀態已通過。

  • 檢查設備中的 VM 連線狀態。中斷連線或隔離的 VM 可能表示主機或網路問題。

  • 解決造成 VM 中斷連線或隔離的基礎主機或網路問題。

  • 在 VM 重新連線並正常執行之後,請建立新的權利以繼續 Windows Server 使用。

如果您在遵循本指南後仍無法解決問題,我們建議您聯絡 AWS Support 以取得進一步協助。