對檔案系統效能問題進行故障診斷 - Amazon FSx for Windows File Server

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

對檔案系統效能問題進行故障診斷

FSx 適用於 Windows File Server 檔案系統的效能取決於幾個因素,包括您驅動至檔案系統的流量、如何佈建檔案系統,以及已啟用的功能所使用的資源,例如資料重複刪除或陰影複本。如需了解檔案系統效能的相關資訊,請參閱FSx 適用於 Windows File Server 效能

如何判斷檔案系統的輸送量和IOPS限制?

若要檢視檔案系統的輸送量和IOPS限制,請參閱表格,其中顯示根據佈建輸送量容量量的效能等級

網路 I/O 和磁碟 I/O 之間的差異是什麼? 為什麼我的網路 I/O 與磁碟 I/O 不同?

Amazon FSx 檔案系統包含一或多個檔案伺服器,透過網路將資料提供給存取檔案系統的用戶端。這是網路 I/O。 檔案伺服器具有快速的記憶體內快取,可增強最常存取資料的效能。檔案伺服器也會將流量驅動到託管檔案系統資料的儲存磁碟區。這是磁碟 I/O。 下圖說明 Amazon FSx 檔案系統的網路和磁碟 I/O。

FSx 適用於 Windows File Server 架構,顯示檔案伺服器和儲存磁碟區效能指標的關係,以及其對檔案系統效能的影響。

如需詳細資訊,請參閱使用 Amazon 監控 CloudWatch

為什麼我的 CPU 或 記憶體用量很高,即使我的網路 I/O 很低?

檔案伺服器CPU和記憶體用量不僅取決於您驅動的網路流量,還取決於您在檔案系統上啟用的功能。如何設定和排程這些功能可能會影響 CPU和記憶體使用率。

進行中的重複資料刪除任務可能會耗用記憶體。您可以修改重複資料刪除任務的組態,以減少記憶體需求。例如,您可以限制最佳化以在特定檔案類型或資料夾上執行,或設定最佳化的最小檔案大小和期限。當您的檔案系統負載最少時,我們也建議您設定在閒置期間執行重複資料刪除任務。如需詳細資訊,請參閱使用重複資料刪除來降低儲存成本

如果您已啟用以存取為基礎的列舉,當您的最終使用者檢視或列出檔案共用,或在儲存體擴展任務的最佳化階段期間,您可能會看到高CPU使用率。如需詳細資訊,請參閱 Microsoft Storage 文件中的在命名空間上啟用存取型列舉

什麼是爆量? 我的檔案系統使用多少爆量? 爆量額度用完時會發生什麼情況?

檔案型工作負載通常爆量,特徵為短暫、密集的高 I/O 期間,以及爆量之間的閒置時間。為了支援這些類型的工作負載,除了檔案系統可以維持的基準速度之外,Amazon 還為網路 I/O 和磁碟 I/O 操作FSx提供一段時間內爆增到更高速度的功能。

Amazon FSx使用 I/O 額度機制來配置輸送量,並根據平均使用率IOPS:檔案系統會在輸送量和IOPS用量低於其基準限制時累積額度,並在需要時使用這些額度爆量超過基準限制 (最高爆量限制)。如需檔案系統爆量限制和持續時間的詳細資訊,請參閱 FSx 適用於 Windows File Server 效能

我在監控與效能頁面上看到警告 – 我是否需要變更檔案系統的組態?

監控與效能頁面包含警告,指出最近的工作負載需求何時接近或超過您設定檔案系統的方式所決定的資源限制。這不一定表示您需要變更組態,但如果您不採取建議的動作,您的檔案系統可能未針對工作負載進行佈建。

如果造成警告的工作負載是非典型的,而且您不希望它繼續,則不採取任何動作並密切監控您的使用率可能很安全。不過,如果造成警告的工作負載是典型的,而且您預期它會持續,甚至會增強,我們建議遵循建議的動作來提高檔案伺服器效能 (透過增加輸送量容量) 或提高儲存磁碟區效能 (透過增加儲存容量,或從 切換HDD到SSD儲存體)。

注意

某些檔案系統事件可能會消耗磁碟 I/O 效能資源,並可能觸發效能警告。例如:

  • 儲存容量擴展的最佳化階段可以產生增加的磁碟輸送量,如 中所述 儲存容量增加,檔案系統效能

  • 對於多可用區域檔案系統,輸送量容量擴展、硬體替換或可用區域中斷等事件會導致自動容錯移轉和容錯回復事件。在此期間發生的任何資料變更都需要在主要和次要檔案伺服器之間同步,而 Windows Server 會執行可以取用磁碟 I/O 資源的資料同步任務。如需詳細資訊,請參閱管理輸送量容量

我的指標暫時遺失,我應該擔心嗎?

在檔案系統維護、基礎設施元件更換以及可用區域無法使用時,單一可用區域檔案系統將無法使用。在此期間,指標將無法使用。

在異地同步備份部署中,Amazon FSx會自動將待命檔案伺服器佈建和維護在不同可用區域中。如果有檔案系統維護或意外的服務中斷,Amazon FSx會自動容錯移轉至次要檔案伺服器,讓您繼續存取資料,而無需手動介入。在檔案系統容錯移轉和回復失敗的短暫期間內,指標可能會暫時無法使用。