本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將 Windows 檔案伺服器FSx的現有檔案移轉至 AWS DataSync
我們建議使 AWS DataSync 用在 Windows 檔案伺服器檔案系統之間FSx傳輸資料。 DataSync 是一種資料傳輸服務,可透過網際網路或其他儲存服務,簡化、自動化及加速內部部署儲存系統與其他 AWS 儲存服務之間的資料移動和複寫速度。 AWS Direct Connect DataSync 可以傳輸您的檔案系統資料和中繼資料,例如擁有權、時間戳記和存取權限。
DataSync 支援複製NTFS存取控制清單 (ACLs),也支援複製檔案稽核控制資訊,也稱為NTFS系統存取控制清單 (SACLs),系統管理員會使用這些清單來控制使用者嘗試存取檔案的稽核記錄。
您可 DataSync 以使用 Windows 檔案伺服器檔案系統在兩FSx者之間傳輸檔案,也可以將資料移至不同 AWS 區域 或 AWS 帳戶中的檔案系統。您可以 DataSync 與 Windows 檔案伺服器檔案系統搭配FSx使用,以執行其他工作。例如,您可以執行一次性資料移轉、定期擷取分散式工作負載的資料,以及排程複寫以進行資料保護和復原。
在中 AWS DataSync,Windows 檔案伺服器的位置是 Windows 檔案伺服器FSx的端點。FSx您可以在 Windows 檔案伺服器FSx的位置與其他檔案系統的位置之間傳輸檔案。若要取得資訊,請參閱《使用指南》中的〈AWS DataSync 使用位置〉。
DataSync 使用伺服器訊息區 (SMB) 通訊協定存取您的 FSx Windows 檔案伺服器。它會使用您在 AWS DataSync 主控台或中設定的使用者名稱和密碼進行驗證。 AWS CLI
必要條件
若要將資料遷移到您FSx的 Amazon Windows 檔案伺服器設定中,您需要符合需 DataSync 求的伺服器和網路。若要深入瞭解,請參閱《AWS DataSync 使用者指南》 DataSync中的「的需求」。
如果您要執行大型資料遷移,或是涉及許多小型檔案的遷移,我們建議您使用具有SSD儲存類型的 Amazon FSx 檔案系統。這是因為 DataSync 任務涉及文件元數據的掃描,這可能會耗盡HDD文件系統的磁盤IOPS限制,從而導致長時間運行的遷移和文件系統性能影響。如需詳細資訊,請參閱 將現有檔案儲存移轉至適用FSx於 Windows 檔案伺服器的最佳作法。
如果您的資料集大部分由小型檔案組成,檔案數量為百萬,或者您的可用網路頻寬超過單一 DataSync 工作所能消耗的數量,您也可以使用向外擴充架構來加速資料傳輸。如需詳細資訊,請參閱:如何使用橫向 AWS DataSync 擴充架構加速資料傳輸
您可以使用FSx效能測量結果來監督檔案系統的磁碟 I/O 使用率。
使用移轉檔案的基本步驟 DataSync
若要使用將檔案從來源位置傳輸到目標位置 DataSync,請執行下列基本步驟:
-
在您的環境下載並部署代理程式,並啟用該代理程式。
-
建立和設定來源與目的地位置。
-
建立並設定任務。
-
執行任務以將檔案從來源傳輸至目的地。
若要了解如何將檔案從現有的現場部署檔案系統傳輸到FSx適用於 Windows 檔案伺服器的檔案系統,請參閱AWS DataSync 使用者指南中的自我管理儲存體之間的資料傳輸和建立FSx適用於 Windows 檔案伺服器的 Amazon 位置。 AWS SMB
若要了解如何將檔案從現有雲端檔案系統傳輸到適用FSx於 Windows 檔案伺服器的檔案系統,請參閱AWS DataSync 使用者指南中的將代理程式部署為 Amazon EC2 執行個體。
在兩個 Amazon FSx 檔案系統之間移轉
您可以使 DataSync 用在兩個 Amazon FSx 檔案系統之間遷移資料。如果您需要將工作負載從現有檔案系統移至具有不同組態的新檔案系統,例如從單一可用區組態移至異地同步備份組態,此功能會很有幫助。您也可以使用 DataSync 在兩個檔案系統之間分割工作負載。
以下是移轉程序的概觀範例:
-
建立來源檔案系統和目標檔案系統的 DataSync 位置。請注意,來源和目的地必須屬於相同的 Active Directory (AD) 網域,或在其網域之間具有 AD 信任關係。
-
建立並設定 DataSync 工作,將資料從來源傳輸到目的地。您可以將工作作為一次性執行個體執行,或將工作設定為根據您設定的排程自動執行。
-
工作順利完成之後,目的地檔案系統中的資料就是來源的精確副本。請注意,您必須暫時暫停來源檔案系統上的任何寫入活動或檔案更新,才能完成工作。然後,您可以切換到目標文件系統並刪除源文件系統。
從生產檔案系統移轉之前,您可以在從最近備份還原的檔案系統上測試移轉程序。這可讓您估計資料傳輸程序需要多長時間,並事先對 DataSync 錯誤進行疑難排解。
若要將切換時間縮到最短,您可以事先 DataSync 執行工作,將大部分資料從來源檔案系統移至目的檔案系統。停止來源檔案系統的流量之後,您可以執行一次最後的工作傳輸,以同步處理因為您停止流量後新更新的任何資料,然後切換到目的地檔案系統。
您可以將 DataSync 工作設定為僅在特定目錄中執行,或包含或排除特定路徑。如果您要同時執 parallel 多個工作,或者想要遷移資料的子集,這會很有用。
您可以在目的檔案系統上建立與來源檔案系統DNS名稱相同的DNS別名。這可讓您的最終使用者和應用程式繼續使用來源檔案系統的DNS名稱存取檔案資料。如需如何設定DNS別名的詳細資訊,請參閱:使用DNS別名存取資料。
執行此類型的移轉時,我們建議您執行下列動作:
-
排程您的移轉,以避免任何檔案系統備份、每週維護時段和
Data Deduplication
工作。具體來說,如果Data Deduplication GarbageCollection
工作與您計劃的移轉重合,我們建議您停用該工作。 -
同時針對來源和目的檔案系統使用SSD儲存區類型。您可以通過從備份還原來在HDD和SSD存儲類型之間切換。如需詳細資訊,請參閱:將 Windows 檔案伺服器FSx的現有檔案儲存移轉至。
-
針對您需要傳輸的資料量,設定您的來源和目的地檔案系統,具有足夠的輸送量容量。在 DataSync 工作程序期間,監視來源檔案系統和目的檔案系統的效能使用率。如需詳細資訊,請參閱 使用 Amazon 監控 CloudWatch。
-
設置DataSync 監視以幫助您了解正在進行的任務的進度。您也可以將 DataSync 日誌傳送到 Amazon CloudWatch 日誌群組,以協助您在遇到任何錯誤時對任務進行除錯。