本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
當您更新端點時,Amazon SageMaker AI 會自動使用藍/綠部署來最大化端點的可用性。在藍/綠部署中,SageMaker AI 會佈建具有更新的新機群 (綠色機群)。然後,SageMaker AI 會將流量從舊機群 (藍色機群) 轉移到綠色機群。一旦綠色機群在設定的評估期間 (稱為烘焙期間) 內順利運作,SageMaker AI 就會終止藍色機群。借助藍/綠部署的其他功能,您可以利用流量轉移模式和自動還原監控來保護端點免受重大生產影響。
下列清單說明 SageMaker AI 中藍/綠部署的主要功能:
-
流量轉移模式。部署防護機制的流量轉移模式可讓您控制藍色機群和綠色機群之間的流量和流量轉移步驟的數量。此功能可讓您逐步評估綠色機群的效能,而無需完全承諾 100% 的流量轉移。
-
製作中期間。製作中期間是指在進入下一個部署階段之前監控綠色機群一段設定的時間。如果任何預先指定的警示在任何製作中期間觸發,則所有端點流量都會復原至藍色機群。製作中期間可幫助您在進行永久流量轉移之前,建立對更新的信心。
-
自動還原。您可以指定 SageMaker AI 用來監控綠色機群的 Amazon CloudWatch 警示。如果更新程式碼的問題觸發任何警示,SageMaker AI 會啟動自動轉返至藍色機群,以維持可用性,進而將風險降至最低。
流量轉移模式
藍/綠部署中的各種流量轉移模式可讓您更精細地控制藍色機群和綠色機群之間的流量轉移。藍/綠部署的可用流量轉移模式是一次全部、Canary 和線性。下表顯示選項的比較。
重要
對於涉及多階段流量轉移或製作中期間的藍/綠部署,不論機群的流量為何,都會在更新期間向您收取兩個機群的費用。這與所有藍色/綠色部署的流量一次全部轉移和無製作中期間相反,在更新過程中,您只需支付一個機群的費用。
名稱 | 這是什麼? | 優點 | 缺點 | 建議 |
---|---|---|---|---|
一次全部 |
單一步驟將所有流量轉移到新機群。 |
將整體更新持續時間降至最低。 |
迴歸更新影響 100% 的流量。 |
使用此選項可將更新時間和成本降至最低。 |
Canary |
流量轉移分為兩個步驟。第一個 (canary) 步驟會轉移一小部分流量,然後第二個步驟,會轉移剩餘的流量。 |
轉譯迴歸更新的影響範圍為僅限 Canary 機群。 |
兩個機群在整個部署中平行運作。 |
使用此選項可在最小化迴歸更新的影響範圍和最小化兩個機群的運作時間之間取得平衡。 |
線性 |
流量的固定部分會以預先指定的等距步驟數量轉移。 |
以數個步驟進行流量轉移,將迴歸更新的風險降到最低。 |
更新持續時間和成本與步驟數成比例。 |
使用此選項可將部署分散到多個步驟,將風險降至最低。 |
開始使用
指定所需的部署組態後,SageMaker AI 會為您處理佈建新執行個體、終止舊執行個體,以及轉移流量。您可以透過現有的 UpdateEndpoint 和 CreateEndpoint SageMaker API 和 AWS Command Line Interface 命令來建立和管理部署。請注意,如果您的端點使用 Exclusions 頁面中列出的任何功能,則無法使用部署防護機制。有關如何設置部署的詳細資訊,請參閱各個部署頁面:
要遵循說明如何使用部署護欄的指導範例,請參閱我們的範例 Jupyter 筆記本