本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
OPS07-BP02 確保對操作預備狀態進行一致審核
使用操作就緒檢閱 (ORRs) 來驗證您可以操作工作負載。ORR 是在 Amazon 開發的一種機制,用於驗證團隊是否可以安全地操作工作負載。ORR 是使用 需求清單的檢閱和檢查程序。ORR 是團隊的自助式體驗,用於驗證其工作負載。ORRs 包含從我們多年建置軟體中學到的最佳實務。
ORR 檢查清單由架構建議、操作程序、事件管理和發行品質組成。錯誤糾正 (CoE) 程序是這些項目的主要驅動要素。您自己的事後分析應該會推動您自己的 演變ORR。ORR 不僅要遵循最佳實務,還要防止您先前看到的事件重複發生。最後,安全、管理和合規要求也可以包含在 中ORR。
在工作負載啟動到一般可用性ORRs之前執行,然後在整個軟體開發生命週期中執行。在啟動ORR之前執行 可提高您安全操作工作負載的能力。定期在工作負載ORR上重新執行您的 ,以捕捉最佳實務中的任何偏離。您可以擁有新服務啟動和定期檢閱ORRs的ORR檢查清單。此可協助您掌握新出現的最佳實務最新狀態,並採納從事件後分析獲得的經驗。當您使用雲端成熟時,您可以將ORR需求建置到架構中做為預設值。
預期結果:您有一個ORR檢查清單,其中包含組織的最佳實務。ORRs 在工作負載啟動之前執行。ORRs 會在工作負載生命週期期間定期執行。
常見的反模式:
-
您啟動工作負載,但不知道自己是否能夠運行工作負載。
-
啟動工作負載的認證中未納入管控和安全性需求。
-
不會定期重新評估工作負載。
-
工作負載啟動,但不需設置必要的程序。
-
您可以在多個工作負載中看到重複出現的相同根本原因失敗。
建立此最佳實務的優勢:
-
工作負載包含架構、程序和管理最佳實務。
-
所學課程會納入您的ORR程序中。
-
工作負載啟動時,已設置必要的程序。
-
ORRs 會在工作負載的軟體生命週期中執行。
若未建立此最佳實務的風險等級:高
實作指引
ORR 是兩件事:程序和檢查清單。您的ORR程序應由您的組織採用,並由執行發起人支援。工作負載啟動到一般可用性之前,ORRs至少必須執行 。ORR 在整個軟體開發生命週期中執行 ,以保持最新的最佳實務或新要求。ORR 檢查清單應包含組態項目、安全和治理要求,以及組織的最佳實務。隨著時間的推移,您可以使用 AWS Config、 AWS Security Hub和 AWS Control Tower Guardrails 等 服務,將最佳實務從 建置ORR到 Guardrails,以自動偵測最佳實務。
客戶範例
發生幾次生產事件後, AnyCompany Retail 決定實作 ORR 程序。他們建立了一份檢查清單,其中由最佳實務、管控和合規需求,以及從中斷中汲取的經驗教訓所組成。新的工作負載會在啟動ORRs之前執行。每個工作負載每年都會執行一次ORR最佳實務子集,以整合新增至ORR檢查清單的新最佳實務和要求。隨著時間的推移, AnyCompany Retail AWS Config用於偵測一些最佳實務,加快ORR程序。
實作步驟
若要進一步了解 ORRs,請閱讀操作就緒審核 (ORR) 白皮書 。它提供有關ORR程序歷史記錄、如何建立您自己的ORR實務以及如何開發ORR檢查清單的詳細資訊。以下步驟是該文件的精簡版本。若要深入了解什麼ORRs是 以及如何建置自己的 ,我們建議您閱讀該白皮書。
-
召集關鍵利益相關者,包含安全性、營運和開發等團隊的代表人員。
-
請每位利益相關者提供至少一個需求。對於第一次的反覆測試,請嘗試將項目數限制在三十個以下。
-
附錄 B:Operational Readiness Reviews () 白皮書中的範例ORR問題包含可用來開始使用的範例問題。ORR
-
-
將需求集中放在試算表中。
-
您可以在 中使用自訂鏡頭AWS Well-Architected Tool
來開發您的 ORR,並在您的帳戶和 AWS 組織之間共用。
-
-
識別一個要在 ORR 上執行的工作負載。啟動前的工作負載或內部工作負載是理想的選擇。
-
執行ORR檢查清單,並記下所做的任何發現。如果採取緩解措施,那就可能無法進行探索。對於缺少緩解措施的任何探索,請將那些探索新增至項目的待辦清單中,然後在啟動前加以實作。
-
隨著時間的推移,繼續將最佳實務和要求新增至ORR檢查清單。
AWS Support 擁有企業支援的客戶可以從其技術客戶經理請求操作就緒審核研討會
實作計劃的工作量:高。在組織中採用ORR實務需要高階主管贊助和利益相關者認同。使用貴組織提供的各方意見,來建立和更新檢查清單。
資源
相關的最佳實務:
-
OPS01-BP03 評估治理要求 – 治理要求自然適合ORR檢查清單。
-
OPS01-BP04 評估合規要求 – 合規要求有時包含在ORR檢查清單中。有些時候,它們會是獨立的程序。
-
OPS03-BP07 資源團隊適當 – 團隊能力是ORR滿足需求的良好候選者。
-
OPS06-BP01 計畫變更失敗 – 啟動工作負載前,必須先建立回復或向前回復計畫。
-
OPS07-BP01 確保人員能力 – 若要支援工作負載,您必須具備所需的人員。
-
SEC01-BP03 識別和驗證控制目標 – 安全控制目標具有卓越的ORR要求。
-
REL13-BP01 定義停機時間和資料遺失的復原目標 – 災難復原計劃是很好ORR的要求。
-
COST02-BP01 根據您的組織需求制定政策 – 成本管理政策非常適合包含在ORR檢查清單中。
相關文件:
相關影片:
相關範例:
相關服務: