OPS07-BP02 確保對操作預備狀態進行一致審核 - 卓越運作支柱

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

OPS07-BP02 確保對操作預備狀態進行一致審核

使用操作就緒檢閱 (ORRs) 來驗證您可以操作工作負載。ORR 是在 Amazon 開發的一種機制,用於驗證團隊是否可以安全地操作工作負載。ORR 是使用 需求清單的檢閱和檢查程序。ORR 是團隊的自助式體驗,用於驗證其工作負載。ORRs 包含從我們多年建置軟體中學到的最佳實務。

ORR 檢查清單由架構建議、操作程序、事件管理和發行品質組成。錯誤糾正 (CoE) 程序是這些項目的主要驅動要素。您自己的事後分析應該會推動您自己的 演變ORR。ORR 不僅要遵循最佳實務,還要防止您先前看到的事件重複發生。最後,安全、管理和合規要求也可以包含在 中ORR。

在工作負載啟動到一般可用性ORRs之前執行,然後在整個軟體開發生命週期中執行。在啟動ORR之前執行 可提高您安全操作工作負載的能力。定期在工作負載ORR上重新執行您的 ,以捕捉最佳實務中的任何偏離。您可以擁有新服務啟動和定期檢閱ORRs的ORR檢查清單。此可協助您掌握新出現的最佳實務最新狀態,並採納從事件後分析獲得的經驗。當您使用雲端成熟時,您可以將ORR需求建置到架構中做為預設值。

預期結果:您有一個ORR檢查清單,其中包含組織的最佳實務。ORRs 在工作負載啟動之前執行。ORRs 會在工作負載生命週期期間定期執行。

常見的反模式:

  • 您啟動工作負載,但不知道自己是否能夠運行工作負載。

  • 啟動工作負載的認證中未納入管控和安全性需求。

  • 不會定期重新評估工作負載。

  • 工作負載啟動,但不需設置必要的程序。

  • 您可以在多個工作負載中看到重複出現的相同根本原因失敗。

建立此最佳實務的優勢:

  • 工作負載包含架構、程序和管理最佳實務。

  • 所學課程會納入您的ORR程序中。

  • 工作負載啟動時,已設置必要的程序。

  • ORRs 會在工作負載的軟體生命週期中執行。

若未建立此最佳實務的風險等級:

實作指引

ORR 是兩件事:程序和檢查清單。您的ORR程序應由您的組織採用,並由執行發起人支援。工作負載啟動到一般可用性之前,ORRs至少必須執行 。ORR 在整個軟體開發生命週期中執行 ,以保持最新的最佳實務或新要求。ORR 檢查清單應包含組態項目、安全和治理要求,以及組織的最佳實務。隨著時間的推移,您可以使用 AWS ConfigAWS Security HubAWS Control Tower Guardrails 等 服務,將最佳實務從 建置ORR到 Guardrails,以自動偵測最佳實務。

客戶範例

發生幾次生產事件後, AnyCompany Retail 決定實作 ORR 程序。他們建立了一份檢查清單,其中由最佳實務、管控和合規需求,以及從中斷中汲取的經驗教訓所組成。新的工作負載會在啟動ORRs之前執行。每個工作負載每年都會執行一次ORR最佳實務子集,以整合新增至ORR檢查清單的新最佳實務和要求。隨著時間的推移, AnyCompany Retail AWS Config用於偵測一些最佳實務,加快ORR程序。

實作步驟

若要進一步了解 ORRs,請閱讀操作就緒審核 (ORR) 白皮書 。它提供有關ORR程序歷史記錄、如何建立您自己的ORR實務以及如何開發ORR檢查清單的詳細資訊。以下步驟是該文件的精簡版本。若要深入了解什麼ORRs是 以及如何建置自己的 ,我們建議您閱讀該白皮書。

  1. 召集關鍵利益相關者,包含安全性、營運和開發等團隊的代表人員。

  2. 請每位利益相關者提供至少一個需求。對於第一次的反覆測試,請嘗試將項目數限制在三十個以下。

  3. 將需求集中放在試算表中。

  4. 識別一個要在 ORR 上執行的工作負載。啟動前的工作負載或內部工作負載是理想的選擇。

  5. 執行ORR檢查清單,並記下所做的任何發現。如果採取緩解措施,那就可能無法進行探索。對於缺少緩解措施的任何探索,請將那些探索新增至項目的待辦清單中,然後在啟動前加以實作。

  6. 隨著時間的推移,繼續將最佳實務和要求新增至ORR檢查清單。

AWS Support 擁有企業支援的客戶可以從其技術客戶經理請求操作就緒審核研討會。研討會是互動式向後工作工作階段,用於開發您自己的ORR檢查清單。

實作計劃的工作量:高。在組織中採用ORR實務需要高階主管贊助和利益相關者認同。使用貴組織提供的各方意見,來建立和更新檢查清單。

資源

相關的最佳實務:

相關文件:

相關影片:

相關範例:

相關服務: