

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# About AWS DevOps 代理程式
<a name="about-aws-devops-agent"></a>

AWS DevOps 代理程式是前沿代理程式，可解決並主動防止事件，持續改善可靠性和效能。

AWS DevOps 代理程式會調查事件，並將營運改進識別為經驗豐富的 DevOps 工程師。

代理程式的運作方式：
+ 了解您的資源及其關係。
+ 使用可觀測性工具、技能、程式碼儲存庫和 CI/CD 管道。
+ 關聯遙測、程式碼和部署資料，以了解應用程式資源之間的關係。
+ 支援多雲端和混合環境中的應用程式。

## 主要功能
<a name="key-features"></a>

AWS DevOps Agent 透過下列功能提供完整的事件回應和預防功能：

### Always-on、自動事件回應
<a name="always-on-autonomous-incident-response"></a>

AWS DevOps 代理程式會自動調查問題發生的那一刻：
+ **自動化事件調查** – 在警示或支援票證送達時立即開始調查
+ **AWS DevOps Agent Chat** - 查詢您的基礎設施、分析系統運作狀態，並在整個 DevOps Agent Space Web 應用程式中使用自然語言引導調查。聊天會根據您正在檢視的頁面提供內容感知回應，無論是詢問拓撲中的資源、引導調查，還是篩選預防中的建議。
+ **詳細的緩解計劃** – 提供特定動作來解決事件、驗證成功，並視需要還原變更
+ **自動化事件協調** – 透過 Slack 和 ServiceNow 等您偏好的通訊管道，路由觀察、調查結果和緩解步驟
+ **AWS 支援整合** – 直接從調查中建立 AWS 支援案例，並提供即時內容給 AWS Support 專家

### 防止未來的事件
<a name="prevent-future-incidents"></a>

AWS DevOps 代理程式會分析歷史事件的模式，協助您從被動的消防轉向主動的操作改進：
+ **針對性建議** – 提供具體、可行的改進，以強化四個關鍵領域：可觀測性 （監控、提醒、記錄）、基礎設施最佳化 （自動擴展、容量調校） 和部署管道增強功能 （測試、驗證）。
+ **持續學習** – 根據團隊的意見回饋精簡建議

### 從您的 DevOps 工具取得更多
<a name="get-more-from-your-devops-tools"></a>

AWS DevOps Agent 會與您現有的工具整合，而無需變更您的工作流程：
+ **應用程式資源映射** – 建立應用程式資源及其關係的拓撲圖
+ **內建整合** – 使用熱門的可觀測性工具 (Amazon CloudWatch、Dynatrace、Datadog、New Relic 和 Splunk)、程式碼儲存庫和 CI/CD 管道 (GitHub 動作和儲存庫、GitLab 工作流程和儲存庫）
+ **自訂工具整合** – 連接至您自己的模型內容通訊協定 (MCP) 伺服器以擴展其他工具的功能
+ **對話式基礎設施查詢** – 使用自然語言查詢 AWS 資源、系統指標和警示狀態，而無需導覽多個主控台。聊天了解內容，並維護後續問題的對話歷史記錄。

## AWS DevOps 代理程式的運作方式
<a name="how-aws-devops-agent-works"></a>

AWS DevOps Agent 透過雙主控台架構運作。管理員使用 AWS 管理主控台來建立和管理 Agent Spaces、設定整合，以及設定存取控制。營運團隊使用 AWS DevOps Agent Web 應用程式進行day-to-day事件回應和調查活動。Web 應用程式可讓操作員與客服人員調查互動、瀏覽跨帳戶應用程式拓撲，以及了解可觀測性、程式碼、管道和基礎設施架構的預防性改善。如需詳細資訊，請參閱 [主動事件預防](working-with-devops-agent-proactive-incident-prevention.md)。

服務是以 Agent Spaces 組織，這是邏輯容器，可定義 AWS DevOps Agent 可存取和調查的內容。每個 Agent Space 都包含 AWS 您的帳戶組態、第三方工具整合和存取許可。如需詳細資訊，請參閱 [什麼是 DevOps Agent Spaces？](about-aws-devops-agent-what-are-devops-agent-spaces.md)。

AWS DevOps Agent 會自動建置應用程式拓撲，以映射您的資源及其關係。此拓撲可協助服務在調查期間了解您的應用程式架構。如需詳細資訊，請參閱 [什麼是 DevOps 代理程式拓撲？](about-aws-devops-agent-what-is-a-devops-agent-topology.md)。

## 優勢
<a name="benefits"></a>
+ **縮短解決的平均時間 (MTTR)** – 自動調查會立即開始，將事件解決從數小時加速到幾分鐘
+ **防止重複事件** – 針對性建議可解決根本原因並增強系統彈性
+ **提高營運效率** – 讓您的團隊免於重複調查任務，專注於創新
+ **在現有的工作流程中**工作 – 與現有的工具和程序整合，而不會中斷

# 什麼是 DevOps Agent Web 應用程式？
<a name="about-aws-devops-agent-what-is-a-devops-agent-web-app"></a>

AWS DevOps Agent 使用雙主控台架構，將管理函數與day-to-day營運活動分開。此設計可讓管理員設定服務，同時讓營運團隊專注於事件回應和預防。

## 主控台
<a name="consoles"></a>

AWS DevOps 代理程式提供兩種不同的界面：
+ **AWS 管理主控台** – 管理員使用 AWS 管理主控台來設定和管理 AWS DevOps 代理程式。在此主控台中，您可以[建立 代理程式空間](getting-started-with-aws-devops-agent-creating-an-agent-space.md)連接 AWS 服務和第三方工具，並管理組織的存取許可。
+ **DevOps Agent Web 應用程式 - ** 營運團隊使用 DevOps Agent Space Web 應用程式進行每日事件回應活動。此獨立應用程式提供一個界面，可讓待命工程師啟動調查、透過自然語言聊天與客服人員互動、檢視應用程式拓撲，以及檢閱事件預防建議。

## Web 應用程式功能
<a name="web-app-capabilities"></a>

DevOps Agent Web 應用程式提供下列主要功能：
+ **事件回應 – ** 此頁面可讓您建立和追蹤事件調查，以及產生解決事件的緩解計劃。
+ **事件預防 –** 在預防頁面中，您可以在這裡找到改善可觀測性狀態、交付程序和基礎設施架構以防止未來事件的建議。
+ **拓撲 –** 拓撲頁面提供帳戶資源及其在連線帳戶中所有資源間關係的互動式視覺化呈現。您可以使用「顯示」下拉式清單，在系統、容器和資源檢視之間切換，以不同層級的詳細資訊檢視拓撲。
+ **Skills** – 模組化指令集，可延伸具有特殊功能的 AWS DevOps Agent。技能包含領域知識、調查方法和為您的基礎設施量身打造的工具組態。每項技能都會啟用特定工具，並僅在與調查相關時提供指示的漸進式揭露。
+ **自然語言聊天界面 ** – 聊天功能是 AI 支援的對話式助理，可讓您查詢基礎設施、分析系統運作狀態，並使用自然語言進行調查。聊天功能會根據您正在檢視的頁面提供內容感知回應。

## 身分驗證
<a name="authentication"></a>

AWS DevOps 代理程式支援靈活的身分驗證方法，以適應不同的組織需求：
+ **IAM Identity Center 整合 （使用者存取）** – Organizations 可以使用 AWS Identity Center (IAM Identity Center) 集中管理使用者對 DevOps Agent Space Web 應用程式的存取。IAM Identity Center 可以透過標準 OIDC 和 SAML 通訊協定與外部身分提供者聯合，包括 Okta、Ping Identity 和 Microsoft Entra ID 等提供者。此方法支援來自身分提供者的多重驗證。
+ **外部身分提供者 (IdP) 身分驗證** – Organizations 可以將 Okta 或 Microsoft Entra ID 等 OIDC 相容身分提供者直接連線至 Agent Space Web 應用程式，而不需要 IAM Identity Center。使用者透過 IdP 使用其公司登入資料登入。如需設定說明，請參閱 [設定外部身分提供者 (IdP) 身分驗證](aws-devops-agent-security-setting-up-external-identity-provider-idp-authentication.md)。
+ **IAM 身分驗證連結 （管理員存取）** – 一種替代方法可讓您使用現有的主控台工作階段，從 AWS 管理主控台直接存取 Web 應用程式。此選項在實作完整的 Identity Center 整合之前很有用，但工作階段限制為 10 分鐘。

# 什麼是 DevOps Agent Spaces？
<a name="about-aws-devops-agent-what-are-devops-agent-spaces"></a>

DevOps Agent Space 是邏輯容器，可定義 AWS DevOps Agent 可存取的工具和基礎設施。每個 Agent Space 會使用自己的 AWS 帳戶存取、第三方整合和使用者許可獨立運作。

Agent Space 代表在事件回應期間可以存取和調查的 What AWS DevOps 代理程式界限。當您建立 代理程式空間時，您可以定義代理程式可以存取哪些 AWS 帳戶、可以連線哪些外部工具，以及組織中哪些使用者可以與代理程式互動。

每個 Agent Space 都做為獨立部署的 AWS DevOps Agent。您可以透過 AWS 管理主控台設定 Agent Space，而您的營運團隊會使用 Agent Space 的 Web 應用程式在該空間內進行調查和檢閱建議。

## 如何隔離 Agent Spaces
<a name="how-agent-spaces-are-isolated"></a>

Agent Spaces 會維持隔離，以確保安全性，並防止不同環境或團隊的意外存取：
+ **AWS 帳戶隔離** – 每個客服人員空間都使用專用 IAM 角色，僅授予特定 AWS 帳戶和資源的存取權。代理程式無法存取代理程式空間明確設定 AWS 的資源。
+ **使用者存取隔離** – 您可以控制哪些使用者或群組可以存取每個客服人員空間。這可讓您將存取許可與您的組織結構保持一致，確保團隊僅與其指定的客服人員空間互動。
+ **資料隔離** – 調查資料、事件歷史記錄和建議會在每個客服人員空間中個別維護。來自某個客服人員空間的資訊無法顯示，也無法從另一個客服人員空間存取。
+ **聊天資料隔離 ** - 聊天對話歷史記錄也會在每個客服人員空間中隔離。無法從另一個客服人員空間看見或存取一個客服人員空間中的對話和查詢。

## 客服人員空間 Web 應用程式
<a name="agent-space-web-app"></a>

每個 Agent Space 都有可在 AWS 管理主控台外部存取的專用 Web 應用程式。請參閱 [什麼是 DevOps Agent Web 應用程式？](about-aws-devops-agent-what-is-a-devops-agent-web-app.md) 以進一步了解 Web 應用程式。

## 何時使用多個客服人員空間
<a name="when-to-use-multiple-agent-spaces"></a>

考慮建立多個客服人員空間以支援不同的組織需求：
+ **團隊區隔** – 為不同的應用程式團隊或業務單位建立專用客服人員空間，以在客服人員空間中維持明確的擁有權界限。
+ **環境隔離 – **將生產環境和非生產環境分隔為不同的 Agent Spaces，以防止意外的跨環境存取。
+ **服務界限** – 使 Agent Spaces 與特定服務或應用程式界限保持一致，以保持調查的重點和相關性。
+ **合規要求** – 使用不同的存取控制或資料駐留設定來設定個別的 Agent Spaces，以符合法規要求。

**注意**  
** 建立多個客服人員空間時，您可以使用專用 AWS 帳戶做為客服人員空間的主要帳戶，並將不同的應用程式帳戶連接為次要帳戶。此方法可讓您維持精細的存取控制，同時確保每個客服人員空間只能存取其預期範圍的特定資源，即使使用自動建立角色也是如此。

# 什麼是 DevOps 代理程式拓撲？
<a name="about-aws-devops-agent-what-is-a-devops-agent-topology"></a>

AWS DevOps Agent 會自動探索和視覺化應用程式中的資源和關係，並使用產生的拓撲，在事件調查期間和提出預防性建議時了解您的基礎設施。

## 拓撲圖表的建立方式
<a name="how-topology-graphs-are-created"></a>

AWS DevOps Agent 透過數個自動化程序建置拓撲圖表：
+ **資源探索** – 代理程式會自動掃描 AWS 您的帳戶，以識別屬於您應用程式一部分的運算執行個體、儲存服務、聯網元件和資料庫等資源。
+ **關係偵測** – 代理程式會分析組態資料、CloudFormation 堆疊和資源標籤，以判斷資源彼此之間的關係。
+ **程式碼和部署映射** – 連線至 CI/CD 管道時，代理程式會將基礎設施資源連結至其部署程序，並變更應用程式和基礎設施程式碼。
+ **可觀測性行為映射** – 來自可觀測性系統的資料，例如 Amazon CloudWatch Application Signals 和 Dynatrace，用於識別指出資源之間關係的觀察行為。

## 關鍵功能
<a name="key-capabilities"></a>

資源映射提供多種功能，可增強事件調查和預防：
+ **互動式視覺化** – 透過 Operator Web 應用程式中的互動式圖形探索應用程式拓撲。您可以縮放和導覽拓撲，以了解資源之間的複雜關係。您也可以使用聊天功能查詢使用自然語言的拓撲資訊，例如「顯示所有連接到此 DynamoDB 資料表的 Lambda 函數」或「哪些資源受此警示影響？」。
+ **內容調查** – 在事件調查期間， AWS DevOps 代理程式受到資源拓撲的協助，以識別受影響的元件、了解爆量半徑，並透過您的系統追蹤影響路徑。
+ **根本原因分析** – 詳細了解資源關係有助於找出問題的來源，即使在具有許多相互依存性的複雜分散式系統中也是如此。
+ **影響評估** – 分析事件時，代理程式可以透過識別拓撲中的相依性鏈，更好地判斷哪些下游服務可能受到影響。
+ **預防性建議** – 代理程式使用拓撲洞察，針對彈性改善提出有針對性的建議，建議對系統穩定性影響最大的變更。

## 拓撲檢視
<a name="topology-views"></a>

Operator Web 應用程式拓撲頁面中的拓撲視覺化提供多個層級的詳細資訊：
+ **已學習** – 從客服人員空間理解技能產生的預設檢視。顯示由邏輯服務和請求路徑組織之基礎設施的結構化摘要。
+ **系統** – 顯示高階帳戶和區域邊界。
+ **容器** – 顯示部署堆疊，例如包含相關資源的 CloudFormation 堆疊。
+ **元件** – 顯示容器內的個別元件及其關係。
+ **所有資源** – 顯示包含所有探索資源及其關係的完整檢視。

## 資源探索
<a name="resource-discovery"></a>

透過兩種方法探索資源：
+ **CloudFormation 堆疊** – 代理程式會列出主要 AWS 帳戶和任何連線次要帳戶中的所有 CloudFormation 堆疊及其資源。這支援使用 CloudFormation 進行部署的任何infrastructure-as-code工具，包括 AWS 雲端開發套件 (AWS CDK)。
+ **Resource Explorer** – 對於未從 CloudFormation 部署的資源，會從 AWS Resource Explorer 探索標記的資源。目標 AWS 帳戶必須啟用 Resource Explorer。這有助於識別透過 AWS 管理主控台、 AWS 服務 APIs 或其他infrastructure-as-code架構部署之資源的應用程式邊界。

## 拓撲以外的調查範圍
<a name="investigation-scope-beyond-topology"></a>

雖然應用程式拓撲在調查期間提供重要的內容， AWS DevOps 代理程式並不僅限於調查拓撲中顯示的資源。代理程式可能會使用其他資料來源，例如 AWS 服務 APIs 或連線的可觀測性工具，來調查不在應用程式拓撲中的資源。

若要限制客服人員可存取的資源，請限制指派給客服人員之角色的政策，以存取跨帳戶資源。如需詳細資訊，請參閱[限制 AWS 帳戶中的客服人員存取](aws-devops-agent-security-limiting-agent-access-in-an-aws-account.md)。

## 拓撲和客服人員空間了解技能
<a name="topology-and-the-agent-space-understanding-skill"></a>

拓撲圖表會饋送至客服人員空間了解學習到的技能，該技能會編碼基礎設施的結構化摘要，以便在調查期間使用。當新的客服人員空間拓撲探索完成時，系統會自動產生客服人員空間理解技能。如需學習技能的詳細資訊，請參閱 [學習的技能](about-aws-devops-agent-learned-skills.md)。

# DevOps 代理程式技能
<a name="about-aws-devops-agent-devops-agent-skills"></a>

AWS DevOps 代理程式技能是模組化的指令集，可根據您的基礎設施和操作工作流程量身打造專業領域知識和調查方法，來擴展代理程式的功能。

## 什麼是技能
<a name="what-are-skills"></a>

Skills 是包含 Markdown 指示的獨立目錄，可提供專業功能給 AWS DevOps 代理程式。 AWS DevOps 代理程式支援[代理程式技能規格](https://agentskills.io/)的子集，這是封裝代理程式指示和資源的開放標準，僅支援不可執行的文件：Markdown 指示、PDFs、影像和資料檔案。

每項技能都需要一個 SKILL.md 檔案，其中包含您要為 AWS DevOps 代理程式提供的指示。除了必要的 SKILL.md 檔案之外，技能還可以包括：
+ 特定案例或基礎設施類型的**調查工作流程**。
+ **參考資料**，包括架構模式和操作程序。
+ **代理程式類型目標** – 技能可以針對特定代理程式類型 （通用、隨需、事件分類、事件 RCA、事件緩解、評估），以減少內容消耗並改善代理程式焦點。

## 為什麼要使用 Skills
<a name="why-use-skills"></a>

技能將一般用途助理中的 transform AWS DevOps 代理程式轉換為基礎設施和操作工作流程的專家。與聊天訊息中提供的一次性指示不同，技能是可重複使用的功能，可在與 AWS DevOps 代理程式執行的任務相關時自動載入。

**主要優點：**
+ **專用於您的代理程式** – Tailor AWS DevOps 代理程式，其中包含調查程序、最佳實務，以及專屬於基礎設施和營運模式的組織知識。
+ **減少重複** – 建立一次調查工作流程， AWS DevOps 代理程式會在所有相關調查中自動使用這些工作流程，無需重複提供相同的指引。
+ **編寫功能** – 結合多種技能來建置end-to-end調查工作流程。 AWS DevOps 代理程式會在執行期間讀取多種技能，例如從您的自訂 CI/CD 管道擷取部署的技能，以及搜尋程式碼儲存庫的技能。
+ **Amplify 自訂工具** – 建立技能，以有效地使用您的自訂 MCP 伺服器工具在 中引導 AWS DevOps 代理程式。技能可以記錄何時叫用特定工具、用於不同案例的參數，以及如何解譯結果以完成基礎設施特定的工作流程。

## 技能的運作方式
<a name="how-skills-work"></a>

當 AWS DevOps 代理程式遇到相關任務時，它會載入適當的技能並遵循指示來引導其調查。例如，「資料庫效能調查」技能可能包括step-by-step程序，讓代理程式能夠有系統地檢查警示狀態、分析連線指標，以及識別慢速查詢。

## 技能結構
<a name="skill-structure"></a>

技能會組織為目錄，其中包含：

```
my-skill/
├── SKILL.md              # Main skill instructions
├── references/           # Optional: additional reference documentation
└── assets/               # Optional: images, diagrams, data files
```

### SKILL.md
<a name="skillmd"></a>

`SKILL.md` 是唯一的強制性檔案。它包含以 Markdown 格式撰寫的核心指示。此檔案應該：
+ 描述何時及如何使用技能。
+ 提供step-by-step調查程序。
+ 包含不同案例的決策樹。
+ 記錄預期的輸出和成功條件。

### Frontmatter
<a name="frontmatter"></a>

Frontmatter 是`SKILL.md`檔案頂端的中繼資料區塊，包含在`---`分隔符號之間。它包含 AWS DevOps 代理程式用來判斷在調查或任務期間何時啟用技能的 `name`和 `description` 欄位。

```
---
name: rds-performance-investigation
description: Investigation procedures for RDS performance issues including
  connection exhaustion, slow queries, replication lag, and storage capacity.
  Use this skill when investigating database latency, connection errors, or
  read/write performance degradation.
---
```

**name** – 技能的唯一識別符。僅使用小寫字母、數字和連字號 （最多 64 個字元）。不得以連字號開頭或結尾。

**描述** – 詳細說明何時和為何 AWS DevOps 代理程式應該使用此 Skill。 AWS DevOps 代理程式會評估此欄位，以決定技能是否與目前的任務相關。即使指示撰寫良好，模糊或遺漏的描述也可能導致客服人員完全略過技能。

**重要** – 從客服人員的角度撰寫描述。包含應觸發技能的特定案例、服務、錯誤類型或症狀。例如，「在調查 Amazon RDS 執行個體的資料庫延遲、連線錯誤或查詢逾時時使用此技能」比「RDS 技能」更有效。

當您在 UI 中建立技能時，系統會自動從您提供的名稱和描述產生前綴。上傳為 zip 檔案的技能必須在 `SKILL.md` 檔案中包含前綴。

## 範例：完成技能
<a name="example-complete-skill"></a>

下列範例顯示調查 RDS 效能問題的完整、格式良好的技能。它示範了目錄結構、https：//SKILL.md 前綴、可執行的調查程序和補充參考檔案。

**目錄結構：**

```
rds-performance-investigation/
├── SKILL.md
├── references/
│   └── rds-metrics-reference.md
└── assets/
    └── rds-investigation-flowchart.png
```

**https：//SKILL.md：**

```
---
name: rds-performance-investigation
description: Investigation procedures for RDS performance issues including
  connection exhaustion, slow queries, replication lag, and storage capacity.
  Use this skill when investigating database latency, connection errors, or
  read/write performance degradation.
---

# RDS Performance Investigation

Use this skill when customers report database latency, connection errors,
query timeouts, or read/write performance degradation.


## Step 1: Check alarm status

Query CloudWatch for active alarms on the affected RDS instance. Look for:
- `DatabaseConnections` exceeding 80% of max_connections
- `ReadLatency` or `WriteLatency` above 20ms
- `FreeStorageSpace` below 20% of total storage
- `ReplicaLag` above 30 seconds (read replicas only)


## Step 2: Analyze connection metrics

Retrieve `DatabaseConnections` over the past hour. If connections are near
the max_connections limit, check for connection pool misconfiguration or
long-running idle connections.


## Step 3: Identify slow queries

Use Performance Insights (`pi:GetResourceMetrics`) to retrieve the top SQL
statements by average active sessions. Focus on queries with high `db.load`
contribution or frequent I/O waits.


## Step 4: Summarize findings

Provide a summary with:
1. Current performance status (healthy / degraded / critical)
2. Root cause hypothesis with supporting metrics
3. Recommended remediation steps ranked by priority
```

**參考/rds-metrics-reference.md：//：**

```
# RDS CloudWatch Metrics Reference


| Metric | Normal Range | Investigation Threshold |
|---|---|---|
| DatabaseConnections | < 70% max_connections | > 80% max_connections |
| ReadLatency | < 5ms | > 20ms |
| WriteLatency | < 5ms | > 20ms |
| FreeStorageSpace | > 30% total storage | < 20% total storage |
| ReplicaLag | < 5 seconds | > 30 seconds |
| CPUUtilization | < 70% | > 85% |
```

## 建立技能
<a name="creating-skills"></a>

在建立技能之前，您必須擁有 代理程式空間。如需詳細資訊，請參閱[建立 代理程式空間](getting-started-with-aws-devops-agent-creating-an-agent-space.md)。

您可以根據您的工作流程偏好設定和技能複雜性，以兩種方式建立技能：

### 在 UI 中建立技能
<a name="creating-a-skill-in-the-ui"></a>

在 AWS DevOps Agent Operator Web 應用程式中建立的技能在單一 SKILL.md 檔案中包含名稱、描述和指示。

**若要在 UI 中建立技能：**
+ 導覽至 Agent Space Operator Web 應用程式中的技能頁面。
+ 按一下「新增技能」。
+ 從模態中選取「建立技能」。
+ 填寫技能表單：
  + **名稱** – 僅限小寫字母、數字和連字號 （最多 64 個字元）。不得以連字號開頭或結尾。範例：`rds-throttling-investigation`
  + **描述** – 簡短說明何時使用此技能 （建議最少 100 個字元，最多 1，024 個字元）。這有助於客服人員判斷何時啟用技能。
  + **狀態** – 設定為作用中 （預設） 或非作用中。客服人員不會使用非作用中技能。
  + **客服人員類型** – 選取一個或多個可使用此技能的客服人員類型。依預設會選取**一般**，讓所有客服人員類型都能使用這項技能。若要鎖定特定客服人員，請取消選取一般，然後從中選擇：隨需、事件分類、事件 RCA、事件緩解或評估。
  + **說明** – Markdown 格式的Step-by-step程序。具體且可行。
+ 按一下「建立」以儲存技能。

系統會自動產生具有適當前端結構的 SKILL.md 檔案。

**若要編輯在 UI 中建立的技能：**
+ 導覽至技能清單中的技能，然後按一下技能將其開啟。
+ 按一下 **Edit (編輯)**。
+ 修改名稱、描述或指示。
+ 按一下**儲存**以更新技能。

### 上傳技能
<a name="uploading-a-skill"></a>

上傳為 zip 檔案的技能包含 SKILL.md 檔案和其他資源，例如參考資料或資產。

**技能結構：**

```
my-skill.zip
├── SKILL.md              # Required: main skill instructions
├── references/           # Optional: reference documentation
│   ├── architecture.md
│   └── troubleshooting.md
└── assets/               # Optional: images, diagrams, data files
    ├── topology.png
    └── metrics.csv
```

**SKILL.md 前端要求：**

上傳為 zip 檔案的技能必須在 SKILL.md 中使用 `name`和 `description` 欄位包含前綴。 AWS DevOps 代理程式會使用這些欄位來判斷何時啟用技能。如需撰寫有效前綴的詳細資訊，請參閱本主題稍早的前綴章節。

```
---
name: rds-performance-analysis
description: Comprehensive RDS performance investigation procedures
  for connection exhaustion, slow queries, and storage capacity issues.
  Use when investigating database latency or read/write degradation.
---


# RDS Performance Analysis


[Your skill instructions here...]
```

**若要透過 zip 上傳建立技能：**
+ 依照上述結構，使用技能檔案建立目錄。
+ 確保 SKILL.md 包含適當的前綴 （名稱和描述）。
+ 將目錄壓縮為 .zip 檔案。
+ 導覽至 Agent Space Operator Web 應用程式中的技能頁面。
+ 按一下「新增技能」。
+ 從模態中選取「上傳技能」。
+ 拖放您的 .zip 檔案或按一下以瀏覽 （僅限 ZIP 檔案，最多 6 MB)。
+ 選取一個或多個可使用此技能的代理程式類型 （依預設會選取通用，並套用到所有代理程式類型；取消選取以鎖定隨需、事件分類、事件 RCA、事件緩解或評估）。
+ 檢閱 zip 檔案需求和驗證結果。
+ 按一下「上傳」，將技能新增至您的客服人員空間。

**上傳為 zip 檔案之技能的重要限制：**
+ **目前不支援指令碼** – 包含 `scripts/`目錄中指令碼的技能會在上傳期間遭到拒絕。一旦代理程式可以存取安全編碼環境，就會在未來版本中啟用指令碼執行。
+ **大小限制** – zip 檔案大小總計不得超過 6 MB （包括所有檔案）。
+ **需要 SKILL.md ** – zip 檔案必須包含具有有效前端的 SKILL.md 檔案。

**命名技能的最佳實務：**

使用清晰的描述性名稱，例如「rds-throttling-investigation」，而不是通用名稱。良好的技能名稱會反映其處理的特定案例或服務，讓您更輕鬆地一目了然地識別正確的技能。

## 管理技能
<a name="managing-skills"></a>

AWS DevOps Agent 透過 Operator Web 應用程式提供全方位的技能管理功能：

**列出技能** – 檢視客服人員空間中的所有技能。技能頁面會顯示技能名稱、作用中或非作用中狀態、建立日期、上次更新日期，以及可用的動作。

**檢視技能** – 按一下任何技能以查看其詳細資訊檢視。在 UI 中建立的技能會顯示可編輯的內容，您可以在其中直接在 UI 中修改名稱、描述或指示，然後按一下「儲存」進行更新。上傳為 zip 檔案的技能會顯示檔案樹狀目錄，其中顯示 SKILL.md 和參考/ 和資產/ 等任何其他目錄。按一下樹狀目錄中的檔案，以唯讀模式檢視其內容。

**選取技能的客服人員** – 設定哪些客服人員類型可以在建立或編輯時使用每項技能。在客服人員類型下拉式清單中，使用核取方塊選取一或多個客服人員類型：**一般** （預設 - 適用於所有客服人員類型）、**隨需 **（整合查詢）、**事件分類 **（初始事件評估）、**事件 RCA** （根本原因分析）、**事件緩解 **（自動化事件回應） 或**評估** （主動建議）。依預設會選取一般，讓所有客服人員類型都能使用這項技能。以特定代理程式為目標的技能可減少內容消耗並改善代理程式焦點。

**啟用和停用技能** – 暫時停用技能，而不使用作用中/非作用中切換將其刪除。開啟技能詳細資訊檢視並切換切換到「非作用中」，以防止代理程式載入它以進行新的調查，同時保留所有內容和組態。進行中的調查會繼續使用技能。切換回「作用中」，讓技能立即再次可用。

**更新技能** – 根據現有技能的建立方式來修改現有技能。對於在 UI 中建立的技能，請按一下技能詳細資訊檢視中的「編輯」、修改名稱、描述或指示，然後按一下「儲存」進行更新。對於上傳為 zip 檔案的技能，請在本機修改檔案、建立新的 zip 檔案，以及上傳新版本。

**刪除技能** – 從客服人員空間永久移除技能。開啟技能清單檢視，按一下更多選項選單 (⋮)，然後選取「刪除」，檢閱永久刪除的相關警告，輸入要確認的技能名稱，然後按一下「刪除技能」。刪除無法復原。如果嘗試載入已刪除的技能，進行中的調查可能會受到影響。對於上傳為 zip 檔案的技能，請先下載 zip 檔案，然後再刪除 做為備份。如果您可能需要再次刪除技能，請考慮停用技能，而不是將其刪除。

## 從 Runbook 遷移
<a name="migrating-from-runbooks"></a>

現有的 Runbook 會自動遷移至 Skills，而不需要客戶動作。當您的客服人員空間轉換為技能模型時，所有 Runbook 都會轉換為技能，並顯示在您的技能使用者介面中。遷移後，您可以：
+ **檢閱遷移的技能** – 檢查自動遷移是否已正確轉換您的 Runbook。
+ **視需要更新** – 直接在 UI 中編輯技能，以精簡指示、更新描述或設定代理程式類型目標。
+ **使用參考展開** – 對於可能受益於其他參考資料或架構圖的技能，請使用參考/ 或資產/ 目錄將其重新建立為 zip 上傳技能。
+ **建立新的技能**：為 Runbook 先前未涵蓋的調查工作流程新增技能。

如果您在自動遷移的技能方面遇到任何問題，或需要遷移後更新方面的協助，請聯絡 AWS Support。

# 學習的技能
<a name="about-aws-devops-agent-learned-skills"></a>

## 什麼是學到的技能？
<a name="what-are-learned-skills"></a>

學到的技能是 DevOps 代理程式從您的代理程式空間資料產生的結構化知識檔案。每個學到的技能都會編碼 AWS DevOps 代理程式在執行任務時所使用的特定知識類型。在啟動時，有兩個學習到的技能可用：客服人員空間理解和工具使用最佳實務。

### 客服人員空間了解
<a name="agent-space-understanding"></a>

Agent Space Understanding 技能 (`understanding-agent-space`) 會分析您連線的雲端帳戶、程式碼儲存庫和遙測整合，以在 Agent Space 中建置資源和關係的映射。

技能會產生主要`SKILL.md`檔案和一組參考檔案。主要檔案包含純語言系統概觀，其中包含關鍵網域概念、部署環境 (AWS 帳戶和區域對、Azure 訂閱和區域等）、容器層級架構圖，顯示邏輯服務如何連線、應用程式的核心請求路徑及其周遊的元件，以及程式碼儲存庫與容器的映射。

每個邏輯容器都會收到一個專用參考檔案，描述其內部元件 （運算、資料、傳訊、網路等），其中包含資源類型和實體識別符，例如 ARNs、資料表名稱和佇列 URLs。參考檔案也會擷取可觀測性涵蓋範圍，包括連結至每個元件的警示、儀表板和監視器。它也會將每個元件映射至其相關聯的程式碼儲存庫、套件和infrastructure-as-code定義，提供從原始程式碼到部署資源的完整可追蹤性鏈。

每個關鍵請求路徑都會收到一個專用參考檔案，描述從進入點到每個中繼服務、資料存放區和外部相依性的完整end-to-end請求流程。檔案包含排序流程圖，其中顯示元件之間的操作順序和互動機制，以及每位參與者的責任。它還會為與路徑相關的可觀測性訊號編製目錄：每個躍點的日誌群組模式、關鍵指標 （延遲、錯誤率、限流、字符配額） 及其警示名稱和維度，以及可在服務和帳戶之間建立關聯的分散式追蹤範圍。

### 工具使用最佳實務
<a name="tool-use-best-practices"></a>

工具使用最佳實務技能會分析過去的調查工具，用來擷取有效的使用模式、常見失敗模式和參數指導。這有助於 DevOps 代理程式避免已知的陷阱，並以較少的浪費步驟執行調查。技能會產生主要檔案和一組每個工具的參考檔案。主要檔案做為路由索引，列出每個工具及其支援的調查案例，以及對應參考檔案的連結。

每個工具參考檔案最多可包含三個區段：
+ **最佳實務** — 從成功工具使用中擷取的調查驅動技術，例如 CloudWatch Logs Insights 查詢範本、環境特定指標命名空間和維度，以及 CloudTrail 事件來源篩選條件。每個項目都圍繞調查案例進行組織，並包含在過去調查中觀察到的具體參數值和範例。
+ **常見錯誤** — 重複失敗模式及其修正。每個項目描述特定的錯誤條件，例如查詢無法存取的帳戶或建構格式錯誤的彙總查詢，並提供修正動作，讓代理程式可以避免錯誤或從錯誤中復原，而不會浪費調查步驟。
+ **輸出管理** — 容易傳回大型回應的工具呼叫指導。每個項目描述參數變更或處理策略，以減少輸出大小，同時保留診斷值。

當即時基礎設施存取可用時，技能會先針對您的環境驗證模式，再納入它們。確認的模式是以可信度表示，未確認的模式使用謹慎的語言，並排除拒絕的模式。這可讓技能與基礎設施的目前狀態保持一致。

## 管理學到的技能
<a name="managing-learned-skills"></a>

**更新**：DevOps 代理程式會根據您代理程式空間中的活動，自動產生和更新學到的技能。以下說明每個技能的更新時間。

DevOps 代理程式每 30 次調查會產生更新的 **工具使用最佳實務**技能。

**Agent Space Understanding** 技能是由學習代理程式產生，在您新增、更新或移除 Agent Space 功能或整合時執行。

若要手動重新產生學習的技能，請選擇運算子應用程式拓撲頁面上的**重新產生**按鈕，或與客服人員聊天並要求其更新學習的技能。

**停用** — 根據預設，學習的技能處於作用中狀態。作用中時，DevOps 代理程式會在每個 DevOps 代理程式任務開始時載入它們。若要停止套用學到的技能，請從運算子應用程式中的技能檢視器停用它。停用技能不會將其刪除。技能會保留，而且可以隨時重新啟用。停用技能時，DevOps 代理程式會在該技能不知情的情況下運作。

**拓撲檢視** — Agent Space 的 Web 應用程式中的拓撲頁面使用 Agent Space Understanding Skill，以視覺化方式將您的 Agent Space 環境顯示為邏輯容器和元件。按一下任何容器以查看其元件、資源識別符和遙測。

# 支援的區域
<a name="about-aws-devops-agent-supported-regions"></a>

本主題說明您可以使用 AWS DevOps 代理程式 AWS 的區域。如需 AWS 區域的詳細資訊，請參閱[《帳戶管理參考指南》中的指定 AWS 您的帳戶可以使用的區域](https://docs.aws.amazon.com/accounts/latest/reference/manage-acct-regions.html)。 *AWS *

## 跨區域資源監控
<a name="cross-region-resource-monitoring"></a>

AWS DevOps 代理程式可以監控和調查位於任何 AWS 區域的 AWS 帳戶中的資源，無論您在哪個支援的區域建立代理程式空間。當您將 AWS 帳戶與 代理程式空間建立關聯時，代理程式會探索並映射該帳戶內所有區域中的資源。這表示您在工作負載執行的每個區域中都不需要 代理程式空間。

根據您偏好的資料落地、與營運團隊的距離或組織需求，選擇支援的 區域。

## 支援的區域
<a name="supported-regions"></a>

AWS DevOps 代理程式可在下列 AWS 區域使用。


| 區域名稱 | 區域代碼 | 主控台連結 | 
| --- | --- | --- | 
| 美國東部 (維吉尼亞北部) | us-east-1 | [開啟主控台](https://us-east-1.console.aws.amazon.com/aidevops/home?region=us-east-1) | 
| 美國西部 (奧勒岡) | us-west-2 | [開啟主控台](https://us-west-2.console.aws.amazon.com/aidevops/home?region=us-west-2) | 
| 亞太地區 (悉尼) | ap-southeast-2 | [開啟主控台](https://ap-southeast-2.console.aws.amazon.com/aidevops/home?region=ap-southeast-2) | 
| 亞太區域 (東京) | ap-northeast-1 | [開啟主控台](https://ap-northeast-1.console.aws.amazon.com/aidevops/home?region=ap-northeast-1) | 
| 歐洲 (法蘭克福) | eu-central-1 | [開啟主控台](https://eu-central-1.console.aws.amazon.com/aidevops/home?region=eu-central-1) | 
| 歐洲 (愛爾蘭) | eu-west-1 | [開啟主控台](https://eu-west-1.console.aws.amazon.com/aidevops/home?region=eu-west-1) | 

## 服務端點
<a name="service-endpoints"></a>


| 區域名稱 | 區域代碼 | Endpoint | 通訊協定 | 
| --- | --- | --- | --- | 
| 美國東部 (維吉尼亞北部) | us-east-1 | aidevops.us-east-1.amazonaws.com | HTTPS | 
| 美國西部 (奧勒岡) | us-west-2 | aidevops.us-west-2.amazonaws.com | HTTPS | 
| 亞太地區 (悉尼) | ap-southeast-2 | aidevops.ap-southeast-2.amazonaws.com | HTTPS | 
| 亞太地區 (東京) | ap-northeast-1 | aidevops.ap-northeast-1.amazonaws.com | HTTPS | 
| 歐洲 (法蘭克福) | eu-central-1 | aidevops.eu-central-1.amazonaws.com | HTTPS | 
| 歐洲 (愛爾蘭) | eu-west-1 | aidevops.eu-west-1.amazonaws.com | HTTPS | 

## 考量事項
<a name="considerations"></a>
+ **客服人員空間區域選擇** — 客服人員空間及其資料 （調查、

拓撲、建議） 會存放在您建立它的區域。選擇符合您資料落地需求的區域。
+ **跨區域監控** — 與客服人員相關聯的 AWS 帳戶中的資源

無論這些資源部署在哪個區域，空間都會受到監控。您不需要在工作負載執行的每個區域中建立個別的 Agent Spaces。
+ **第三方整合** — 與 CI/CD 提供者的連線 (GitHub、GitLab)、

可觀測性工具 (Dynatrace、Datadog、New Relic、Splunk) 和 MCP 伺服器是依代理程式空間設定，與區域無關。