本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 監控 Amazon EMR事件 CloudWatch
Amazon 會在 Amazon EMR主控台中EMR追蹤事件並保留相關資訊最多七天。當叢集、執行個體群組、執行個體機群、自動擴展政策或步驟的狀態變更時,Amazon 會EMR記錄事件。事件會擷取事件發生的日期和時間、受影響元素的詳細資料,以及其他重要資料點。
下表列出 Amazon EMR事件,以及事件指示的狀態或狀態變更、事件的嚴重性、事件類型、事件代碼和事件訊息。Amazon EMR將事件表示為JSON物件,並自動將其傳送至事件串流。當您使用 CloudWatch Events 設定事件處理規則時,JSON物件很重要,因為規則會嘗試比對JSON物件中的模式。如需詳細資訊,請參閱 Amazon Events 使用者指南 EMR 中的事件和事件模式和 Amazon 事件。 CloudWatch
注意
我們會不斷完善錯誤訊息,以便您收到最相關的資訊。因此,建議您不要剖析訊息中的文字來啟動工作流程中的下一個動作。
叢集啟動事件
狀態或狀態變更 | 嚴重性 | 事件類型 | 事件代碼 | 訊息 |
---|---|---|---|---|
CREATING |
WARN |
EMR 執行個體機群佈建 | EC2 佈建 - 執行個體容量不足 | 我們無法ClusterId (ClusterName) 為執行個體機群 Amazon 建立您的 Amazon InstanceFleetID EMR叢集EC2,在可用區域 [Instancetype3, Instancetype4] 中,執行個體類型的 Spot 容量不足[Instancetype1, Instancetype2] ,執行個體類型的隨需容量不足[AvailabilityZone1, AvaliabilityZone2] 。如需有關如何回應此事件的詳細資訊,請參閱這裡的文件。 |
CREATING |
WARN |
EMR 執行個體群組佈建 | EC2 佈建 - 執行個體容量不足 | 我們無法ClusterId (ClusterName) 在可用區域 [Instancetype3, Instancetype4] 中為執行個體群組 Amazon 建立您的 Amazon InstanceGroupID EMR叢集EC2,但 Spot 容量不足以用於執行個體類型[Instancetype1, Instancetype2] ,且隨需容量不足以用於執行個體類型[AvailabilityZone1, AvaliabilityZone2] 。如需有關如何回應此事件的詳細資訊,請參閱這裡的文件。 |
CREATING |
WARN |
EMR 執行個體機群佈建 | EC2 佈建 - 子網路中的可用地址不足 | 我們無法建立ClusterId (ClusterName) 您為執行個體機群請求的 Amazon EMR叢集,InstanceFleetID 因為指定的子網路[Subnet1, Subnet2] 不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets 操作來查看子網路中有多少 IP 地址可用 (未使用)。如需有關如何回應此事件的資訊,請參閱 Amazon 的錯誤碼 EC2 API |
CREATING |
WARN |
EMR 執行個體群組佈建 | EC2 佈建 - 子網路中的可用地址不足 | 我們無法建立ClusterId (ClusterName) 您為執行個體群組請求的 Amazon EMR叢集,InstanceGroupID 因為指定的子網路[Subnet1, Subnet2] 不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets 操作來查看子網路中有多少 IP 地址可用 (未使用)。如需有關如何回應此事件的資訊,請參閱 Amazon 的錯誤碼 EC2 API |
CREATING
|
WARN
|
EMR 執行個體機群佈建 |
EC2 佈建 – 超過 vCPU 限制 |
Amazon EMR叢集InstanceFleetID 中的 佈建ClusterId (ClusterName) 會延遲,因為您已達到指派給 中執行執行個體的 vCPUs (虛擬處理單位) 數量限制account (accountId) 。如需詳細資訊,Amazon 的錯誤碼 EC2 API |
CREATING
|
WARN
|
EMR 執行個體群組佈建 |
EC2 佈建 – 超過 vCPU 限制 |
Amazon EMR叢集InstanceGroupID 中執行個體群組的佈建ClusterId 會延遲,因為您已達到指派給帳戶 中執行中執行個體的 vCPUs (虛擬處理單位) 數量限制(accountId) 。如需詳細資訊,Amazon 的錯誤碼 EC2 API |
CREATING
|
WARN
|
EMR 執行個體機群佈建 |
EC2 佈建 – 已超過 Spot 執行個體計數限制 |
Amazon EMR叢集InstanceFleetID 中執行個體機群的佈建ClusterID (ClusterName) 延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId) 。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
CREATING
|
WARN
|
EMR 執行個體群組佈建 |
EC2 佈建 – 已超過 Spot 執行個體計數限制 |
Amazon EMR叢集InstanceGroupID 中執行個體群組的佈建ClusterID (ClusterName) 會延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId) 。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
CREATING
|
WARN
|
EMR 執行個體機群佈建 |
EC2 佈建 – 超過執行個體限制 |
Amazon EMR叢集InstanceFleetID 中執行個體機群的佈建ClusterId (ClusterName) 會延遲,因為您已達到在 中可同時執行的執行個體數量限制account (accountID) 。如需 Amazon EC2服務限制的詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
CREATING
|
WARN
|
EMR 執行個體群組佈建 |
EC2 佈建 – 超過執行個體限制 |
Amazon EMR叢集InstanceGroupID 中執行個體群組的佈建ClusterId (ClusterName) 會延遲,因為您已達到可在 中同時執行的執行個體數量限制account (accountID) 。如需 Amazon EC2服務限制的詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
CREATING |
WARN |
EMR 執行個體群組佈建 |
無 |
Amazon EMR叢集 - 或 - Amazon EMR叢集 注意處於 |
STARTING
|
INFO
|
EMR 叢集狀態變更 |
無 |
Amazon EMR叢集 |
STARTING
|
INFO
|
EMR 叢集狀態變更 |
無 |
注意僅適用於在 Amazon 中選取執行個體機群組態和多個可用區域的叢集EC2。 Amazon EMR叢集 |
STARTING
|
INFO
|
EMR 叢集狀態變更 |
無 |
Amazon EMR叢集 |
WAITING
|
INFO
|
EMR 叢集狀態變更 |
無 |
Amazon EMR叢集 - 或 - Amazon EMR叢集 注意處於 |
注意
當您的EMR叢集在叢集建立或調整大小操作期間遇到執行個體機群或執行個體群組EC2的容量不足錯誤時,具有事件代碼的事件會EC2 provisioning - Insufficient Instance Capacity
定期發出。如需有關如何回應這些事件的詳細資訊,請參閱 回應 Amazon EMR叢集的執行個體容量不足事件。
叢集終止事件
狀態或狀態變更 | 嚴重性 | 事件類型 | 事件代碼 | 訊息 |
---|---|---|---|---|
TERMINATED
|
嚴重程度依狀態更改原因而定,如下所示:
|
EMR 叢集狀態變更 |
無 |
Amazon EMR Cluster |
TERMINATED_WITH_ERRORS
|
CRITICAL
|
EMR 叢集狀態變更 |
無 |
Amazon EMR Cluster |
TERMINATED_WITH_ERRORS
|
CRITICAL
|
EMR 叢集狀態變更 |
無 |
Amazon EMR Cluster |
執行個體機群狀態變更事件
注意
執行個體機群組態僅適用於 Amazon 4.8.0 版及更新EMR版本,不包括 5.0.0 和 5.0.3。
狀態或狀態變更 | 嚴重性 | 事件類型 | 事件代碼 | 訊息 |
---|---|---|---|---|
從 |
INFO
|
無 | Amazon EMR叢集 |
|
從 |
INFO
|
無 | Amazon EMR叢集 |
|
從 |
INFO
|
無 | Amazon EMR叢集 |
|
從 |
INFO
|
無 | Amazon EMR叢集 |
|
SUSPENDED
|
ERROR
|
無 | Amazon EMR叢集 |
|
RESIZING
|
WARNING
|
無 | Amazon EMR叢集 |
|
|
INFO
|
無 | 當 Amazon 在可用區域中EMR新增 Spot 容量時,Amazon EMR叢集 |
|
|
INFO
|
無 | Amazon EMR叢集 |
執行個體機群規模調整事件
事件類型 | 嚴重性 | 事件代碼 | 訊息 |
---|---|---|---|
EMR 執行個體機群調整大小 |
ERROR |
Spot 佈建逾時 |
在 AZ 中取得 Spot 容量時,Amazon EMR叢集 |
EMR 執行個體機群調整大小 |
ERROR |
隨選佈建逾時 |
在 AZ 中取得隨需容量時, |
EMR 執行個體機群調整大小 |
WARNING |
EC2 佈建 - 執行個體容量不足 | 我們無法完成EMR叢集 |
EMR 執行個體機群調整大小 |
WARNING |
Spot 佈建逾時 - 繼續調整大小 |
我們仍在為執行個體機群調整大小操作佈建 Spot 容量,這些操作會在 為 Amazon EMR叢集 |
EMR 執行個體機群調整大小 |
WARNING |
隨選佈建逾時 - 繼續調整大小 |
我們仍在為執行個體機群調整大小操作佈建隨需容量,這些操作在 Amazon EMR叢集 |
EMR 執行個體機群調整大小 |
WARNING |
EC2 佈建 - 子網路中的可用地址不足 |
我們無法完成 Amazon EMR叢集InstanceFleetID 中執行個體機群的調整大小操作,ClusterId (ClusterName) 因為指定的子網路 【Subnet1、Subnet2】 不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets 操作來檢視子網路中有多少可用 (未使用的) IP 地址。如需如何回應此事件的資訊,請參閱 Amazon EC2 的錯誤碼API。 |
EMR 執行個體機群調整大小 |
WARNING |
EC2 佈建 - 超過 vCPU 限制 |
Amazon EMR叢集InstanceFleetID 中執行個體機群的調整大小ClusterName 會延遲,因為您已達到指派給 中執行執行個體的 vCPUs (虛擬處理單位) 數量限制account (accountId) 。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
EMR 執行個體機群調整大小 |
WARNING |
EC2 佈建 - 已超過 Spot 執行個體計數限制 |
Amazon EMR叢集InstanceFleetID 中執行個體機群的佈建ClusterID (ClusterName) 會延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId) 。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
EMR 執行個體機群調整大小 |
WARNING |
EC2 佈建 - 超過執行個體限制 |
Amazon EMR叢集InstanceFleetID 中執行個體機群的佈建ClusterID (ClusterName) 會延遲,因為您已達到可在 中執行的隨需執行個體數量限制account (accountId) 。如需 Amazon 錯誤碼的詳細資訊EC2API。 |
注意
佈建逾時事件會在逾時到期後,Amazon EMR停止為機群佈建 Spot 或隨需容量時發出。如需有關如何回應這些事件的詳細資訊,請參閱 回應 Amazon EMR叢集執行個體機群調整逾時事件的大小。
執行個體群組事件
事件類型 | 嚴重性 | 事件代碼 | 訊息 |
---|---|---|---|
從 |
INFO
|
無 | Amazon EMR叢集 |
從 |
INFO
|
無 | Amazon EMR叢集 |
SUSPENDED
|
ERROR
|
無 | Amazon EMR叢集 |
RESIZING
|
WARNING
|
無 | Amazon EMR叢集 |
EMR 執行個體群組調整大小 |
WARNING |
EC2 佈建 - 執行個體容量不足 | 我們無法完成EMR在叢集 |
EMR 執行個體群組調整大小 |
WARNING |
EC2 佈建 - 子網路中的可用地址不足 |
我們無法完成 Amazon EMR叢集InstanceGroupID 中執行個體群組的調整大小操作,ClusterId (ClusterName) 因為指定的子網路 【Subnet1、Subnet2】 不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets 操作來檢視子網路中有多少可用 (未使用的) IP 地址。如需如何回應此事件的資訊,請參閱 Amazon EC2 的錯誤碼API。 |
EMR 執行個體群組調整大小 |
WARNING |
EC2 佈建 - 超過 vCPU 限制 |
Amazon EMR叢集InstanceGroupID 中執行個體群組的調整大小ClusterName 會延遲,因為您已達到指派給 中執行中執行個體的 vCPUs (虛擬處理單位) 數量限制account (accountId) 。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
EMR 執行個體群組調整大小 |
WARNING |
EC2 佈建 - 已超過 Spot 執行個體計數限制 |
Amazon EMR叢集InstanceGroupID 中執行個體群組的佈建ClusterID (ClusterName) 會延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId) 。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API。 |
EMR 執行個體群組調整大小 |
WARNING |
EC2 佈建 - 超過執行個體限制 |
Amazon EMR叢集InstanceGroupID 中執行個體群組的佈建ClusterID (ClusterName) 會延遲,因為您已達到可在 中執行的隨需執行個體數量限制account (accountId) 。如需 Amazon 錯誤碼的詳細資訊EC2API。 |
從 |
INFO
|
無 | Amazon EMR叢集 |
注意
使用 Amazon 5.21.0 版及更新EMR版本,您可以覆寫叢集組態,並為執行中的叢集中的每個執行個體群組指定其他組態分類。您可以使用 Amazon EMR主控台、 AWS Command Line Interface (AWS CLI) 或 來執行此操作 AWS SDK。如需詳細資訊,請參閱為執行中叢集的執行個體群組提供組態。
下表列出重新組態操作的 Amazon EMR事件,以及事件指示的狀態或狀態變更、事件的嚴重性和事件訊息。
狀態或狀態變更 | 嚴重性 | 訊息 |
---|---|---|
RUNNING
|
INFO
|
Amazon EMR叢集 |
從 |
INFO
|
Amazon EMR叢集 |
從 |
INFO
|
Amazon EMR叢集 |
RESIZING
|
INFO
|
Amazon EMR叢集 |
RECONFIGURING
|
INFO
|
Amazon EMR叢集InstanceGroupID 中執行個體Num 群組的執行個體計數大小調整操作ClusterId (ClusterName) 在 會暫時遭到封鎖,Time 因為執行個體群組位於 中State 。 |
RECONFIGURING
|
WARNING
|
Amazon EMR叢集 |
RECONFIGURING
|
INFO
|
組態正在還原至 Amazon |
從 |
INFO
|
在 Amazon |
從 |
CRITICAL
|
無法在 Amazon |
自動擴展政策事件
狀態或狀態變更 | 嚴重性 | 訊息 |
---|---|---|
PENDING
|
INFO
|
Auto Scaling 政策已新增至 - 或 - Amazon EMR叢集 |
ATTACHED
|
INFO
|
Amazon EMR叢集 |
|
INFO
|
Amazon EMR叢集 |
FAILED
|
ERROR
|
Amazon EMR叢集 - 或 - Amazon EMR叢集 |
步驟事件
狀態或狀態變更 | 嚴重性 | 訊息 |
---|---|---|
PENDING
|
INFO
|
步驟 |
CANCEL_PENDING
|
WARN
|
Amazon EMR叢集 |
RUNNING
|
INFO
|
Amazon EMR叢集 |
COMPLETED
|
INFO
|
Amazon EMR叢集 |
CANCELLED
|
WARN
|
Amazon 叢集 |
FAILED
|
ERROR
|
Amazon EMR叢集 |
運作狀態不佳的節點替換事件
事件類型 | 嚴重性 | 事件代碼 | 訊息 |
---|---|---|---|
Amazon 運作EMR狀態不佳節點替換 |
INFO |
偵測到運作狀態不佳的核心節點 |
Amazon EMR已識別 Amazon EMR叢集 |
Amazon 運作EMR狀態不佳節點替換 |
INFO |
核心節點運作狀態不佳 - 停用取代 |
Amazon EMR已識別 Amazon EMR叢集 |
Amazon 運作EMR狀態不佳節點替換 |
WARN |
未取代運作狀態不佳的核心節點 |
注意Amazon EMR無法取代核心節點的原因會因您的案例而有所不同。例如,Amazon EMR無法刪除節點的一個原因,是因為叢集不會有任何剩餘的核心節點。 |
Amazon 運作EMR狀態不佳節點替換 |
INFO |
復原運作狀態不佳的核心節點 |
Amazon EMR已復原 Amazon EMR叢集 |
如需不正常節點取代的詳細資訊,請參閱取代運作狀態不佳節點 。
使用 Amazon EMR主控台檢視事件
對於每個叢集,您可以在詳細資訊窗格中查看簡單的事件清單,該清單以遞減順序列出出現的事件。您也可以以遞減順序檢視區域中全部叢集所出現的所有事件。
如果您不希望使用者查看區域的所有叢集事件,請為 "Effect": "Deny"
動作新增拒絕許可 (elasticmapreduce:ViewEventsFromAllClustersInConsole
) 描述到連接至使用者的政策。
使用主控台檢視區域中所有叢集的事件
-
登入 AWS Management Console,然後在 https://console.aws.amazon.com/emr
開啟 Amazon EMR主控台。 -
在左側導覽窗格中的 EMR下EC2,選擇事件 。
使用主控台檢視特定叢集的事件
-
登入 AWS Management Console,然後在 https://console.aws.amazon.com/emr
開啟 Amazon EMR主控台。 -
在左側導覽窗格中的 EMREC2下,選擇叢集 ,然後選擇叢集。
-
若要檢視所有事件,請選取叢集詳細資訊頁面上的事件索引標籤。