使用 監控 Amazon EMR事件 CloudWatch - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 監控 Amazon EMR事件 CloudWatch

Amazon 會在 Amazon EMR主控台中EMR追蹤事件並保留相關資訊最多七天。當叢集、執行個體群組、執行個體機群、自動擴展政策或步驟的狀態變更時,Amazon 會EMR記錄事件。事件會擷取事件發生的日期和時間、受影響元素的詳細資料,以及其他重要資料點。

下表列出 Amazon EMR事件,以及事件指示的狀態或狀態變更、事件的嚴重性、事件類型、事件代碼和事件訊息。Amazon EMR將事件表示為JSON物件,並自動將其傳送至事件串流。當您使用 CloudWatch Events 設定事件處理規則時,JSON物件很重要,因為規則會嘗試比對JSON物件中的模式。如需詳細資訊,請參閱 Amazon Events 使用者指南 EMR 中的事件和事件模式和 Amazon 事件。 CloudWatch

注意

我們會不斷完善錯誤訊息,以便您收到最相關的資訊。因此,建議您不要剖析訊息中的文字來啟動工作流程中的下一個動作。

叢集啟動事件

狀態或狀態變更 嚴重性 事件類型 事件代碼 訊息
CREATING WARN EMR 執行個體機群佈建 EC2 佈建 - 執行個體容量不足 我們無法ClusterId (ClusterName)為執行個體機群 Amazon 建立您的 Amazon InstanceFleetID EMR叢集EC2,在可用區域 [Instancetype3, Instancetype4]中,執行個體類型的 Spot 容量不足[Instancetype1, Instancetype2],執行個體類型的隨需容量不足[AvailabilityZone1, AvaliabilityZone2]。如需有關如何回應此事件的詳細資訊,請參閱這裡的文件
CREATING WARN EMR 執行個體群組佈建 EC2 佈建 - 執行個體容量不足 我們無法ClusterId (ClusterName)在可用區域 [Instancetype3, Instancetype4]中為執行個體群組 Amazon 建立您的 Amazon InstanceGroupID EMR叢集EC2,但 Spot 容量不足以用於執行個體類型[Instancetype1, Instancetype2],且隨需容量不足以用於執行個體類型[AvailabilityZone1, AvaliabilityZone2]。如需有關如何回應此事件的詳細資訊,請參閱這裡的文件
CREATING WARN EMR 執行個體機群佈建 EC2 佈建 - 子網路中的可用地址不足 我們無法建立ClusterId (ClusterName)您為執行個體機群請求的 Amazon EMR叢集,InstanceFleetID因為指定的子網路[Subnet1, Subnet2]不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets操作來查看子網路中有多少 IP 地址可用 (未使用)。如需有關如何回應此事件的資訊,請參閱 Amazon 的錯誤碼 EC2 API
CREATING WARN EMR 執行個體群組佈建 EC2 佈建 - 子網路中的可用地址不足 我們無法建立ClusterId (ClusterName)您為執行個體群組請求的 Amazon EMR叢集,InstanceGroupID因為指定的子網路[Subnet1, Subnet2]不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets操作來查看子網路中有多少 IP 地址可用 (未使用)。如需有關如何回應此事件的資訊,請參閱 Amazon 的錯誤碼 EC2 API
CREATING WARN

EMR 執行個體機群佈建

EC2 佈建 – 超過 vCPU 限制

Amazon EMR叢集InstanceFleetID中的 佈建ClusterId (ClusterName)會延遲,因為您已達到指派給 中執行執行個體的 vCPUs (虛擬處理單位) 數量限制account (accountId)。如需詳細資訊,Amazon 的錯誤碼 EC2 API
CREATING WARN

EMR 執行個體群組佈建

EC2 佈建 – 超過 vCPU 限制

Amazon EMR叢集InstanceGroupID中執行個體群組的佈建ClusterId會延遲,因為您已達到指派給帳戶 中執行中執行個體的 vCPUs (虛擬處理單位) 數量限制(accountId)。如需詳細資訊,Amazon 的錯誤碼 EC2 API
CREATING WARN

EMR 執行個體機群佈建

EC2 佈建 – 已超過 Spot 執行個體計數限制

Amazon EMR叢集InstanceFleetID中執行個體機群的佈建ClusterID (ClusterName)延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId)。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API
CREATING WARN

EMR 執行個體群組佈建

EC2 佈建 – 已超過 Spot 執行個體計數限制

Amazon EMR叢集InstanceGroupID中執行個體群組的佈建ClusterID (ClusterName)會延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId)。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API
CREATING WARN

EMR 執行個體機群佈建

EC2 佈建 – 超過執行個體限制

Amazon EMR叢集InstanceFleetID中執行個體機群的佈建ClusterId (ClusterName)會延遲,因為您已達到在 中可同時執行的執行個體數量限制account (accountID)。如需 Amazon EC2服務限制的詳細資訊,請參閱 Amazon EC2 的錯誤碼API
CREATING WARN

EMR 執行個體群組佈建

EC2 佈建 – 超過執行個體限制

Amazon EMR叢集InstanceGroupID中執行個體群組的佈建ClusterId (ClusterName)會延遲,因為您已達到可在 中同時執行的執行個體數量限制account (accountID)。如需 Amazon EC2服務限制的詳細資訊,請參閱 Amazon EC2 的錯誤碼API
CREATING WARN

EMR 執行個體群組佈建

Amazon EMR叢集ClusterId (ClusterName)建立於 Time,並可供使用。

- 或 -

Amazon EMR叢集ClusterId (ClusterName)已於 完成執行所有待處理步驟Time

注意

處於 WAITING 狀態的叢集可能仍在處理作業。

STARTING INFO

EMR 叢集狀態變更

Amazon EMR叢集ClusterId (ClusterName)已在 請求,Time正在建立。

STARTING INFO

EMR 叢集狀態變更

注意

僅適用於在 Amazon 中選取執行個體機群組態和多個可用區域的叢集EC2。

Amazon EMR叢集ClusterId (ClusterName)是在區域 (AvailabilityZoneID) 中建立,該區域是從指定的可用區域選項中選擇的。

STARTING INFO

EMR 叢集狀態變更

Amazon EMR叢集ClusterId (ClusterName)開始在 執行步驟Time

WAITING INFO

EMR 叢集狀態變更

Amazon EMR叢集ClusterId (ClusterName)建立於 Time,並可供使用。

- 或 -

Amazon EMR叢集ClusterId (ClusterName)已於 完成執行所有待處理步驟Time

注意

處於 WAITING 狀態的叢集可能仍在處理作業。

注意

當您的EMR叢集在叢集建立或調整大小操作期間遇到執行個體機群或執行個體群組EC2的容量不足錯誤時,具有事件代碼的事件會EC2 provisioning - Insufficient Instance Capacity定期發出。如需有關如何回應這些事件的詳細資訊,請參閱 回應 Amazon EMR叢集的執行個體容量不足事件

叢集終止事件

狀態或狀態變更 嚴重性 事件類型 事件代碼 訊息
TERMINATED

嚴重程度依狀態更改原因而定,如下所示:

  • CRITICAL 若該叢集因以下任何狀態變更原因而終止:INTERNAL_ERRORVALIDATION_ERRORINSTANCE_FAILUREBOOTSTRAP_FAILURESTEP_FAILURE

  • INFO 若該叢集因以下任何狀態變更原因而終止:USER_REQUESTALL_STEPS_COMPLETED

EMR 叢集狀態變更

Amazon EMR Cluster ClusterId (ClusterName) 已於 終止Time,原因為 StateChangeReason:Code

TERMINATED_WITH_ERRORS CRITICAL

EMR 叢集狀態變更

Amazon EMR Cluster ClusterId (ClusterName) 已在 終止,但發生錯誤Time,原因為 StateChangeReason:Code

TERMINATED_WITH_ERRORS CRITICAL

EMR 叢集狀態變更

Amazon EMR Cluster ClusterId (ClusterName) 已在 終止,但發生錯誤Time,原因為 StateChangeReason:Code

執行個體機群狀態變更事件

注意

執行個體機群組態僅適用於 Amazon 4.8.0 版及更新EMR版本,不包括 5.0.0 和 5.0.3。

狀態或狀態變更 嚴重性 事件類型 事件代碼 訊息

PROVISIONINGWAITING

INFO

Amazon EMR叢集InstanceFleetID中執行個體機群的佈建ClusterId (ClusterName)已完成。佈建開始於 Time 並花費了 Num 分鐘。執行個體機群現在擁有 Num 的隨需容量和 Num 的 Spot 容量。目標隨需容量為 Num,而目標 Spot 容量為 Num

WAITINGRESIZING

INFO

Amazon EMR叢集InstanceFleetID中執行個體機群的大小調整從 ClusterId (ClusterName)開始Time。執行個體機群正在從隨需容量 Num 調整到目標 Num,從 Spot 容量 Num 調整到目標 Num

RESIZINGWAITING

INFO

Amazon EMR叢集InstanceFleetID中執行個體機群的大小調整操作ClusterId (ClusterName)已完成。規模調整於 Time 開始並花費 Num 分鐘。執行個體機群現在擁有 Num 的隨需容量和 Num 的 Spot 容量。目標隨需容量為 Num,而目標 Spot 容量為 Num

RESIZINGWAITING

INFO

Amazon EMR叢集InstanceFleetID中執行個體機群的大小調整操作ClusterId (ClusterName)已逾時並停止。規模調整於 Time 開始並於 Num 分鐘後停止。執行個體機群現在擁有 Num 的隨需容量和 Num 的 Spot 容量。目標隨需容量為 Num,而目標 Spot 容量為 Num

SUSPENDED ERROR

Amazon EMR叢集InstanceFleetID中的執行個體機群ClusterId (ClusterName)Time下列原因而在 停止:ReasonDesc

RESIZING WARNING

Amazon EMR叢集InstanceFleetID中執行個體機群的大小調整操作ClusterId (ClusterName)因下列原因而卡住:ReasonDesc

WAITINGRunning

INFO

當 Amazon 在可用區域中EMR新增 Spot 容量時,Amazon EMR叢集InstanceFleetID中執行個體機群的調整大小操作ClusterId (ClusterName)無法完成AvailabilityZone。我們已取消佈建額外 Spot 容量的請求。如需建議的動作,請檢查 Amazon EMR叢集的可用區域彈性 並再試一次。

WAITINGRunning

INFO

Amazon EMR叢集InstanceFleetID中執行個體機群的大小調整操作ClusterId (ClusterName)是由 Entity 於 啟動Time

執行個體機群規模調整事件

事件類型 嚴重性 事件代碼 訊息

EMR 執行個體機群調整大小

ERROR

Spot 佈建逾時

在 AZ 中取得 Spot 容量時,Amazon EMR叢集InstanceFleetID中執行個體機群的調整大小操作ClusterId (ClusterName)無法完成AvailabilityZone。我們現在已取消您的請求,並停止嘗試佈建任何額外的 Spot 容量,並且執行個體機群已佈建 num 的 Spot 容量。目標 Spot 容量為 num。如需詳細資訊和建議的動作,請檢查此處的文件頁面,然後再試一次。

EMR 執行個體機群調整大小

ERROR

隨選佈建逾時

在 AZ 中取得隨需容量時,ClusterId (ClusterName)無法完成 Amazon EMR叢集InstanceFleetID中執行個體機群的大小調整操作AvailabilityZone。我們現在已取消您的請求,並停止嘗試佈建任何額外的隨需容量,並且執行個體機群已佈建 num 的隨需容量。目標隨需容量為 num。如需詳細資訊和建議的動作,請檢查此處的文件頁面,然後再試一次。

EMR 執行個體機群調整大小

WARNING EC2 佈建 - 執行個體容量不足

我們無法完成EMR叢集InstanceFleetID中執行個體機群的調整大小操作,ClusterId (ClusterName)因為 Amazon EC2 的 Spot 容量不足,[Instancetype1, Instancetype2]且可用區域 [Instancetype3, Instancetype4]中的執行個體類型隨需容量不足[AvailabilityZone1]。到目前為止,執行個體機群已佈建 num 的隨需容量,且目標隨需容為 num。已佈建的 Spot 容量為 num,且目標 Spot 容量為 num。如需有關如何回應此事件的詳細資訊,請參閱這裡的文件

EMR 執行個體機群調整大小

WARNING

Spot 佈建逾時 - 繼續調整大小

我們仍在為執行個體機群調整大小操作佈建 Spot 容量,這些操作會在 為 Amazon EMR叢集InstanceFleetID中的time執行個體機群 ID 在 AZ ClusterId (ClusterName)[Instancetype1, Instancetype2]中啟動AvailabilityZone。對於先前在 啟動的調整大小操作time,逾時期間已過期,因此 Amazon 在將請求numnum執行個體新增至執行個體機群後EMR停止佈建 Spot 容量。如需詳細資訊,請查看此處的文件頁面。

EMR 執行個體機群調整大小

WARNING

隨選佈建逾時 - 繼續調整大小

我們仍在為執行個體機群調整大小操作佈建隨需容量,這些操作在 Amazon EMR叢集[Instancetype1, Instancetype2]ClusterId (ClusterName)為 啟動time,例如 Amazon 叢集InstanceFleetID中的機群 IDAvailabilityZone。對於先前在 啟動的調整大小操作time,逾時期間已過期,因此 Amazon 在將請求numnum執行個體新增至執行個體機群後EMR停止佈建隨需容量。如需詳細資訊,請查看此處的文件頁面。

EMR 執行個體機群調整大小

WARNING

EC2 佈建 - 子網路中的可用地址不足

我們無法完成 Amazon EMR叢集InstanceFleetID中執行個體機群的調整大小操作,ClusterId (ClusterName)因為指定的子網路 【Subnet1、Subnet2】 不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets操作來檢視子網路中有多少可用 (未使用的) IP 地址。如需如何回應此事件的資訊,請參閱 Amazon EC2 的錯誤碼API

EMR 執行個體機群調整大小

WARNING

EC2 佈建 - 超過 vCPU 限制

Amazon EMR叢集InstanceFleetID中執行個體機群的調整大小ClusterName會延遲,因為您已達到指派給 中執行執行個體的 vCPUs (虛擬處理單位) 數量限制account (accountId)。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API

EMR 執行個體機群調整大小

WARNING

EC2 佈建 - 已超過 Spot 執行個體計數限制

Amazon EMR叢集InstanceFleetID中執行個體機群的佈建ClusterID (ClusterName)會延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId)。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API

EMR 執行個體機群調整大小

WARNING

EC2 佈建 - 超過執行個體限制

Amazon EMR叢集InstanceFleetID中執行個體機群的佈建ClusterID (ClusterName)會延遲,因為您已達到可在 中執行的隨需執行個體數量限制account (accountId)。如需 Amazon 錯誤碼的詳細資訊EC2API
注意

佈建逾時事件會在逾時到期後,Amazon EMR停止為機群佈建 Spot 或隨需容量時發出。如需有關如何回應這些事件的詳細資訊,請參閱 回應 Amazon EMR叢集執行個體機群調整逾時事件的大小

執行個體群組事件

事件類型 嚴重性 事件代碼 訊息

RESIZINGRunning

INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的大小調整操作ClusterId (ClusterName)已完成。它現在有 Num 個執行個體。規模調整於 Time 開始並花費 Num 分鐘完成。

RUNNINGRESIZING

INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的大小調整從 ClusterId (ClusterName)開始Time。將執行個體計數從 Num 調整為 Num

SUSPENDED ERROR

Amazon EMR叢集InstanceGroupID中的執行個體群組ClusterId (ClusterName)Time下列原因而在 停止:ReasonDesc

RESIZING WARNING

Amazon EMR叢集InstanceGroupID中執行個體群組的大小調整操作ClusterId (ClusterName)因下列原因而卡住:ReasonDesc

EMR 執行個體群組調整大小

WARNING EC2 佈建 - 執行個體容量不足

我們無法完成EMR在叢集InstanceGroupID中執行個體群組從 開始time的調整大小操作,ClusterId (ClusterName)因為 Amazon 在可用區域 [Instancetype]中EC2沒有足夠的執行個體類型的Spot/On Demand容量[AvailabilityZone1]。到目前為止,執行個體群組的執行中執行個體計數為 num,請求的執行個體計數為 num。如需有關如何回應此事件的詳細資訊,請參閱這裡的文件

EMR 執行個體群組調整大小

WARNING

EC2 佈建 - 子網路中的可用地址不足

我們無法完成 Amazon EMR叢集InstanceGroupID中執行個體群組的調整大小操作,ClusterId (ClusterName)因為指定的子網路 【Subnet1、Subnet2】 不包含足夠的可用私有 IP 地址,無法滿足您的請求。使用 DescribeSubnets操作來檢視子網路中有多少可用 (未使用的) IP 地址。如需如何回應此事件的資訊,請參閱 Amazon EC2 的錯誤碼API

EMR 執行個體群組調整大小

WARNING

EC2 佈建 - 超過 vCPU 限制

Amazon EMR叢集InstanceGroupID中執行個體群組的調整大小ClusterName會延遲,因為您已達到指派給 中執行中執行個體的 vCPUs (虛擬處理單位) 數量限制account (accountId)。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API

EMR 執行個體群組調整大小

WARNING

EC2 佈建 - 已超過 Spot 執行個體計數限制

Amazon EMR叢集InstanceGroupID中執行個體群組的佈建ClusterID (ClusterName)會延遲,因為您已達到可在 中啟動的 Spot 執行個體數量限制account (accountId)。如需詳細資訊,請參閱 Amazon EC2 的錯誤碼API

EMR 執行個體群組調整大小

WARNING

EC2 佈建 - 超過執行個體限制

Amazon EMR叢集InstanceGroupID中執行個體群組的佈建ClusterID (ClusterName)會延遲,因為您已達到可在 中執行的隨需執行個體數量限制account (accountId)。如需 Amazon 錯誤碼的詳細資訊EC2API

RUNNINGRESIZING

INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的調整大小ClusterId (ClusterName)是由 Entity 於 起始Time

注意

使用 Amazon 5.21.0 版及更新EMR版本,您可以覆寫叢集組態,並為執行中的叢集中的每個執行個體群組指定其他組態分類。您可以使用 Amazon EMR主控台、 AWS Command Line Interface (AWS CLI) 或 來執行此操作 AWS SDK。如需詳細資訊,請參閱為執行中叢集的執行個體群組提供組態

下表列出重新組態操作的 Amazon EMR事件,以及事件指示的狀態或狀態變更、事件的嚴重性和事件訊息。

狀態或狀態變更 嚴重性 訊息
RUNNING INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的重新設定是由使用者在 ClusterId (ClusterName)啟動Time。請求的組態版本為 Num

RECONFIGURINGRunning

INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的重新組態操作ClusterId (ClusterName)已完成。重新設定於 Time 開始並花費 Num 分鐘完成。目前的組態版本為 Num

RUNNINGRECONFIGURING

in
INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的重新組態從 ClusterId (ClusterName)開始Time。將版本編號 Num 設定為版本編號 Num

RESIZING INFO

Amazon EMR叢集InstanceGroupID中執行個體群組Num的組態版本重新設定操作ClusterId (ClusterName)會在 暫時遭到封鎖,Time因為執行個體群組位於 中State

RECONFIGURING INFO Amazon EMR叢集InstanceGroupID中執行個體Num群組的執行個體計數大小調整操作ClusterId (ClusterName)在 會暫時遭到封鎖,Time因為執行個體群組位於 中State
RECONFIGURING WARNING

Amazon EMR叢集InstanceGroupID中執行個體群組的重新組態操作ClusterId (ClusterName)在 失敗Time,且需要Num幾分鐘的時間才能失敗。失敗的組態版本為 Num

RECONFIGURING INFO

組態正在還原至 Amazon ClusterId (ClusterName) EMR叢集InstanceGroupID中執行個體群組Num的先前成功版本編號Time。新的組態版本為 Num

RECONFIGURINGRunning

INFO

在 Amazon ClusterId (ClusterName) EMR叢集InstanceGroupIDNum,組態已成功還原至執行個體群組的先前成功版本Time。新的組態版本為 Num

RECONFIGURINGSUSPENDED

CRITICAL

無法在 Amazon ClusterId (ClusterName) EMR叢集InstanceGroupID中還原至執行個體群組Num的先前成功版本Time

自動擴展政策事件

狀態或狀態變更 嚴重性 訊息
PENDING INFO

Auto Scaling 政策已新增至 ClusterId (ClusterName) Amazon EMR叢集InstanceGroupID中的執行個體群組Time。該政策正在等待附件。

- 或 -

Amazon EMR叢集InstanceGroupID中執行個體群組的 Auto Scaling 政策ClusterId (ClusterName)已更新於 Time。該政策正在等待附件。

ATTACHED INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的 Auto Scaling 政策ClusterId (ClusterName)已連接至 Time

DETACHED

INFO

Amazon EMR叢集InstanceGroupID中執行個體群組的 Auto Scaling 政策ClusterId (ClusterName)在 分離Time

FAILED ERROR

Amazon EMR叢集InstanceGroupID中執行個體群組的 Auto Scaling 政策ClusterId (ClusterName)無法在 連接並失敗Time

- 或 -

Amazon EMR叢集InstanceGroupID中執行個體群組的 Auto Scaling 政策ClusterId (ClusterName)無法在 分離和失敗Time

步驟事件

狀態或狀態變更 嚴重性 訊息
PENDING INFO

步驟 StepID (StepName)已新增至ClusterId (ClusterName)位於 的 Amazon EMR叢集,Time且正在等待執行。

CANCEL_PENDING WARN

Amazon EMR叢集StepID (StepName)中的步驟ClusterId (ClusterName)已於 取消,Time且正在等待取消。

RUNNING INFO

Amazon EMR叢集StepID (StepName)中的步驟ClusterId (ClusterName)開始在 執行Time

COMPLETED INFO

Amazon EMR叢集StepID (StepName)中的步驟ClusterId (ClusterName)已於 完成執行Time。步驟於 Time 開始執行並花費 Num 分鐘完成。

CANCELLED WARN

Amazon 叢集StepID (StepName)中EMR叢集步驟的取消請求已成功ClusterId (ClusterName)Time現在已取消該步驟。

FAILED ERROR

Amazon EMR叢集StepID (StepName)中的步驟ClusterId (ClusterName)在 失敗Time

運作狀態不佳的節點替換事件

事件類型 嚴重性 事件代碼 訊息

Amazon 運作EMR狀態不佳節點替換

INFO

偵測到運作狀態不佳的核心節點

Amazon EMR已識別 Amazon EMR叢集[instanceID (InstanceName)]InstanceGroup/Fleet中 的核心執行個體clusterID (ClusterName)UNHEALTHY。Amazon EMR會嘗試復原或正常取代UNHEALTHY執行個體。

Amazon 運作EMR狀態不佳節點替換

INFO

核心節點運作狀態不佳 - 停用取代

Amazon EMR已識別 Amazon EMR叢集[instanceID (InstanceName)]InstanceGroup/Fleet中 的核心執行個體(clusterID) (ClusterName)UNHEALTHY。開啟叢集中運作狀態不佳的正常核心節點取代,讓 Amazon 在無法復原執行個體時,可EMR正常取代UNHEALTHY執行個體。

Amazon 運作EMR狀態不佳節點替換

WARN

未取代運作狀態不佳的核心節點

clusterID (ClusterName) 由於 的原因,Amazon EMR 無法在 Amazon EMR叢集[instanceID (InstanceName)]InstanceGroup/Fleet中取代您的UNHEALTHY核心執行個體。

注意

Amazon EMR無法取代核心節點的原因會因您的案例而有所不同。例如,Amazon EMR無法刪除節點的一個原因,是因為叢集不會有任何剩餘的核心節點。

Amazon 運作EMR狀態不佳節點替換

INFO

復原運作狀態不佳的核心節點

Amazon EMR已復原 Amazon EMR叢集[instanceID (InstanceName)]InstanceGroup/FleetUNHEALTHY的核心執行個體 clusterID (ClusterName)

如需不正常節點取代的詳細資訊,請參閱取代運作狀態不佳節點

使用 Amazon EMR主控台檢視事件

對於每個叢集,您可以在詳細資訊窗格中查看簡單的事件清單,該清單以遞減順序列出出現的事件。您也可以以遞減順序檢視區域中全部叢集所出現的所有事件。

如果您不希望使用者查看區域的所有叢集事件,請為 "Effect": "Deny" 動作新增拒絕許可 (elasticmapreduce:ViewEventsFromAllClustersInConsole) 描述到連接至使用者的政策。

使用主控台檢視區域中所有叢集的事件
  1. 登入 AWS Management Console,然後在 https://console.aws.amazon.com/emr 開啟 Amazon EMR主控台。

  2. 在左側導覽窗格中的 EMR下EC2,選擇事件

使用主控台檢視特定叢集的事件
  1. 登入 AWS Management Console,然後在 https://console.aws.amazon.com/emr 開啟 Amazon EMR主控台。

  2. 在左側導覽窗格中的 EMREC2下,選擇叢集 ,然後選擇叢集。

  3. 若要檢視所有事件,請選取叢集詳細資訊頁面上的事件索引標籤。