在EKS垂直自動擴展EMR上對 Amazon 進行故障診斷 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在EKS垂直自動擴展EMR上對 Amazon 進行故障診斷

如果您在使用 Operator Lifecycle Manager 設定 Amazon EKS叢集EMR的EKS垂直自動擴展運算子時遇到問題,請參閱下列各節。如需詳細資訊,包括完成安裝的步驟,請參閱 搭配 Amazon EMR Spark 任務使用垂直自動擴展

「403 禁止」錯誤

如果您遵循 中的步驟在 Amazon EKS叢集上安裝 Operator Lifecycle Manager (OLM)、執行 olm status命令,並傳回如下的403 Forbidden錯誤,則可能尚未取得運算子的 Amazon ECR儲存庫身分驗證權杖。

若要解決此問題,請重複 在EKS垂直自動擴展運算子EMR上安裝 Amazon 中的步驟以取得字符。然後,請再次嘗試安裝。

Error: FATA[0002] Failed to run bundle: pull bundle image: error pulling image IMAGE. error resolving name : unexpected status code [manifests latest]: 403 Forbidden

找不到 Kubernetes 命名空間

當您在 Amazon 叢集上設定 Amazon EMR on EKS vertical Autoscaling 運算子時,您可能會收到如下所示的namespaces not found錯誤: EKS

FATA[0020] Failed to run bundle: create catalog: error creating catalog source: namespaces "NAME" not found.

如果您指定的命名空間不存在, OLM將不會安裝垂直自動擴展運算子。若要解決此問題,請使用以下命令來建立命名空間。然後,請再次嘗試安裝。

kubectl create namespace NAME

儲存 Docker 憑證時發生錯誤

若要設定垂直自動擴展 ,您必須在EKS垂直自動擴展相關的 Docker 映像EMR上驗證和擷取 Amazon。執行此操作時,如果 Docker 未執行,則可能會收到類似以下錯誤:

aws ecr get-login-password \ --region $REGION | docker login \ --username AWS \ --password-stdin $ACCOUNT_ID.dkr.ecr.$REGION.amazonaws.com Error saving credentials: error storing credentials - err: exit status 1 out: 'Post "http://ipc/registry/credstore-updated": dial unix backend.sock: connect: no such file or directory'

要解決此問題,請確認 Docker 正在執行或開啟 Docker Desktop。然後,嘗試再次儲存您的憑證。