故障診斷 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷

重要

允許 Amazon SageMaker 工作室或 Amazon 工作 SageMaker 室經典版創建 Amazon SageMaker 資源的自定義 IAM 政策還必須授予許可才能向這些資源添加標籤。需要向資源添加標籤的權限,因為 Studio 和 Studio 經典版會自動標記它們創建的任何資源。如果 IAM 政策允許 Studio 和 Studio 經典版建立資源,但不允許標記,則在嘗試建立資源時可能會發生 AccessDenied "" 錯誤。如需詳細資訊,請參閱 提供標記 SageMaker資源的許可

AWS Amazon 的受管政策 SageMaker授予建立 SageMaker 資源的權限,已包含在建立這些資源時新增標籤的權限。

如果您在使用無伺服器推論時遇到問題,請參閱以下故障診斷提示。

容器映像

如果您用於無伺服器端點的容器與您在執行個體型端點上使用的容器相同,則您的容器可能沒有寫入檔案的許可。這種情況可能是由於下列原因而發生:

  • 您的無伺服器端點無法建立或更新,因為 ping 運作狀態檢查失敗。

  • 端點的 Amazon CloudWatch 日誌顯示容器由於許可錯誤而無法寫入某些檔案或目錄。

若要修正這個問題,您可以嘗試在檔案或目錄上新增 other 的讀取、寫入和執行許可,然後重建容器。您可以執行以下步驟,完成此程序:

  1. 在您用來建置容器的 Dockerfile 中,新增以下命令:RUN chmod o+rwX <file or directory name>

  2. 重建容器。

  3. 將新的容器映像上傳至 Amazon ECR。

  4. 嘗試再次建立或更新無伺服器端點。