故障排除 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

故障排除

重要

允许 Amazon SageMaker Studio 或 Amazon SageMaker Studio Classic 创建亚马逊 SageMaker资源的自定义 IAM 策略还必须授予向这些资源添加标签的权限。需要向资源添加标签的权限,因为 Studio 和 Studio Classic 会自动标记他们创建的任何资源。如果 IAM 策略允许 Studio 和 Studio Classic 创建资源但不允许标记,则在尝试创建资源时可能会出现 AccessDenied “” 错误。有关更多信息,请参阅 提供标记 SageMaker资源的权限

AWS Amazon 托管政策 SageMaker授予创建 SageMaker 资源的权限已经包括在创建这些资源时添加标签的权限。

如果您在使用无服务器推理时遇到问题,请参考以下问题排查技巧。

容器问题

如果您用于无服务器端点的容器与用于基于实例的端点的容器相同,那么您的容器可能没有写入文件的权限。出现这种情况的原因如下:

  • 由于 ping 运行状况检查失败,无服务器端点无法创建或更新。

  • 终端节点的 Amazon CloudWatch 日志显示,由于权限错误,容器无法写入某个文件或目录。

要修复此问题,您可以尝试为 other 添加对文件或目录的读取、写入和执行权限,然后重建容器。您可以执行以下步骤来完成此过程:

  1. 在用于构建容器的 Dockerfile 中,添加以下命令:RUN chmod o+rwX <file or directory name>

  2. 重建容器。

  3. 将新容器映像上传到 Amazon ECR。

  4. 尝试再次创建或更新无服务器端点。