故障排除 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

故障排除

重要

截至 2023 年 11 月 30 日,之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用更新后的 Studio 体验。有关使用 Studio Classic 应用程序的信息,请参阅 亚马逊 SageMaker Studio 经典版

重要

允许 Amazon SageMaker Studio 或 Amazon SageMaker Studio Classic 创建亚马逊 SageMaker资源的自定义 IAM 策略还必须授予向这些资源添加标签的权限。之所以需要为资源添加标签的权限,是因为 Studio 和 Studio Classic 会自动为创建的任何资源添加标签。如果 IAM 策略允许 Studio 和 Studio Classic 创建资源但不允许标记,则在尝试创建资源时可能会出现 AccessDenied “” 错误。有关更多信息,请参阅 提供标记 A SageMaker I 资源的权限

AWS 亚马逊 A SageMaker I 的托管策略授予创建 SageMaker 资源的权限已经包括在创建这些资源时添加标签的权限。

本节介绍如何解决 Amazon SageMaker Studio 中的常见问题。

无法删除基于 Code-OSS、Visual Studio Code-开源代码或应用程序的代码编辑器 JupyterLab

当用户从 Amazon SageMaker Studio 创建仅在 Studio 中可用的应用程序,然后将其默认体验恢复为 Studio Classic 体验时,就会出现此问题。因此,根据 Code-OSS、Visual Studio Code-开源,或者 JupyterLab 因为他们无法访问 Studio 用户界面,用户无法删除代码编辑器的应用程序。

要解决此问题,请通知您的管理员,以便他们可以使用 AWS Command Line Interface (AWS CLI) 手动删除应用程序。

EC2InsufficientCapacityError

当您尝试运行空间但当前 AWS 没有足够的按需容量来满足您的请求时,就会出现此问题。

要解决此问题,请完成以下操作。

  • 等待几分钟,然后重新提交请求。容量会经常变化。

  • 使用其他实例大小或类型运行空间。

注意

不同的可用区可提供不同的容量。为了最大限度地提高用户的可用容量,我们建议在所有可用区内设置子网。Studio 会重试域的所有可用区。

不同区域的实例类型可用性不同。有关每个区域支持的实例类型的列表,请参阅 Amazon A SageMaker I 定价

下表列出了实例系列及其推荐的替代方案。

实例系列 CPU 类型 v CPUs 内存(GiB) GPU 类型 GPUs GPU 内存 (GiB) 建议的替代方案
G4dn 第二代英特尔至强可扩展处理器 4 到 96 16 到 384 英伟达 T4 Tensor Core 1 至 8 每个 GPU 16 G6
G5 第二代 AMD EPYC 处理器 4 到 192 16 到 768 NVIDIA A10G Tensor 内核 1 至 8 每个 GPU 24 G6e
G6 第三代 AMD EPYC 处理器 4 到 192 16 到 768 英伟达 L4 Tensor Core 1 至 8 每个 GPU 24 G4dn
G6e 第三代 AMD EPYC 处理器 4 到 192 32 到 1536 NVIDIA L40S 张量核心 1 至 8 每个 GPU 48 G5,P4
P3 英特尔至强可扩展处理器 8 到 96 61 到 768 英伟达特斯拉 V100 1 至 8 每个 GPU 16 个(p3dn 每个 GPU 32 个) G6e、P4
P4 第二代英特尔至强可扩展处理器 96 1152 英伟达 A100 Tensor Core 8 320(p4de 为 640) G6e
P5 第三代 AMD EPYC 处理器 192 2000 英伟达 H100 Tensor Core 8 640 P4de

限制不足(需要增加配额)

如果在运行空间时出现以下错误,就会出现此问题。此错误表示您已达到在一个区域内可启动的此类型实例的数量限制。在您创建 AWS 账户时,我们会对您可以在每个地区运行的实例数量设置默认限制。

Error when creating application for space: ... : The account-level service limit is X Apps, with current utilization Y Apps and a request delta of 1 Apps. Please use Service Quotas to request an increase for this quota.

要解决此问题,请申请提高您要启动空间的区域的实例限制。有关更多信息,请参阅 Requesting a quota increase(请求增加限额)。