

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 更新 SageMaker HyperPod 平台软件
<a name="sagemaker-hyperpod-eks-operate-cli-command-update-cluster-software"></a>

创建 SageMaker HyperPod 集群时， SageMaker HyperPod 选择与您的 Amazon EKS 集群的 Kubernetes 版本相对应的亚马逊系统映像 (AMI)。

运行[update-cluster-software](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-cluster-software.html)以使用 SageMaker HyperPod 服务提供的软件和安全补丁更新现有集群。对于 `--cluster-name`，请指定要更新的集群名称或 ARN。

**重要**  
调用此 API 时， SageMaker HyperPod 不会耗尽或重新分配节点上运行的作业 (Pod)。在调用此 API 之前，请确保检查节点上是否有正在运行的作业。
打补丁过程会用更新的 AMI 替换根卷，这意味着存储在实例根卷中的先前数据将丢失。请务必将实例根卷中的数据备份到 Amazon S3 或 Amazon for Lustre。 FSx 
在修补过程中，所有集群节点都会停机（节点在 `<NotReady>` 的输出中显示为 `kubectl get node`）。我们建议您在打补丁前终止所有工作负载，并在补丁完成后恢复它们。  
如果安全补丁失败，您可以按照 [描述集群](sagemaker-hyperpod-eks-operate-cli-command-cluster-details.md#sagemaker-hyperpod-eks-operate-cli-command-describe-cluster) 中的指示运行 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeCluster.html) API，获取失败信息。API。

```
aws sagemaker update-cluster-software --cluster-name your-hyperpod-cluster
```

**使用灵活的实例组进行滚动升级**  
对于用于多个实例类型的实例组，滚动升级会按比例将每个实例类型分配到各个批次。`InstanceRequirements`例如，如果一个实例组有 100 个实例（10 个 P5 和 90 G6），并且您配置的批处理大小为 10%，则每个批次包含 1 个 P5 实例和 9 个 G6 实例。

 调用 `UpdateClusterSoftware` API 时，[SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami)根据您的 Amazon EKS 集群的 Kubernetes 版本选择最新版本来 SageMaker HyperPod 更新节点的 Kubernetes 版本。然后，它会在创建或更新集群时指定的 Amazon S3 存储桶中运行生命周期脚本。

您可以运行 `kubectl describe node` 命令可验证节点的 kubelet 版本。

当您更新 Amazon EKS SageMaker HyperPod 集群版本时，集群节点的 Kubernetes 版本不会自动更新。更新 Amazon EKS 集群的 Kubernetes 版本后，必须使用 `UpdateClusterSoftware` API 将集 SageMaker HyperPod 群节点更新到相同的 Kubernetes 版本。

 建议在更新 Amazon EKS 节点后更新 SageMaker HyperPod 集群，并避免在 Amazon EKS 集群版本和集 SageMaker HyperPod 群节点版本之间存在多个版本差异。

 SageMaker HyperPod 服务团队定期推出新[SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami)产品，以增强安全性和改善用户体验。我们建议您随时更新到最新的 SageMaker HyperPod DLAMI。如需了解 SageMaker HyperPod Future DLAMI 的安全补丁更新，请跟进。[亚马逊 SageMaker HyperPod 发行说明](sagemaker-hyperpod-release-notes.md)

**注意**  
您只能以编程方式运行此 API。 SageMaker HyperPod 控制台 UI 中未实现修补功能。