

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Instalar pacotes no cluster do Amazon EKS usando o Helm
<a name="sagemaker-hyperpod-eks-install-packages-using-helm-chart"></a>

Antes de criar um SageMaker HyperPod cluster e anexá-lo a um cluster Amazon EKS, você deve instalar pacotes usando o [Helm](https://helm.sh/), um gerenciador de pacotes para Kubernetes. O Helm é uma ferramenta de código aberto para configurar um processo de instalação para clusters Kubernetes. Ele permite a automação e a simplificação das instalações de dependências e simplifica várias configurações necessárias para preparar o cluster Amazon EKS como orquestrador (plano de controle) de um cluster. SageMaker HyperPod 

A equipe SageMaker HyperPod de serviço fornece um pacote de gráficos do Helm, que agrupa as principais dependências, como device/EFA plug-ins, plug-ins, [Kubeflow Training](https://www.kubeflow.org/docs/components/training/) Operator e configurações de permissão associadas.

**Importante**  
Essa etapa de instalação do Helm é obrigatória. Se você configurar o cluster do Amazon EKS usando o [Console de gerenciamento da AWS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md)ou o [CloudFormation](smcluster-getting-started-eks-console-create-cluster-cfn.md), pode ignorar essa etapa porque a instalação é feita automaticamente durante o processo de configuração. Se você configurar o cluster diretamente usando o APIs, use o gráfico Helm fornecido para configurar seu cluster Amazon EKS. A falha na configuração do seu cluster Amazon EKS usando o gráfico Helm fornecido pode fazer com que o SageMaker HyperPod cluster não funcione corretamente ou que o processo de criação falhe totalmente. O nome do namespace da `aws-hyperpod` não pode ser modificado.

1. [Instale o Helm](https://helm.sh/docs/intro/install/) na máquina local.

1. Faça o download dos gráficos do Helm fornecidos por, SageMaker HyperPod localizados `helm_chart/HyperPodHelmChart` no repositório [SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).

   ```
   git clone https://github.com/aws/sagemaker-hyperpod-cli.git
   cd sagemaker-hyperpod-cli/helm_chart
   ```

1. Atualize as dependências do chart do helm, visualize as alterações que serão feitas no seu cluster Kubernetes e instale o chart do helm.

   ```
   helm dependencies update HyperPodHelmChart
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system --dry-run
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system
   ```

Em resumo, a instalação do Helm configura vários componentes para seu cluster Amazon EKS, incluindo agendamento e enfileiramento de trabalhos (Kueue), gerenciamento de armazenamento, integração e Kubeflow. MLflow Além disso, os gráficos instalam os seguintes componentes para integração com os recursos de resiliência do SageMaker HyperPod cluster, que são componentes necessários.
+ **Agente de monitoramento de saúde** — Isso instala o agente de monitoramento de saúde fornecido por. SageMaker HyperPod Isso é necessário se você quiser que seu HyperPod cluster seja monitorado. Os agentes de monitoramento de integridade são fornecidos como imagens do Docker da seguinte forma: Conforme fornecido `values.yaml` nos charts do helm, a imagem é predefinida. O agente oferece suporte a instâncias e Trainium-accelerator-based instâncias baseadas em GPU (`trn1`,`trn1n`,`inf2`). Ele é instalado no namespace `aws-hyperpod`. Para encontrar seu URI compatível, consulte [Regiões suportadas e seu ECR URIs no sagemaker-hyperpod-cli repositório](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/readme.md#6-notes) em. GitHub
+ **Verificação profunda de integridade** — Isso configura a`ClusterRole`, a ServiceAccount (`deep-health-check-service-account`) no `aws-hyperpod` namespace e a `ClusterRoleBinding` para ativar o recurso de verificação SageMaker HyperPod profunda de integridade. Para obter mais informações sobre o arquivo RBAC do Kubernetes para verificação profunda da integridade, consulte o arquivo de configuração no [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml)repositório da CLI. SageMaker HyperPod GitHub 
+ **`job-auto-restart`**- Isso configura a`ClusterRole`, a ServiceAccount (`job-auto-restart`) no `aws-hyperpod` namespace e a`ClusterRoleBinding`, para ativar o recurso de reinicialização automática para trabalhos de PyTorch treinamento em. SageMaker HyperPod Para obter mais informações sobre o arquivo RBAC do Kubernetes para`job-auto-restart`, consulte o arquivo de configuração no [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml)repositório CLI. SageMaker HyperPod GitHub 
+ **Operador de MPI do Kubeflow**: o [operador de MPI](https://github.com/kubeflow/mpi-operator) é um operador do Kubernetes que simplifica a execução de workloads distribuídas de machine Learning (ML) e computação de alta performance (HPC) usando a interface de transmissão de mensagens (MPI) em clusters do Kubernetes. Ele instala o MPI Operator v0.5. Ele é instalado no namespace `mpi-operator`.
+ **`nvidia-device-plugin`**— Este é um plug-in de dispositivo Kubernetes que permite que você exponha automaticamente a NVIDIA para consumo GPUs por contêineres em seu cluster Amazon EKS. Ele permite que o Kubernetes aloque e forneça acesso ao solicitado GPUs para esse contêiner. Obrigatório ao usar um tipo de instância com GPU.
+ **`neuron-device-plugin`**: Este é um plug-in de dispositivo Kubernetes que permite que você exponha automaticamente chips Inferentia da AWS para consumo por contêineres em seu cluster Amazon EKS. Ele permite que o Kubernetes acesse e utilize os chips AWS Inferentia nos nós do cluster. Obrigatório ao usar um tipo de instância Neuron.
+ **`aws-efa-k8s-device-plugin`**— Esse é um plug-in de dispositivo Kubernetes que permite o uso do AWS Elastic Fabric Adapter (EFA) em clusters Amazon EKS. O EFA é um dispositivo de rede que fornece comunicação de baixa latência e alta throughput entre instâncias em um cluster. Obrigatório ao usar um tipo de instância compatível com o EFA.

Para obter mais informações sobre o procedimento de instalação usando os gráficos Helm fornecidos, consulte o [arquivo README no repositório CLI SageMaker HyperPod ](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).