Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Orquestrando SageMaker HyperPod clusters com o Amazon EKS

Modo de foco
Orquestrando SageMaker HyperPod clusters com o Amazon EKS - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker HyperPod é um serviço SageMaker gerenciado por IA que permite o treinamento em grande escala de modelos básicos em clusters computacionais resilientes e de longa duração, integrando-se ao Amazon EKS para orquestrar os recursos computacionais. HyperPod Você pode executar trabalhos de treinamento ininterruptos que abrangem semanas ou meses em grande escala usando clusters do Amazon EKS com recursos de HyperPod resiliência que verificam várias falhas de hardware e recuperam automaticamente os nós defeituosos.

Os principais atributos para usuários administradores de cluster incluem o seguinte:

Para usuários de cientistas de dados, o suporte do EKS HyperPod permite o seguinte.

  • Executando cargas de trabalho em contêineres para treinar modelos básicos no cluster HyperPod

  • Executando inferência no cluster EKS, aproveitando a integração entre HyperPod e o EKS

  • Aproveitando a capacidade de retomada automática de tarefas para o treinamento do Kubeflow PyTorch () PyTorchJob

nota

O Amazon EKS permite a orquestração gerenciada pelo usuário de tarefas e infraestrutura por meio do plano de SageMaker HyperPod controle do Amazon EKS. Garanta que o acesso do usuário ao cluster por meio do endpoint do Kubernetes API Server siga o princípio do privilégio mínimo e que a saída da rede do cluster seja protegida. HyperPod

Para saber mais sobre como proteger o acesso ao servidor de API do Amazon EKS, consulte Controle o acesso à rede ao endpoint do servidor de API de cluster.

Para saber mais sobre como proteger o acesso à rede em HyperPod, consulteConfiguração SageMaker HyperPod com uma Amazon VPC personalizada.

A arquitetura de alto nível do suporte do Amazon EKS HyperPod envolve um mapeamento de 1 para 1 entre um cluster EKS (plano de controle) e um HyperPod cluster (nós de trabalho) dentro de uma VPC, conforme mostrado no diagrama a seguir.

EKS and HyperPod VPC architecture with control plane, cluster nodes, and Serviços da AWS.
PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.