Atualizar a configuração do SageMaker HyperPod cluster - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atualizar a configuração do SageMaker HyperPod cluster

Execute update-cluster para atualizar a configuração de um cluster.

nota

Você não pode alterar as informações do EKS cluster que seu HyperPod cluster está associado após a criação do cluster.

nota

Se verificações profundas de integridade estiverem sendo executadas no cluster, isso não API funcionará conforme o esperado. Você pode encontrar uma mensagem de erro informando que verificações profundas de saúde estão em andamento. Para atualizar o cluster, você deve esperar até que as verificações profundas de integridade sejam concluídas.

  1. Crie um arquivo de UpdateCluster solicitação em JSON formato. Certifique-se de especificar o nome do cluster e o nome do grupo de instâncias corretos para atualizar. Você pode alterar o tipo de instância, o número de instâncias, o script do ponto de entrada da configuração do ciclo de vida e o caminho para o script.

    1. ParaClusterName, especifique o nome do cluster que você deseja atualizar.

    2. Para InstanceGroupName

      1. Para atualizar um grupo de instâncias existente, especifique o nome do grupo de instâncias que você quer atualizar.

      2. Para adicionar um novo grupo de instâncias, especifique um novo nome que não existe no seu cluster.

    3. Para InstanceType

      1. Para atualizar um grupo de instâncias existente, você precisa corresponder ao grupo o tipo de instância especificado inicialmente.

      2. Para adicionar um novo grupo de instâncias, especifique o tipo de instância com o qual você quer configurar o grupo.

    4. Para InstanceCount

      1. Para atualizar um grupo de instâncias existente, especifique um número inteiro maior que o número atual de instâncias. Atualmente, você só pode aumentar o número de instâncias.

      2. Para adicionar um novo grupo de instâncias, especifique um número inteiro maior ou igual a 1.

    5. PoisLifeCycleConfig, você pode alterar os valores de ambos SourceS3Uri e OnCreate conforme quiser atualizar o grupo de instâncias.

    6. Para ExecutionRole

      1. Para atualizar um grupo de instâncias existente, continue usando a mesma IAM função que você atribuiu durante a criação do cluster.

      2. Para adicionar um novo grupo de instâncias, especifique uma IAM função que você deseja anexar.

    7. Para ThreadsPerCore

      1. Para atualizar um grupo de instâncias existente, continue usando o mesmo valor especificado durante a criação do cluster.

      2. Para adicionar um novo grupo de instâncias, você pode escolher qualquer valor entre as opções permitidas por tipo de instância. Para obter mais informações, pesquise o tipo de instância e consulte a coluna de segmentos válidos por núcleo na tabela de referência em CPUnúcleos e segmentos por CPU núcleo por tipo de instância no Guia EC2 do usuário da Amazon.

    8. ParaOnStartDeepHealthChecks, InstanceConnectivity adicionar InstanceStress e ativarVerificações de saúde aprofundadas.

    9. ParaNodeRecovery, especifique Automatic para ativar a recuperação automática de nós. SageMaker HyperPod substitui ou reinicializa instâncias (nós) quando problemas são encontrados pelo agente de monitoramento de integridade.

    O trecho de código a seguir é um modelo de arquivo de JSON solicitação que você pode usar. Para obter mais informações sobre a sintaxe da solicitação e seus parâmetrosAPI, consulte a UpdateClusterAPIreferência.

    // update_cluster.json { // Required "ClusterName": "name-of-cluster-to-update", // Required "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "string", "OnCreate": "string" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "NodeRecovery": "Automatic" }
  2. Execute o update-cluster comando a seguir para enviar a solicitação.

    aws sagemaker update-cluster \ --cli-input-json file://complete/path/to/update_cluster.json