Risoluzione dei problemi - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi

La sezione seguente elenca le soluzioni per la risoluzione dei problemi HyperPod in Studio.

Scheda Attività

Se si ottiene Custom Resource Definition (CRD) non è configurato nel cluster mentre si trova nella scheda Attività.

Se la griglia delle attività per le metriche Slurm non smette di caricarsi nella scheda Attività.

Per la visualizzazione limitata delle attività nei cluster Studio for EKS:

  • Se il tuo ruolo di esecuzione non dispone delle autorizzazioni per elencare gli spazi dei nomi per i cluster EKS.

  • Se gli utenti riscontrano problemi con l'accesso ai cluster EKS.

    1. Verifica che RBAC sia abilitato eseguendo il comando seguente. AWS CLI

      kubectl api-versions | grep rbac

      Questo dovrebbe restituire rbac.authorization.k8s.io/v1.

    2. Controlla se ClusterRole e esiste eseguendo i seguenti comandi. ClusterRoleBinding

      kubectl get clusterrole pods-events-crd-cluster-role kubectl get clusterrolebinding pods-events-crd-cluster-role-binding
    3. Verifica l'appartenenza al gruppo di utenti. Assicurati che l'utente sia assegnato correttamente al pods-events-crd-cluster-level gruppo nel tuo provider di identità o IAM.

  • Se l'utente non riesce a visualizzare alcuna risorsa.

    • Verifica l'appartenenza al gruppo e assicurati che ClusterRoleBinding sia applicata correttamente.

  • Se gli utenti possono vedere le risorse in tutti i namespace.

    • Se è richiesta una restrizione dello spazio dei nomi, valuta la possibilità di utilizzare and invece di and. Role RoleBinding ClusterRole ClusterRoleBinding

  • Se la configurazione sembra corretta, ma le autorizzazioni non vengono applicate.

    • Controlla se ce ne sono NetworkPolicies o PodSecurityPolicies interferiscono con l'accesso.

Scheda dei parametri

Se non ci sono CloudWatch parametri Amazon, vengono visualizzati nella scheda Metrics.

  • La Metrics sezione dei dettagli del HyperPod cluster viene utilizzata CloudWatch per recuperare i dati. Per visualizzare le metriche in questa sezione, devi aver abilitato. Osservabilità dei cluster Contatta l'amministratore per configurare le metriche.