Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
SageMaker HyperPod referencias
Encuentre más información y referencias sobre su uso SageMaker HyperPod en los siguientes temas.
Temas
SageMaker HyperPod precios
En los temas siguientes se proporciona información sobre SageMaker HyperPod los precios. Para obtener más información sobre el precio por hora del uso de SageMaker HyperPod instancias, consulta también los precios de Amazon SageMaker AI
Solicitudes de capacidad
Puede asignar capacidad de cómputo bajo demanda o reservada con SageMaker IA para su uso en ellas SageMaker HyperPod. La creación de clústeres bajo demanda asigna la capacidad disponible del conjunto de capacidades bajo demanda de SageMaker IA. Como alternativa, puede solicitar una capacidad reservada para garantizar el acceso enviando un ticket para aumentar la cuota. La SageMaker IA prioriza las solicitudes de capacidad entrantes y usted recibe un tiempo estimado para la asignación de la capacidad.
Facturación del servicio
Cuando aprovisiona una capacidad de cómputo SageMaker HyperPod, se le factura por la duración de la asignación de capacidad. SageMaker HyperPod la facturación aparece en tus facturas de aniversario con una partida que indica el tipo de asignación de capacidad (bajo demanda, reservada), el tipo de instancia y el tiempo dedicado a usarla.
Para enviar una solicitud de aumento de cuota, consulte SageMaker HyperPod cuotas.
SageMaker HyperPod APIs
La siguiente lista contiene un conjunto completo de opciones SageMaker HyperPod APIs para enviar solicitudes de acción en JSON formato a SageMaker AI mediante AWS CLI o AWS SDK for Python (Boto3).
SageMaker HyperPod formularios
Para configurar la herramienta de gestión de cargas de trabajo de Slurm HyperPod, debe crear el archivo de configuración de Slurm necesario HyperPod mediante el formulario proporcionado.
Formulario de configuración para aprovisionar nodos de Slurm en HyperPod
El siguiente código es el formulario de configuración de Slurm que debe preparar para configurar correctamente los nodos de Slurm en su clúster. HyperPod Debe completar este formulario y cargarlo como parte de un conjunto de scripts de ciclo de vida durante la creación del clúster. Para saber cómo se debe preparar este formulario durante los procesos de creación de HyperPod clústeres, consulte. Personalice SageMaker HyperPod los clústeres mediante scripts de ciclo de vida
// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "
string
", "login_group": "string
", "worker_groups": [ { "instance_group_name": "string
", "partition_name": "string
" } ], "fsx_dns_name": "string
", "fsx_mountname": "string
" }
-
version
: obligatorio. Esta es la versión del formulario de parámetros de HyperPod aprovisionamiento. Déjelo como1.0.0
. -
workload_manager
: obligatorio. Esto sirve para especificar qué administrador de carga de trabajo se debe configurar en el HyperPod clúster. Déjelo comoslurm
. -
controller_group
: obligatorio. Esto sirve para especificar el nombre del grupo de instancias del HyperPod clúster que desea asignar al nodo controlador (principal) de Slurm. -
login_group
: opcional. Esto sirve para especificar el nombre del grupo de instancias del HyperPod clúster que quieres asignar al nodo de inicio de sesión de Slurm. -
worker_groups
: obligatorio. Esto sirve para configurar los nodos de trabajo (cómputo) de Slurm en el clúster. HyperPod-
instance_group_name
: obligatorio. Esto sirve para especificar el nombre del grupo de HyperPod instancias que deseas asignar al nodo trabajador (de cómputo) de Slurm. -
partition_name
: obligatorio. Esto sirve para especificar el nombre de la partición para el nodo.
-
-
fsx_dns_name
: opcional. Si quieres configurar tus nodos Slurm en el HyperPod clúster para que se comuniquen con AmazonFSx, especifica el FSx DNS nombre. -
fsx_mountname
: opcional. Si quieres configurar tus nodos Slurm en el HyperPod clúster para que se comuniquen con AmazonFSx, especifica el nombre del FSx montaje.
SageMaker HyperPod DLAMI
SageMaker HyperPod ejecuta un en DLAMI función de:
-
AWS Deep Learning Base GPU AMI (Ubuntu 20.04)
para la orquestación con Slurm. -
Basado en Amazon Linux 2 AMI para la orquestación con AmazonEKS.
SageMaker HyperPod DLAMISe incluye con paquetes adicionales para admitir herramientas de código abierto como Slurm, Kubernetes, dependencias y paquetes de software de clúster para admitir funciones de resiliencia, como la comprobación del estado del SageMaker HyperPod clúster y la reanudación automática. Para hacer un seguimiento de las actualizaciones de HyperPod software que distribuye el equipo de servicio, consulte. HyperPod DLAMIs Notas de SageMaker HyperPod lanzamiento de Amazon
Referencia de permisos de SageMaker HyperPod API
importante
IAMLas políticas personalizadas que permiten a Amazon SageMaker Studio o Amazon SageMaker Studio Classic crear SageMaker recursos de Amazon también deben conceder permisos para añadir etiquetas a esos recursos. El permiso para añadir etiquetas a los recursos es necesario porque Studio y Studio Classic etiquetan automáticamente todos los recursos que crean. Si una IAM política permite a Studio y Studio Classic crear recursos, pero no permite el etiquetado, se pueden producir errores AccessDenied «» al intentar crear recursos. Para obtener más información, consulte Proporcione permisos para etiquetar los recursos de SageMaker IA.
AWS políticas gestionadas para Amazon SageMaker AIque otorgan permisos para crear SageMaker recursos ya incluyen permisos para añadir etiquetas al crear esos recursos.
Cuando configure el control de acceso para permitir la ejecución de SageMaker HyperPod API operaciones y redacte una política de permisos que pueda adjuntar a IAM los usuarios para los administradores de la nube, utilice la siguiente tabla como referencia.
SageMaker APIOperaciones de Amazon | Permisos necesarios (APIacciones) | Recursos |
CreateCluster | sagemaker:CreateCluster |
arn:aws:sagemaker: |
DeleteCluster | sagemaker:DeleteCluster |
arn:aws:sagemaker: |
DescribeCluster | sagemaker:DescribeCluster |
arn:aws:sagemaker: |
DescribeClusterNode | sagemaker:DescribeClusterNode |
arn:aws:sagemaker: |
ListClusterNodes | sagemaker:ListClusterNodes |
arn:aws:sagemaker: |
ListClusters | sagemaker:ListClusters |
arn:aws:sagemaker: |
UpdateCluster | sagemaker:UpdateCluster |
arn:aws:sagemaker: |
UpdateClusterSoftware | sagemaker:UpdateClusterSoftware |
arn:aws:sagemaker: |
Para obtener una lista completa de los tipos de permisos y recursos SageMaker APIs, consulte Acciones, recursos y claves de condición de Amazon SageMaker AI en la Referencia de autorización de AWS servicio.
SageMaker HyperPod comandos en AWS CLI
Los siguientes son los AWS CLI comandos SageMaker HyperPod para ejecutar las HyperPod APIoperaciones principales.
SageMaker HyperPod Módulos de Python en AWS SDK for Python (Boto3)
Los siguientes son los métodos del AWS SDK for Python (Boto3) cliente para que la SageMaker IA ejecute las HyperPod APIoperaciones principales.