Requisitos previos para utilizar SageMaker HyperPod
En las siguientes secciones, se explican los requisitos previos antes de empezar a utilizar SageMaker HyperPod.
Temas
Cuotas de SageMaker HyperPod
Puede crear clústeres de SageMaker HyperPod en función de las cuotas de uso del clúster de su cuenta de AWS.
importante
Para obtener más información sobre los precios de SageMaker HyperPod, consulte Precios de SageMaker HyperPod y Precios de Amazon SageMaker
Visualización de las cuotas de Amazon SageMaker HyperPod mediante la consola de administración de AWS
Busque los valores predeterminados y aplicados de una cuota, también denominada límite, de uso del clúster, que se utiliza para SageMaker HyperPod.
-
Abra la consola de Service Quotas
. -
En el panel de navegación de la izquierda, elija Servicios de AWS.
-
En la lista de servicios de AWS, busque y seleccione Amazon SageMaker.
-
En la lista Service Quotas, puede ver el nombre de la cuota de servicio, el valor aplicado (si está disponible), la cuota predeterminada de AWS y si el valor de cuota es ajustable.
-
En la barra de búsqueda, escriba uso del clúster. Se mostrarán las cuotas de uso del clúster, las cuotas aplicadas y las cuotas predeterminadas.
Solicitud de cuotas de Amazon SageMaker HyperPod mediante la consola de administración de AWS
Aumente sus cuotas por cuenta o recurso.
-
Para aumentar la cuota de instancias para el uso del clúster, seleccione la cuota que desea aumentar.
-
Si la cuota es ajustable, puede solicitar un aumento de la cuota por cuenta o recurso en función del valor que aparezca en la columna de Capacidad de ajuste.
-
En Aumentar el valor de la cuota, introduzca el nuevo valor. El nuevo valor debe ser mayor que el valor actual.
-
Seleccione Request (Solicitar).
-
Para ver las solicitudes pendientes o resueltas recientemente en la consola, acceda a la pestaña Historial de solicitudes de la página de detalles del servicio o elija Panel en el panel de navegación. Para las solicitudes pendientes, seleccione el estado de la solicitud para abrir la recepción de solicitud. El estado inicial de una solicitud es Pendiente. Cuando el estado cambie a Cuota solicitada, verá el número de caso con AWS Support. Elija el número de caso para abrir el ticket para su solicitud.
Para obtener más información sobre cómo solicitar un aumento de cuota en general, consulte Requesting a Quota Increase en la Guía de usuario de Service Quotas de AWS.
Configuración de SageMaker HyperPod con Amazon VPC
Para configurar un clúster de SageMaker HyperPod con su Amazon VPC, compruebe lo siguiente.
nota
Es necesario para orquestar con EKS y se debe usar la misma VPC para el clúster de HyperPod. Para orquestar con Slurm, la configuración de su propia VPC es opcional.
-
Si desea utilizar su propia VPC para conectar SageMaker HyperPod con los recursos de AWS en su VPC, debe proporcionar el nombre de la VPC, el ID, la Región de AWS, el ID de subred y el ID del grupo de seguridad al crear SageMaker HyperPod. Si desea crear una nueva VPC, consulte VPC predeterminadas o Creación de una VPC en la Guía del usuario de Amazon Virtual Private Cloud.
-
Es importante que cree todos los recursos en la misma Región de AWS y zona de disponibilidad, y que configure las reglas del grupo de seguridad para permitir la conexión entre los recursos de la VPC. Por ejemplo, supongamos que crea una VPC en
us-west-2
. Debe crear una subred en esta VPC en la zona de disponibilidadus-west-2a
y crear un grupo de seguridad que permita todo el tráfico de entrada (entrante) desde el interior del grupo de seguridad y todo el tráfico saliente. -
También debe asegurarse de que su VPC esté conectada a Amazon Simple Storage Service (Amazon S3). Si configura una VPC, los grupos de instancias de SageMaker HyperPod no tienen acceso a Internet y, por tanto, no pueden conectarse a Amazon S3 para acceder o almacenar archivos, como scripts de ciclo de vida, datos de entrenamiento y artefactos de modelos. Para establecer la conexión con Amazon S3 mientras usa la VPC, debe crear un punto de conexión de VPC. Al crear un punto de conexión de VPC, puede permitir que los grupos de instancias de SageMaker HyperPod accedan a los buckets de Amazon S3 dentro de la misma VPC. Le recomendamos que cree también una política personalizada que solo permita que accedan a sus buckets de S3 las solicitudes de su VPC privada. Para obtener más información, consulte Endpoints for Amazon S3 en la Guía del usuario de Amazon VPC de AWS PrivateLink.
-
Si desea crear un clúster de HyperPod con instancias habilitadas para EFA, asegúrese de configurar un grupo de seguridad para permitir todo el tráfico entrante y saliente del propio grupo de seguridad. Para obtener más información, consulte Paso 1: preparar un grupo de seguridad habilitado para EFA en la Guía del usuario de Amazon EC2.
Configuración de AWS Systems Manager y Ejecutar como para el control de acceso de los usuarios del clúster
DLAMI de SageMaker HyperPod viene con AWS Systems Manager
Habilitación de Ejecutar como en su cuenta de AWS
Como administrador de cuentas de AWS o administrador de la nube, puede administrar el acceso a los clústeres de SageMaker HyperPod en un nivel de rol o usuario IAM mediante la característica Ejecutar como de SSM. Con esta característica, puede iniciar cada sesión de SSM con el usuario del sistema operativo asociado al usuario o rol de IAM.
Para habilitar Ejecutar como en su cuenta de AWS, siga los pasos que se indican en Activación del soporte Ejecutar como para nodos administrados de Linux y macOS. Si ya ha creado usuarios de sistema operativo en su clúster, asegúrese de asociarlos a roles o usuarios de IAM etiquetándolos como se indica en la Opción 2 del paso 5 de la sección Activación del soporte Ejecutar como para nodos administrados de Linux y macOS.
(Opcional) Configuración de SageMaker HyperPod con Amazon FSx para Lustre
Para empezar a utilizar SageMaker HyperPod y asignar rutas de datos entre el clúster y el sistema de archivos FSx para Lustre, seleccione una de las Regiones de AWS compatibles con SageMaker HyperPod. Tras elegir la Región de AWS que prefiera, debe determinar también qué zona de disponibilidad (AZ) va a utilizar. Si utiliza nodos de computación de SageMaker HyperPod en unas zonas de disponibilidad diferentes de las zonas de disponibilidad en las que está configurado el sistema de archivos FSx para Lustre dentro de la misma Región de AWS, es posible que se produzca una sobrecarga de red y comunicación. Le recomendamos que utilice la misma zona de disponibilidad física que la de la cuenta de servicio de SageMaker HyperPod para evitar que se produzca cualquier tráfico entre zonas de disponibilidad entre los clústeres de SageMaker HyperPod y su sistema de archivos FSx para Lustre. Asegúrese de haberla configurado también con su VPC. Si desea utilizar Amazon FSx como sistema de archivos principal para el almacenamiento, debe configurar los clústeres de SageMaker HyperPod con VPC.