Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Prácticas recomendadas
Prácticas recomendadas: selección del tipo de instancia principal
Aunque el nodo maestro no ejecuta ningún trabajo, sus funciones y su tamaño son cruciales para el rendimiento general del clúster.
Al elegir el tipo de instancia que se utilizará para el nodo maestro, querrá evaluar los siguientes elementos:
-
Tamaño del clúster: el nodo maestro organiza la lógica de escalado del clúster y es responsable de adjuntar los nuevos nodos al programador. Si necesita escalar o reducir verticalmente el clúster de una cantidad considerable de nodos, entonces querrá dotar al nodo maestro de una capacidad de computación adicional.
-
Sistemas de archivos compartidos: cuando utilice sistemas de archivos compartidos para compartir artefactos entre los nodos de procesamiento y el nodo principal, tenga en cuenta que el maestro es el nodo que expone al NFS servidor. Por este motivo, debes elegir un tipo de instancia con suficiente ancho de banda de red y suficiente ancho de EBS banda dedicado de Amazon para gestionar tus flujos de trabajo.
Prácticas recomendadas: rendimiento de la red
Hay tres consejos que cubren toda la gama de posibilidades para mejorar la comunicación en la red.
-
Grupo de agrupación: un grupo con ubicación en clúster es una agrupación lógica de instancias en una misma zona de disponibilidad. Para obtener más información sobre los grupos de ubicación, consulta los grupos de ubicación en la Guía del EC2 usuario de Amazon. Puede configurar el clúster para que utilice su propio grupo de ubicación
placement_group =
o alquilarlo AWS ParallelCluster cree un grupo de ubicación con layour-placement-group-name
"compute"
estrategia deplacement_group = DYNAMIC
. Para obtener más información, consulte placement_group el modo de cola múltiple y el modo placement_group de cola única. -
Redes mejoradas: considere la posibilidad de elegir un tipo de instancia que admita redes mejoradas. Para obtener más información, consulte redes mejoradas en Linux en la Guía del EC2 usuario de Amazon.
-
Adaptador Elastic Fabric: para admitir altos niveles de comunicación escalable entre instancias, considere la posibilidad de elegir interfaces de EFA red para su red. El hardware EFA de derivación del sistema operativo (OS) personalizado mejora las comunicaciones entre instancias con la elasticidad y flexibilidad bajo demanda del AWS nube. Para configurar una sola Slurm configure
enable_efa = true
la cola de clústeres que EFA desee utilizar. Para obtener más información sobre el uso con EFA AWS ParallelCluster, consulte Elastic Fabric Adapter y enable_efa. Para obtener más informaciónEFA, consulte Elastic Fabric Adapter en la Guía del EC2 usuario de Amazon para instancias de Linux. -
Ancho de banda de la instancia: el ancho de banda se amplía con el tamaño de la instancia. Considere elegir el tipo de instancia que mejor se adapte a sus necesidades EBS; consulte Instancias optimizadas para Amazon y tipos de EBS volumen de Amazon en la Guía del EC2 usuario de Amazon.
Prácticas recomendadas: alertas de presupuesto
Para gestionar AWS ParallelCluster costos de recursos, le recomendamos que utilice AWS Budgets acciones para crear un presupuesto y alertas de umbral presupuestario definidas para los seleccionados AWS recursos. Para obtener más información, consulte Configuración de una acción presupuestaria en AWS Budgets Guía del usuario. También puedes usar Amazon CloudWatch para crear una alarma de facturación. Para obtener más información, consulta Cómo crear una alarma de facturación para controlar tu presupuesto AWS cargos.
Mejores prácticas: trasladar un clúster a un nuevo AWS ParallelCluster versión secundaria o de parche
Actualmente cada AWS ParallelCluster la versión secundaria es autónoma junto con su pcluster
CLI. Para mover un clúster a una nueva versión secundaria o de parche, debe volver a crear el clúster con la nueva versión. CLI
Para optimizar el proceso de migración de un clúster a una nueva versión secundaria o para guardar los datos de almacenamiento compartido por otros motivos, le recomendamos que utilice las siguientes prácticas recomendadas.
-
Guarde los datos personales en volúmenes externos, como Amazon EFS y FSx para Lustre. De este modo, podrá mover fácilmente los datos de un clúster a otro.
-
Cree sistemas de almacenamiento compartido de los tipos que se detallan a continuación utilizando AWS CLI o AWS Management Console:
Añádalos a la nueva configuración del clúster como sistemas de archivos existentes. De esta forma, se conservan al eliminar el clúster y se pueden asociar a un clúster nuevo. Los sistemas de almacenamiento compartido generalmente incurren en cargos tanto si están conectados como separados de un clúster.
Le recomendamos que utilice los sistemas de archivos Amazon o Amazon FSx for LustreEFS, ya que se pueden adjuntar a varios clústeres al mismo tiempo y puede adjuntarlos al nuevo clúster antes de eliminar el antiguo. Para obtener más información, consulte Montar los sistemas de EFS archivos de Amazon en la Guía del EFS usuario de Amazon y Acceder a FSx los sistemas de archivos Lustre en la Guía del usuario de Amazon FSx for Lustre Lustre.
-
Utilice acciones de arranque personalizadas para personalizar sus instancias en lugar de personalizarlas. AMI Esto optimiza el proceso de creación, ya que AMI no es necesario crear una nueva personalización para cada nueva versión.
-
Secuencia de Secuencia recomendada.
-
Actualice la configuración del clúster para utilizar las definiciones de sistemas de archivos existentes.
-
Compruebe la versión de
pcluster
y actualícela si es necesario. -
Cree y pruebe el nuevo clúster.
-
Asegúrese de que sus datos estén disponibles en el clúster nuevo.
-
Asegúrese de que la aplicación funcione en el clúster nuevo.
-
-
Si su nuevo clúster está completamente probado y en funcionamiento y está seguro de que no va a utilizar el clúster anterior, elimínelo.
-