Integración de Amazon EMR con grupos de ubicación de EC2
Al lanzar un clúster de Amazon EMR con varios nodos principales en Amazon EC2, tiene la opción de utilizar estrategias de grupos de ubicación para especificar cómo desea que se implementen las instancias de nodos principales para protegerlas contra los errores de hardware.
Las estrategias de grupos de ubicación se admiten a partir de la versión 5.23.0 de Amazon EMR como opción para clústeres con varios nodos principales. Actualmente, la estrategia de grupo de ubicación solo admite los tipos de nodos principales y la estrategia SPREAD
se aplica a esos nodos. La estrategia SPREAD
coloca un pequeño grupo de instancias en un hardware subyacente independiente para evitar la pérdida de varios nodos principales en caso de que se produzca un error de hardware. Tenga en cuenta que una solicitud de lanzamiento de instancia podría presentar errores si no hay suficiente hardware único para cumplir con la solicitud. Para más información sobre las estrategias y limitaciones de ubicación de EC2, consulte Grupos de ubicación en la Guía del usuario de EC2 para instancias de Linux.
Existe un límite inicial de Amazon EC2 de 500 clústeres habilitados para las estrategias de grupos de ubicación que se pueden lanzar por región de AWS. Póngase en contacto con la asistencia técnica de AWS para solicitar un aumento del número de grupos de ubicación permitidos. Puede identificar los grupos de ubicación de EC2 que Amazon EMR crea mediante el seguimiento del par de clave-valor que Amazon EMR asocia a la estrategia de grupos de ubicación de Amazon EMR. Para más información acerca de las etiquetas de instancias de clúster de EC2, consulte Ver instancias del clúster en Amazon EC2.
Asociación de la política administrada del grupo de ubicación al rol de Amazon EMR
La estrategia de grupos de ubicación requiere una política administrada llamada AmazonElasticMapReducePlacementGroupPolicy
, que permite a Amazon EMR crear, eliminar y describir grupos de ubicación en Amazon EC2. Debe asociar AmazonElasticMapReducePlacementGroupPolicy
al rol de servicio de Amazon EMR antes de lanzar un clúster de Amazon EMR con varios nodos principales.
También puede asociar la política administrada AmazonEMRServicePolicy_v2
al rol de servicio de Amazon EMR en lugar de la política administrada del grupo de ubicación. AmazonEMRServicePolicy_v2
permite el mismo acceso a los grupos de ubicación en Amazon EC2 que AmazonElasticMapReducePlacementGroupPolicy
. Para obtener más información, consulte Rol de servicio para Amazon EMR (rol de EMR).
La política administrada AmazonElasticMapReducePlacementGroupPolicy
es el siguiente texto JSON creado y administrado por Amazon EMR.
nota
Dado que la política administrada AmazonElasticMapReducePlacementGroupPolicy
se actualiza automáticamente, la política aquí mostrada podría estar obsoleta. Utilice la consola de administración de AWS para ver la política actual.
{ "Version":"2012-10-17", "Statement":[ { "Resource":"*", "Effect":"Allow", "Action":[ "ec2:DeletePlacementGroup", "ec2:DescribePlacementGroups" ] }, { "Resource":"arn:aws:ec2:*:*:placement-group/pg-*", "Effect":"Allow", "Action":[ "ec2:CreatePlacementGroup" ] } ] }
Lanzamiento de un clúster de Amazon EMR con varios nodos principales mediante una estrategia de grupos con ubicación
Para lanzar un clúster de Amazon EMR con varios nodos principales y con una estrategia de grupos con ubicación, asocie la política administrada de grupos con ubicación AmazonElasticMapReducePlacementGroupPolicy
al rol de Amazon EMR. Para obtener más información, consulte Asociación de la política administrada del grupo de ubicación al rol de Amazon EMR.
Cada vez que utiliza este rol para iniciar un clúster de Amazon EMR con varios nodos principales, Amazon EMR intenta lanzar un clúster con la estrategia SPREAD
aplicada a sus nodos principales. Si utiliza un rol que no tiene la política administrada de grupos con ubicación AmazonElasticMapReducePlacementGroupPolicy
asociada a él, Amazon EMR intentará lanzar un clúster de Amazon EMR con varios nodos principales sin una estrategia de grupos con ubicación.
Si lanza un clúster de Amazon EMR con varios nodos principales y con el parámetro placement-group-configs
mediante la API o la CLI de Amazon EMR, Amazon EMR solo lanza el clúster si el rol de Amazon EMR tiene asociada la política administrada de grupos con ubicación AmazonElasticMapReducePlacementGroupPolicy
. Si el rol de Amazon EMR no tiene la política asociada, se produce un error en el inicio del clúster de Amazon EMR con varios nodos principales.
Lanzamiento de un clúster con varios nodos principales sin una estrategia de grupos de ubicación
Para que un clúster con varios nodos principales lance nodos principales sin la estrategia de grupos de ubicación, debe realizar una de las siguientes acciones:
-
Eliminar la política administrada
AmazonElasticMapReducePlacementGroupPolicy
del grupo de ubicación del rol de Amazon EMR o -
Lanzar un clúster con varios nodos principales con el parámetro
placement-group-configs
mediante la API o la CLI de Amazon EMR y conNONE
como estrategia de grupos de ubicación.
Comprobación de la configuración de la estrategia de grupos de ubicación asociada al clúster con varios nodos principales
Puede utilizar la API de descripción del clúster de Amazon EMR para ver la configuración de la estrategia de grupos de ubicación asociada al clúster con varios nodos principales.
aws emr describe-cluster --cluster-id "j-xxxxx" { "Cluster":{ "Id":"j-xxxxx", ... ... "PlacementGroups":[ { "InstanceRole":"MASTER", "PlacementStrategy":"SPREAD" } ] } }