Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Consistent view
aviso
El 1 de junio de 2023 será la fecha de fin de soporte estándar para la vista coherente de EMRFS en futuras versiones de Amazon EMR. La vista coherente de EMRFS seguirá funcionando en las versiones existentes.
Con el lanzamiento de Amazon S3 Strong read-after-write Coherence el 1 de diciembre de 2020, ya no necesitará usar la vista coherente de EMRFS (EMRFS CV) con sus clústeres de Amazon EMR. EMRFS CV es una función opcional que permite a los clústeres de Amazon EMR comprobar la lista y la coherencia de los objetos de read-after-write Amazon S3. Al crear un clúster y activar el CV de EMRFS, Amazon EMR crea una base de datos de Amazon DynamoDB para almacenar los metadatos de los objetos que utiliza para realizar un seguimiento de las listas y la coherencia de los objetos de S3. read-after-write Ahora puede desactivar la CV de EMRFS y eliminar la base de datos de DynamoDB que utiliza para no acumular costos adicionales. Los siguientes procedimientos explican cómo comprobar la característica de CV, desactivarla y eliminar la base de datos de DynamoDB que utiliza la característica.
Para comprobar si está utilizando la característica de CV de EMRFS
-
Navegue hasta la pestaña Configuración. Si el clúster tiene la siguiente configuración, utiliza CV de EMRFS.
Classification=emrfs-site,Property=fs.s3.consistent,Value=true
-
También puede utilizarla para describir el AWS CLI clúster con la API.
describe-cluster
Si el resultado contienefs.s3.consistent: true
, el clúster usa la CV de EMRFS.
Para desactivar CV de EMRFS en sus clústeres de Amazon EMR
Para desactivar la característica de CV de EMRFS, utilice una de las tres opciones siguientes. Debe probar estas opciones en su entorno de pruebas antes de aplicarlas a sus entornos de producción.
-
Para detener su clúster existente e iniciar uno nuevo sin las opciones de la CV de EMRFS
-
Antes de detener el clúster, asegúrese de hacer una copia de seguridad de los datos y de avisar a los usuarios.
-
Para detener el clúster, siga las instrucciones de la sección Terminar un clúster.
-
Si utiliza la consola de Amazon EMR para crear un clúster nuevo, vaya a Opciones avanzadas. En la sección Editar configuración de software, anule la selección de la opción para activar la CV de EMRFS. Si la casilla que corresponde a la vista coherente de EMRFS está disponible, manténgala desmarcada.
-
Si solías AWS CLI crear un clúster nuevo con la
create-cluster
API, no utilices la--emrfs
opción, que activa EMRFS CV. -
Si utilizas un SDK o AWS CloudFormation para crear un clúster nuevo, no utilices ninguna de las configuraciones que se muestran en Configurar la vista coherente.
-
-
Para clonar un clúster y eliminar el CV de EMRFS
-
En la consola de Amazon EMR, elija el clúster que usa CV de EMRFS.
-
En la parte superior de la página Detalles del clúster, elija Clonar.
-
Elija Anterior y vaya a Paso 1: software y pasos.
-
En Editar configuración de software, elimine la CV de EMRFS. En Editar configuración, elimine las siguientes configuraciones de la clasificación
emrfs-site
. Si está cargando JSON desde un bucket de S3, debe modificar su objeto de S3.[ {"classification": "emrfs-site", "properties": { "fs.s3.consistent.retryPeriodSeconds":"10", "fs.s3.consistent":"true", "fs.s3.consistent.retryCount":"5", "fs.s3.consistent.metadata.tableName":"EmrFSMetadata" } } ]
-
-
Para eliminar el CV de EMRFS de un clúster que usa grupos de instancias
-
Utilice el siguiente comando para comprobar si un único clúster de EMR utiliza la tabla de DynamoDB asociada al CV de EMRFS o si varios clústeres comparten la tabla. El nombre de la tabla se especifica en
fs.s3.consistent.metadata.tableName
, tal y como se describe en Configuración de la vista coherente. El nombre de tabla predeterminado que utiliza la CV de EMRFS esEmrFSMetadata
.aws emr describe-cluster --cluster-id j-XXXXX | grep fs.s3.consistent.metadata.tableName
-
Si el clúster no comparte la base de datos de DynamoDB con otro clúster, utilice el siguiente comando para volver a configurar el clúster y desactivar la CV de EMRFS. Para obtener más información, consulte la sección Reconfiguración de un grupo de instancias en un clúster en ejecución.
aws emr modify-instance-groups --cli-input-json file://disable-emrfs-1.json
Este comando abre el archivo que desea modificar. Modifique el archivo con las siguientes configuraciones.
{ "ClusterId": "j-xxxx", "InstanceGroups": [ { "InstanceGroupId": "ig-xxxx", "Configurations": [ { "Classification": "emrfs-site", "Properties": { "fs.s3.consistent": "false" }, "Configurations": [] } ] } ] }
-
Si su clúster comparte la tabla de DynamoDB con otro clúster, desactive la CV de EMRFS en todos los clústeres cuando ningún clúster modifique ningún objeto de la ubicación de S3 compartida.
-
Para eliminar los recursos de Amazon DynamoDB asociados al CV de EMRFS
Después de eliminar el CV de EMRFS de sus clústeres de Amazon EMR, elimine los recursos de DynamoDB asociados al CV de EMRFS. Hasta que lo haga, seguirá incurriendo en cargos de DynamoDB asociados a la CV de EMRFS.
-
Compruebe las CloudWatch métricas de la tabla de DynamoDB y confirme que ningún clúster utilice la tabla.
-
Elimine la tabla de DynamoDB.
aws dynamodb delete-table --table-name
<your-table-name>
Para eliminar los recursos de Amazon SQS asociados al CV de EMRFS
-
Si configuró el clúster para enviar notificaciones de incoherencia a Amazon SQS, puede eliminar todas las colas de SQS.
-
Encuentre el nombre de cola de Amazon SQS se especifica en
fs.s3.consistent.notification.SQS.queueName
, tal y como se describe en Configuración de la vista coherente. El formato de nombre de cola predeterminado esEMRFS-Inconsistency-
.<j-cluster ID>
aws sqs list-queues | grep ‘EMRFS-Inconsistency’ aws sqs delete-queue –queue-url
<your-queue-url>
Para dejar de usar la CLI de EMRFS
-
La CLI de EMRFS administra los metadatos que genera la CV de EMRFS. Cuando el soporte estándar para la CV de EMRFS llegue a su fin en futuras versiones de Amazon EMR, el soporte para la CLI de EMRFS también lo hará.