Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Visualizzazione coerente
avvertimento
Il 1° giugno 2023, EMRFS consistent View raggiungerà la fine del supporto standard per le future EMR versioni di Amazon. EMRFSconsistent view continuerà a funzionare per le versioni esistenti.
Con il rilascio di Amazon S3 Strong read-after-write Consistency il 1° dicembre 2020, non è più necessario utilizzare EMRFS consistent view (EMRFSCV) con i cluster Amazon. EMR EMRFSCV è una funzionalità opzionale che consente ai EMR cluster Amazon di verificare l'elenco e la read-after-write coerenza degli oggetti Amazon S3. Quando crei un cluster e EMRFS CV è attivato, Amazon EMR crea un database Amazon DynamoDB per archiviare i metadati degli oggetti che utilizza per tracciare l' read-after-writeelenco e la coerenza degli oggetti S3. Ora puoi disattivare EMRFS CV ed eliminare il database DynamoDB che utilizza in modo da non incorrere in costi aggiuntivi. Le seguenti procedure spiegano come verificare la caratteristica CV, disattivarla ed eliminare il database DynamoDB utilizzato dalla caratteristica.
Per verificare se stai utilizzando la funzione CV EMRFS
-
Vai alla scheda Configuration (Configurazione). Se il tuo cluster ha la seguente configurazione, utilizza EMRFS CV.
Classification=emrfs-site,Property=fs.s3.consistent,Value=true
-
In alternativa, usa il AWS CLI per descrivere il tuo cluster con.
describe-cluster
API Se l'output contienefs.s3.consistent: true
, il cluster utilizza EMRFS CV.
Per disattivare EMRFS CV sui tuoi cluster Amazon EMR
Per disattivare la funzionalità EMRFS CV, utilizza una delle tre opzioni seguenti. Ti consigliamo di testare queste opzioni nel tuo ambiente di test prima di applicarle agli ambienti di produzione.
-
Per interrompere il cluster esistente e avviare un nuovo cluster senza opzioni EMRFS CV.
-
Prima di arrestare il cluster, assicurati di eseguire il backup dei dati e di informare gli utenti.
-
Per arrestare il cluster, segui le istruzioni riportate nella sezione Arresto di un cluster.
-
Se utilizzi la EMR console Amazon per creare un nuovo cluster, vai a Opzioni avanzate. Nella sezione Modifica impostazioni software, deseleziona l'opzione per attivare EMRFS CV. Se la casella di controllo per una visualizzazione EMRFS coerente è disponibile, tienila deselezionata.
-
Se desideri AWS CLI creare un nuovo cluster con
create-cluster
API, non utilizzare l'--emrfs
opzione, che attiva EMRFS CV. -
Se utilizzi un SDK or AWS CloudFormation per creare un nuovo cluster, non utilizzare nessuna delle configurazioni elencate in Configura la visualizzazione coerente.
-
-
Per clonare un cluster e rimuovere CV EMRFS
-
Nella EMR console Amazon, scegli il cluster che utilizza EMRFS CV.
-
Nella parte superiore della pagina Cluster Details (Dettagli del cluster), fai clic su Clone (Clona).
-
Scegli Previous (Precedente) e passa alla Fase 1: software e fasi.
-
In Modifica impostazioni software, rimuovi EMRFS CV. In Edit configuration (Modifica configurazione), elimina le seguenti configurazioni nella classificazione
emrfs-site
. Se stai caricando JSON da un bucket S3, devi modificare l'oggetto S3.[ {"classification": "emrfs-site", "properties": { "fs.s3.consistent.retryPeriodSeconds":"10", "fs.s3.consistent":"true", "fs.s3.consistent.retryCount":"5", "fs.s3.consistent.metadata.tableName":"EmrFSMetadata" } } ]
-
-
Per rimuovere EMRFS CV da un cluster che utilizza gruppi di istanze
-
Usa il comando seguente per verificare se un singolo EMR cluster utilizza la tabella DynamoDB EMRFS associata a CV o se più cluster condividono la tabella. Il nome della tabella è specificato in
fs.s3.consistent.metadata.tableName
, come descritto in Configure consistent view (Configura visualizzazione coerente). Il nome di tabella predefinito utilizzato da CV è. EMRFSEmrFSMetadata
aws emr describe-cluster --cluster-id j-XXXXX | grep fs.s3.consistent.metadata.tableName
-
Se il cluster non condivide il database DynamoDB con un altro cluster, utilizza il seguente comando per riconfigurare il cluster e disattivare CV. EMRFS Per ulteriori informazioni, consulta la sezione Riconfigurazione di un gruppo di istanze in un cluster in esecuzione.
aws emr modify-instance-groups --cli-input-json file://disable-emrfs-1.json
Questo comando apre il file che desideri modificare. Modifica il file utilizzando le seguenti configurazioni.
{ "ClusterId": "j-xxxx", "InstanceGroups": [ { "InstanceGroupId": "ig-xxxx", "Configurations": [ { "Classification": "emrfs-site", "Properties": { "fs.s3.consistent": "false" }, "Configurations": [] } ] } ] }
-
Se il tuo cluster condivide la tabella DynamoDB con un altro cluster, EMRFS disattiva CV su tutti i cluster in un momento in cui nessun cluster modifica alcun oggetto nella posizione condivisa di S3.
-
Per eliminare le risorse Amazon DynamoDB associate a CV EMRFS
Dopo aver rimosso EMRFS CV dai EMR cluster Amazon, elimina le risorse DynamoDB associate a CV. EMRFS Finché non lo farai, continuerai a sostenere i costi di DynamoDB associati a CV. EMRFS
-
Controlla le CloudWatch metriche per la tua tabella DynamoDB e conferma che la tabella non sia utilizzata da nessun cluster.
-
Elimina la tabella DynamoDB.
aws dynamodb delete-table --table-name
<your-table-name>
Per eliminare SQS le risorse Amazon associate al EMRFS CV
-
Se hai configurato il cluster per inviare notifiche di incoerenza ad AmazonSQS, puoi eliminare tutte le SQS code.
-
Trova il nome della SQS coda Amazon specificato in
fs.s3.consistent.notification.SQS.queueName
, come descritto in Configurare la visualizzazione coerente. Il formato predefinito del nome della coda èEMRFS-Inconsistency-
.<j-cluster ID>
aws sqs list-queues | grep ‘EMRFS-Inconsistency’ aws sqs delete-queue –queue-url
<your-queue-url>
Per smettere di usare EMRFS CLI
-
EMRFSCLIGestisce i metadati generati da EMRFS CV. Man mano che il supporto standard per EMRFS CV giungerà al termine nelle future versioni di AmazonEMR, anche il supporto per il EMRFS CLI terminerà.
Argomenti
- Attivazione della visualizzazione coerente
- Comprendere in che modo la visualizzazione EMRFS coerente tiene traccia degli oggetti in Amazon S3
- Logica di ripetizione dei tentativi
- EMRFSvisualizzazione coerente dei metadati
- Configura le notifiche di coerenza per CloudWatch e Amazon SQS
- Configurazione della visualizzazione coerente
- EMRFSCLIRiferimento ai comandi