Stream Amazon DynamoDB come sorgente per Pipes EventBridge - Amazon EventBridge

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Stream Amazon DynamoDB come sorgente per Pipes EventBridge

È possibile utilizzare EventBridge Pipes per ricevere record in un flusso DynamoDB. Puoi quindi eventualmente filtrare o migliorare questi record prima di inviarli a una delle destinazioni disponibili per l'elaborazione. Esistono impostazioni specifiche per Amazon DynamoDB Streams che puoi scegliere durante la configurazione della pipe. EventBridge Pipes mantiene l'ordine dei record dal flusso di dati quando invia tali dati alla destinazione.

Importante

La disabilitazione di un flusso DynamoDB che è l'origine di una pipe fa sì che tale pipe diventi inutilizzabile, anche se successivamente si riabilita il flusso. Ciò avviene perché:

  • Non è possibile interrompere, avviare o aggiornare una pipe la cui origine è disabilitata.

  • Non è possibile aggiornare una pipe con una nuova origine dopo la creazione. Quando riattivi un flusso DynamoDB, a tale flusso viene assegnato un nuovo Amazon Resource Name ARN () e non è più associato alla tua pipe.

Se riattivi il flusso DynamoDB, dovrai creare una nuova pipe usando il nuovo stream. ARN

Esempio di evento

L'evento di esempio seguente mostra le informazioni ricevute dalla pipe. È possibile utilizzare questo evento per creare e filtrare i modelli di eventi o per definire la trasformazione degli input. Non tutti i campi possono essere filtrati. Per ulteriori informazioni su quali campi è possibile filtrare, consulta Filtraggio degli eventi in Amazon EventBridge Pipes.

[ { "eventID": "1", "eventVersion": "1.0", "dynamodb": { "Keys": { "Id": { "N": "101" } }, "NewImage": { "Message": { "S": "New item!" }, "Id": { "N": "101" } }, "StreamViewType": "NEW_AND_OLD_IMAGES", "SequenceNumber": "111", "SizeBytes": 26 }, "awsRegion": "us-west-2", "eventName": "INSERT", "eventSourceARN": "arn:aws:dynamodb:us-east-1:111122223333:table/EventSourceTable", "eventSource": "aws:dynamodb" }, { "eventID": "2", "eventVersion": "1.0", "dynamodb": { "OldImage": { "Message": { "S": "New item!" }, "Id": { "N": "101" } }, "SequenceNumber": "222", "Keys": { "Id": { "N": "101" } }, "SizeBytes": 59, "NewImage": { "Message": { "S": "This item has changed" }, "Id": { "N": "101" } }, "StreamViewType": "NEW_AND_OLD_IMAGES" }, "awsRegion": "us-west-2", "eventName": "MODIFY", "eventSourceARN": "arn:aws:dynamodb:us-east-1:111122223333:table/EventSourceTable", "eventSource": "aws:dynamodb" } ]

Flussi di polling e batching

EventBridge analizza i frammenti del tuo flusso DynamoDB alla ricerca di record a una frequenza base di quattro volte al secondo. Quando i record sono disponibili, EventBridge elabora l'evento e attende il risultato. Se l'elaborazione ha esito positivo, EventBridge riprende il polling finché non riceve altri record.

Per impostazione predefinita, EventBridge richiama la pipe non appena i record sono disponibili. Se il batch che EventBridge legge dalla sorgente contiene un solo record, viene elaborato un solo evento. Per evitare di elaborare pochi record, puoi indicare alla pipe di memorizzare nel buffer i record per un massimo di cinque minuti configurando un periodo di batching. Prima di elaborare gli eventi, EventBridge continua a leggere i record dall'origine fino alla raccolta di un batch completo, alla scadenza della finestra di batch o al raggiungimento del limite di payload di 6 MB.

È possibile anche aumentare la concorrenza elaborando più batch da ogni partizione in parallelo. EventBridge può elaborare fino a 10 batch in ogni shard contemporaneamente. Se si aumenta il numero di batch simultanei per shard, si garantisce EventBridge comunque l'elaborazione in ordine a livello di chiave di partizione.

Configura l'impostazione ParallelizationFactor per elaborare una partizione di un flusso di dati Kinesis o DynamoDB con più esecuzioni di pipe simultanee. È possibile specificare il numero di batch simultanei che eseguono il EventBridge polling da uno shard tramite un fattore di parallelizzazione compreso tra 1 (impostazione predefinita) e 10. Ad esempio, se si imposta su ParallelizationFactor 2, è possibile avere un massimo di 200 esecuzioni EventBridge Pipe simultanee per elaborare 100 frammenti di dati Kinesis. Ciò permette di dimensionare verso l'alto il throughput di elaborazione quando il volume dei dati è volatile e l'IteratorAge è alta. Si noti che il fattore di parallelizzazione non funzionerà se si utilizza l'aggregazione Kinesis.

Posizioni di partenza di polling e flussi

Tieni presente che il polling di origine dei flussi durante la creazione e gli aggiornamenti della pipe alla fine è coerente.

  • Durante la creazione della pipe, potrebbero essere necessari alcuni minuti per l'avvio degli eventi di polling dal flusso.

  • Durante gli aggiornamenti della pipe per la configurazione del polling di origine, potrebbero essere necessari alcuni minuti per interrompere e riavviare gli eventi di polling dal flusso.

Ciò significa che se specifichi LATEST come posizione iniziale del flusso, la pipe potrebbe perdere degli eventi inviati durante la creazione o gli aggiornamenti della pipe. Per garantire che nessun evento venga perso, specifica la posizione iniziale del flusso come TRIM_HORIZON.

Segnalazione errori articoli batch

Quando EventBridge utilizza ed elabora i dati in streaming da una fonte, per impostazione predefinita il checkpoint si basa sul numero di sequenza più alto di un batch, ma solo quando il batch ha esito positivo. Per evitare di rielaborare i messaggi correttamente elaborati in un batch non riuscito, puoi configurare l'arricchimento o la destinazione in modo da restituire un oggetto che indichi quali messaggi hanno avuto esito positivo e quali non. Questa operazione è nota come risposta batch parziale.

Per ulteriori informazioni, consulta Errori batch parziali.

Condizioni di successo e di errore

Se restituisci una delle seguenti condizioni, EventBridge considera un batch come un successo completo:

  • Una batchItemFailure lista vuota

  • Un batchItemFailure elenco nullo

  • Un vuoto EventResponse

  • Un valore nullo EventResponse

Se restituisci una delle seguenti condizioni, EventBridge considera un batch come un completo fallimento:

  • Una stringa vuota itemIdentifier

  • Un valore nullo itemIdentifier

  • Un itemIdentifier con un nome chiave errato

EventBridge riprova gli errori in base alla strategia di ripetizione dei tentativi.