Il servizio gestito da Amazon per Apache Flink era precedentemente noto come Analisi dei dati Amazon Kinesis per Apache Flink.
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Disallineamento dei dati
Un'applicazione Flink viene eseguita su un cluster in modo distribuito. Per impiegare la scalabilità orizzontale su più nodi Flink utilizza il concetto di flussi con chiave, il che significa che gli eventi di un flusso vengono partizionati in base a una chiave specifica, ad esempio l'ID del cliente, per cui Flink può elaborare diverse partizioni su nodi diversi. Molti operatori Flink vengono quindi valutati sulla base di queste partizioni, ad esempio Keyed Windows
La scelta di una chiave di partizione dipende spesso dalla logica commerciale. Al contempo, molte delle best practice per DynamoDB
garantire un'elevata cardinalità delle chiavi di partizione;
evitare il disallineamento tra le partizioni del volume degli eventi.
È possibile identificare i disallineamenti nelle partizioni confrontando i record delle attività secondarie che siano stati ricevuti/inviati (ad esempio, istanze dello stesso operatore) nella dashboard di Flink. Inoltre, il monitoraggio del servizio gestito per Apache Flink può essere configurato per mostrare le metriche relative a numRecordsIn/Out
e numRecordsInPerSecond/OutPerSecond
anche per quanto riguarda le attività secondarie.