As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Concluir a ação de refragmentação
Após qualquer tipo de procedimento de refragmentação no Amazon Kinesis Data Streams e antes de retomar o processamento normal de registros, é necessário realizar outros procedimentos e fazer algumas considerações. As seções a seguir descrevem esses itens.
Tópicos
Aguardar um fluxo ficar ativo novamente
Depois de chamar uma operação de refragmentação, splitShard
ou mergeShards
, deve-se esperar o fluxo ficar ativo novamente. O código a ser usado é o mesmo de quando espera-se que um fluxo se torne ativo após a criação de um fluxo. Esse código é o seguinte:
DescribeStreamRequest describeStreamRequest = new DescribeStreamRequest(); describeStreamRequest.setStreamName( myStreamName ); long startTime = System.currentTimeMillis(); long endTime = startTime + ( 10 * 60 * 1000 ); while ( System.currentTimeMillis() < endTime ) { try { Thread.sleep(20 * 1000); } catch ( Exception e ) {} try { DescribeStreamResult describeStreamResponse = client.describeStream( describeStreamRequest ); String streamStatus = describeStreamResponse.getStreamDescription().getStreamStatus(); if ( streamStatus.equals( "ACTIVE" ) ) { break; } // // sleep for one second // try { Thread.sleep( 1000 ); } catch ( Exception e ) {} } catch ( ResourceNotFoundException e ) {} } if ( System.currentTimeMillis() >= endTime ) { throw new RuntimeException( "Stream " + myStreamName + " never went active" ); }
Considerar o roteamento de dados, a persistência de dados e o estado do fragmento após uma refragmentação
O Kinesis Data Streams é um serviço de fluxo de dados em tempo real. Seus aplicativos devem pressupor que os dados fluem continuamente pelos fragmentos do fluxo. Ao refragmentar, os registros de dados que estavam fluindo para os fragmentos pais são re-roteados para fluírem para os fragmentos filhos com base nos valores de chave de hash para as quais são mapeadas as chaves de partição de registro de dados. No entanto, os registros de dados que estavam nos fragmentos pais antes da refragmentação permanecem nesses fragmentos. Os fragmentos principais não desaparecem quando a refragmentação ocorre. Eles persistem com os dados que continham antes da refragmentação. Os registros de dados nos fragmentos principais podem ser acessados usando as getRecords
operações getShardIteratore no Kinesis Data API Streams ou por meio da Kinesis Client Library.
nota
Os registros de dados podem ser acessados a partir do momento em que são adicionados ao fluxo até o período de retenção atual. Isso é verdadeiro independentemente de quaisquer alterações aos fragmentos no fluxo durante esse período. Para obter mais informações sobre o período de retenção de um stream, consulte Alterar o período de retenção de dados.
No processo de refragmentação, um fragmento pai passa de um estado OPEN
para um estado CLOSED
para um estado EXPIRED
.
-
OPEN: antes de uma operação de refragmentação, um fragmento principal está no
OPEN
estado, o que significa que os registros de dados podem ser adicionados ao fragmento e recuperados do fragmento. -
CLOSED: após uma operação de refragmentação, o fragmento principal passa para um estado.
CLOSED
Isso significa que os registros de dados não são mais adicionados ao fragmento. Os registros de dados que foram adicionados a esse fragmento agora são adicionados a um fragmento filho. No entanto, os registros de dados ainda podem ser recuperados do fragmento por tempo limitado. -
EXPIRED: após o término do período de retenção do stream, todos os registros de dados no fragmento principal expiram e não estão mais acessíveis. Neste momento, o próprio fragmento muda para um estado
EXPIRED
. As chamadas agetStreamDescription().getShards
para enumerar os fragmentos no fluxo não incluem os fragmentosEXPIRED
na lista de fragmentos retornados. Para obter mais informações sobre o período de retenção de um stream, consulte Alterar o período de retenção de dados.
Depois da refragmentação, com o fluxo novamente em um estado ACTIVE
, é possível iniciar imediatamente a leitura de dados dos fragmentos filhos. No entanto, os fragmentos principais que permanecem após a refragmentação ainda podem conter dados que ainda não foram lidos e foram adicionados ao fluxo antes da refragmentação. Ao ler dados de fragmentos filhos antes ler todos os dados dos fragmentos pais, pode-se ler dados de uma determinada chave de hash fora da ordem determinada pelos números sequenciais dos registros de dados. Portanto, pressupondo que a ordem dos dados é importante, é necessário, após uma refragmentação, sempre continuar lendo dados dos fragmentos pais até esgotá-los. Só depois deve-se começar a ler dados dos fragmentos filhos. Quando getRecordsResult.getNextShardIterator
retorna null
, indica que todos os dados no fragmento pai foram lidos.