Use o Hudi CLI - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use o Hudi CLI

Você pode usar o Hudi CLI para administrar conjuntos de dados Hudi para visualizar informações sobre confirmações, sistema de arquivos, estatísticas e muito mais. Você também pode usar o CLI para realizar compactações manualmente, programar compactações ou cancelar compactações programadas. Para obter mais informações, consulte Interagindo via CLI na documentação do Apache Hudi.

Para iniciar o Hudi CLI e conectar-se a um conjunto de dados
  1. Conecte-se ao nó principal usando SSH o. Para obter mais informações, consulte Conecte-se ao nó principal usando SSH o Amazon EMR Management Guide.

  2. Na linha de comando, digite /usr/lib/hudi/cli/bin/hudi-cli.sh.

    O prompt de comando muda para hudi->.

  3. Digite o seguinte código para se conectar a um conjunto de dados. Substituir s3://DOC-EXAMPLE-BUCKET/myhudidataset com o caminho para o conjunto de dados com o qual você deseja trabalhar. O valor que usamos é o mesmo estabelecido em exemplos anteriores.

    connect --path s3://DOC-EXAMPLE-BUCKET/myhudidataset

    O prompt de comando é alterado para incluir o conjunto de dados ao qual você está conectado, conforme mostrado no exemplo a seguir.

    hudi:myhudidataset->