Utilisez le Hudi CLI - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisez le Hudi CLI

Vous pouvez utiliser le Hudi CLI pour administrer des ensembles de données Hudi afin d'afficher des informations sur les validations, le système de fichiers, les statistiques, etc. Vous pouvez également utiliser le CLI pour effectuer manuellement des compactages, planifier des compactages ou annuler des compactages planifiés. Pour plus d'informations, consultez Interaction via CLI dans la documentation d'Apache Hudi.

Pour démarrer le Hudi CLI et se connecter à un jeu de données
  1. Connectez-vous au nœud principal à l'aide deSSH. Pour plus d'informations, consultez Connect to the master node SSH à l'aide de l'Amazon EMR Management Guide.

  2. Sur la ligne de commande, tapez /usr/lib/hudi/cli/bin/hudi-cli.sh.

    L'invite de commande devient hudi->.

  3. Tapez le code suivant pour vous connecter à un ensemble de données. Remplacez s3://amzn-s3-demo-bucket/myhudidataset avec le chemin d'accès au jeu de données avec lequel vous souhaitez travailler. La valeur que nous utilisons est la même que la valeur établie dans les exemples précédents.

    connect --path s3://amzn-s3-demo-bucket/myhudidataset

    L'invite de commandes change pour inclure l'ensemble de données auquel vous êtes connecté, comme illustré dans l'exemple suivant.

    hudi:myhudidataset->