Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan Hudi CLI
Anda dapat menggunakan Hudi CLI untuk mengelola set data Hudi untuk melihat informasi tentang komit, filesystem, statistik, dan banyak lagi. Anda juga dapat menggunakan CLI untuk melakukan pemadatan, menjadwalkan pemadatan, atau membatalkan pemadatan dijadwalkan secara manual. Untuk informasi lebih lanjut, lihat Berinteraksi melalui CLI
Untuk memulai Hudi CLI dan terhubung ke set data
-
Connect ke simpul utama menggunakan SSH. Untuk informasi selengkapnya, lihat Connect ke simpul utama menggunakan SSH di Panduan Pengelolaan Amazon EMR.
-
Pada baris perintah, ketik
/usr/lib/hudi/cli/bin/hudi-cli.sh
.Prompt perintah berubah menjadi
hudi->
. -
Gunakan perintah berikut untuk menyambung ke dataset. Ganti
s3://amzn-s3-demo-bucket/myhudidataset
dengan jalur ke kumpulan data yang ingin Anda kerjakan. Nilai yang kita gunakan adalah sama dengan nilai yang ditetapkan dalam contoh sebelumnya.connect --path
s3://amzn-s3-demo-bucket/myhudidataset
Perintah akan berubah untuk menyertakan set data yang Anda gunakan, seperti ditunjukkan dalam contoh berikut.
hudi:
myhudidataset
->
Secara default, hudi-cli.sh
skrip di Amazon EMR rilis 7.3.0 menggunakan. hudi-cli-bundle.jar
Jika Anda mengalami masalah, Anda dapat beralih kembali ke CLI Hudi klasik dengan perintah berikut:
/usr/lib/hudi/cli/bin/hudi-cli.sh --cliBundle false
Perintah ini menjalankan hudi-cli.sh
skrip, menetapkan --cliBundle
bendera, dan menginstruksikan CLI untuk menggunakan file JAR individual alih-alih JAR yang dibundel. Secara default, --cliBundle
disetel ke true, yang berarti CLI menggunakan JAR yang dibundel sebagai gantinya.