Hudi 사용 CLI - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Hudi 사용 CLI

HudiCLI를 사용하여 Hudi 데이터 세트를 관리하여 커밋, 파일 시스템, 통계 등에 대한 정보를 볼 수 있습니다. 를 사용하여 압축CLI을 수동으로 수행하거나 압축을 예약하거나 예약된 압축을 취소할 수도 있습니다. 자세한 내용은 Apache Hudi 설명서의 를 통한 상호 작용을 CLI 참조하세요.

Hudi를 시작하고 데이터 세트에 CLI 연결하려면
  1. 를 사용하여 마스터 노드에 연결합니다SSH. 자세한 내용은 Amazon EMR 관리 안내서의 를 사용하여 마스터 노드에 연결을 SSH 참조하세요.

  2. 명령줄에 /usr/lib/hudi/cli/bin/hudi-cli.sh를 입력합니다.

    명령 프롬프트가 이렇게 바뀝니다. hudi->

  3. 다음 코드를 입력하여 데이터 세트에 연결합니다. Replace s3://amzn-s3-demo-bucket/myhudidataset 작업하려는 데이터 세트의 경로가 있습니다. 여기서 사용하는 값은 이전 예에서 설정한 값과 동일합니다.

    connect --path s3://amzn-s3-demo-bucket/myhudidataset

    다음 예와 같이 연결한 데이터 세트를 포함하도록 명령 프롬프트가 변경됩니다.

    hudi:myhudidataset->