COPY와 함께 사용할 파일을 Amazon S3에 업로드 - Amazon Redshift

COPY와 함께 사용할 파일을 Amazon S3에 업로드

Amazon S3에 텍스트 파일을 업로드할 때 취할 수 있는 몇 가지 접근 방식이 있습니다.

  • 압축 파일이 있는 경우 Amazon Redshift에서 병렬 처리를 최대한 활용하려면 대용량 파일을 분할하는 것이 좋습니다.

  • 반면에 COPY는 압축되지 않은 텍스트로 구분된 대용량 파일 데이터를 자동으로 분할하여 병렬 처리를 용이하게 하고 대용량 파일의 데이터를 효과적으로 배포합니다.

데이터 파일을 보관할 Amazon S3 버킷을 생성한 다음 이 버킷에 데이터 파일을 업로드합니다. 버킷 생성 및 파일 업로드에 대한 자세한 내용은 Amazon Simple Storage Service 사용 설명서Amazon S3 버킷을 사용한 작업을 참조하세요.

중요

데이터 파일을 보관하는 Amazon S3 버킷은 REGION 옵션을 사용하여 Amazon S3 버킷이 위치한 리전을 지정하지 않는 한 클러스터와 동일한 AWS 리전에서 생성해야 합니다.

S3 IP 범위가 허용 목록에 추가되었는지 확인합니다. 필요한 S3 IP 범위에 대한 자세한 내용은 네트워크 격리를 참조하세요.

Amazon S3 콘솔을 사용하여 버킷을 생성할 때 리전을 선택하거나 Amazon S3 API 또는 CLI를 사용하여 버킷을 생성할 때 엔드포인트를 지정하여 특정 리전에서 Amazon S3 버킷을 생성할 수 있습니다.

데이터 로드 후 Amazon S3에 올바른 파일이 존재하는지 확인합니다.