Carga de archivos en Amazon S3 para utilizar con COPY - Amazon Redshift

Carga de archivos en Amazon S3 para utilizar con COPY

Hay un par de enfoques que se deben adoptar cuando se carguen archivos de texto en Amazon S3:

  • Si tiene archivos comprimidos, le recomendamos que divida los archivos de gran tamaño para aprovechar los beneficios del procesamiento en paralelo en Amazon Redshift.

  • Por otro lado, COPY divide automáticamente los datos de archivos de texto de gran tamaño que estén delimitados y sin comprimir para facilitar el paralelismo y distribuir eficazmente los datos de archivos de gran tamaño.

Cree un bucket de Amazon S3 para que contenga sus archivos de datos y, luego, cargue los archivos de datos en él. Para obtener más información acerca de la creación de buckets y la carga de archivos, consulte Trabajo con buckets de Amazon S3 en la Guía del usuario de Amazon Simple Storage Service.

importante

El bucket de Amazon S3 que tiene los archivos de datos debe crearse en la misma región de AWS que el clúster, a menos que use la opción REGION para especificar la región en la que se encuentra el bucket de Amazon S3.

Asegúrese de que los rangos de IP de S3 estén agregados a la lista de permitidos. Para obtener más información acerca de los rangos de IP de S3 necesarios, consulte Aislamiento de red.

Puede crear un bucket de Amazon S3 en una región específica. Para ello, seleccione la región mientras crea el bucket con la consola de Amazon S3 o especifique un punto de conexión mientras crea el bucket con la CLI o la API de Amazon S3.

Luego de la carga de los datos, corrobore que los archivos presentes en Amazon S3 sean los correctos.