COPY JOB (versión preliminar) - Amazon Redshift

COPY JOB (versión preliminar)

Esta es la documentación preliminar de la copia automática (SQL COPY JOB), que se encuentra en versión preliminar. Tanto la documentación como la característica quedan sujetas a cambios. Se recomienda utilizar esta característica solo en entornos de prueba y no en entornos de producción. La versión preliminar pública finalizará el 31 de octubre de 2024. Los clústeres de la versión preliminar se eliminarán automáticamente dos semanas después de que finalice la versión preliminar. Para conocer los términos y condiciones de las versiones preliminares, consulte Betas y versiones preliminares en Términos de servicio de AWS.

Para obtener información sobre cómo utilizar este comando en la versión preliminar, consulte Carga de archivos con ingesta continua de archivos desde Amazon S3 (versión preliminar).

Administra los comandos COPY que cargan datos en una tabla. El comando COPY JOB es una extensión del comando COPY y automatiza la carga de datos desde buckets de Amazon S3. Al crear un trabajo COPY, Amazon Redshift detecta cuándo se crean nuevos archivos de Amazon S3 en una ruta especificada y, a continuación, los carga automáticamente sin su intervención. Al cargar los datos se utilizan los mismos parámetros que en el comando COPY original. Amazon Redshift realiza un seguimiento de los archivos cargados para verificar que se cargan solo una vez.

nota

Para obtener información sobre el comando COPY, como su uso, parámetros y permisos, consulte COPY.

Permiso necesario

Para ejecutar el comando COPY de COPY JOB, debe tener privilegios INSERT de la tabla que se va a cargar.

El rol de IAM especificado con el comando COPY debe tener permiso para acceder a los datos que se van a cargar. Para obtener más información, consulte Permisos de IAM para COPY, UNLOAD y CREATE LIBRARY.

Sintaxis

Crear un trabajo de copia. Los parámetros del comando COPY se guardan con el trabajo de copia.

COPY copy-command JOB CREATE job-name [AUTO ON | OFF]

Cambiar la configuración de un trabajo de copia.

COPY JOB ALTER job-name [AUTO ON | OFF]

Ejecutar un trabajo de copia. Se utilizan los parámetros del comando COPY almacenados.

COPY JOB RUN job-name

Enumerar todos los trabajos de copia.

COPY JOB LIST

Mostrar los detalles de un trabajo de copia.

COPY JOB SHOW job-name

Eliminar un trabajo de copia.

COPY JOB DROP job-name

Parámetros

copy-command

Un comando COPY que carga datos desde Amazon S3 en Amazon Redshift. La cláusula contiene los parámetros COPY que definen el bucket de Amazon S3, la tabla de destino, el rol de IAM y otros parámetros que se utilizan al cargar datos. Se admiten todos los parámetros del comando COPY para una carga de datos de Amazon S3, con las siguientes excepciones:

  • COPY JOB no ingiere archivos preexistentes en la carpeta a la que apunta el comando COPY. Solo se ingieren los archivos creados después de la marca de tiempo de creación de COPY JOB.

  • No puede especificar un comando COPY con las opciones MAXERROR o IGNOREALLERRORS.

  • No puede especificar un archivo de manifiesto. COPY JOB requiere una ubicación de Amazon S3 designada para supervisar los archivos recién creados.

  • No puede especificar un comando COPY con tipos de autorización como Acceso y Claves secretas. Solo se admiten los comandos COPY que utilizan el parámetro IAM_ROLE para la autorización. Para obtener más información, consulte Parámetros de autorización.

  • COPY JOB no admite el rol de IAM predeterminado asociado al clúster. Debe especificar IAM_ROLE en el comando COPY.

Para obtener más información, consulte COPY de Amazon S3.

job-name

El nombre del trabajo que se usa para hacer referencia al trabajo COPY.

[AUTO ON | OFF]

Cláusula que indica si los datos de Amazon S3 se cargan automáticamente en las tablas de Amazon Redshift.

  • Si es ON, Amazon Redshift supervisa la ruta de origen de Amazon S3 en busca de archivos recién creados y, si los encuentra, se ejecuta un comando COPY con los parámetros de COPY en la definición del trabajo. Esta es la opción predeterminada.

  • Si es OFF, Amazon Redshift no ejecuta COPY JOB automáticamente.

Notas de uso

Las opciones del comando COPY no se validan hasta el momento de la ejecución. Por ejemplo, un IAM_ROLE no válido o un origen de datos de Amazon S3 provoca errores de ejecución cuando se inicia COPY JOB.

Si el clúster está en pausa, no se ejecutan los comandos COPY JOB.

Para consultar los archivos del comando COPY cargados y los errores de carga, consulte STL_LOAD_COMMITS, STL_LOAD_ERRORS y STL_LOADERROR_DETAIL. Para obtener más información, consulte Comprobación de carga correcta de datos.

Ejemplos

En el siguiente ejemplo se muestra la creación de un trabajo COPY JOB para cargar datos de un bucket de Amazon S3.

COPY public.target_table FROM 's3://amzn-s3-demo-bucket/staging-folder' IAM_ROLE 'arn:aws:iam::123456789012:role/MyLoadRoleName' JOB CREATE my_copy_job_name AUTO ON;