Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Descarga de datos semiestructurados - Amazon Redshift

Descarga de datos semiestructurados

Con Amazon Redshift, puede exportar datos semiestructurados del clúster de Amazon Redshift a Amazon S3 en una variedad de formatos, incluidos texto, Apache Parquet, Apache ORC y Avro. En las siguientes secciones, se le guiará a través del proceso de configuración y ejecución de operaciones de descarga para los datos semiestructurados en Amazon Redshift.

CSV or text formats

Puede descargar tablas con columnas de datos SUPER en Amazon S3 en un formato de valores separados por comas (CSV) o de texto. Mediante una combinación de cláusulas de navegación y eliminación de anidamiento, Amazon Redshift descarga datos jerárquicos en formato de datos SUPER en Amazon S3 en formato CSV o de texto. Posteriormente, puede crear tablas externas para los datos descargados y consultarlas con Redshift Spectrum. Para obtener más información acerca del uso de UNLOAD y de los permisos de IAM necesarios, consulte UNLOAD.

Antes de ejecutar el siguiente ejemplo, rellene la tabla region_nations siguiendo los procesos de Carga de datos semiestructurados en Amazon Redshift. Para obtener información acerca de las tablas utilizadas en los ejemplos siguientes, consulte Conjunto de datos de muestra SUPER.

En el siguiente ejemplo, se descargan datos en Amazon S3.

UNLOAD ('SELECT * FROM region_nations') TO 's3://xxxxxx/' IAM_ROLE 'arn:aws:iam::xxxxxxxxxxxx:role/Redshift-S3-Write' DELIMITER AS '|' GZIP ALLOWOVERWRITE;

A diferencia de otros tipos de datos en los que una cadena definida por el usuario representa un valor nulo, Amazon Redshift exporta las columnas de datos SUPER mediante el formato JSON y lo representa como nulo, de acuerdo con lo determinado por el formato JSON. Como resultado, las columnas de datos SUPER ignoran la opción NULL [AS] utilizada en los comandos UNLOAD.

Parquet format

Puede descargar tablas con columnas de datos SUPER en Amazon S3 en formato Parquet. Amazon Redshift representa las columnas SUPER en Parquet como el tipo de datos JSON. Esto permite representar datos semiestructurados en Parquet. Puede consultar estas columnas con Redshift Spectrum o volver a introducirlas en Amazon Redshift con el comando COPY. Para obtener más información acerca del uso de UNLOAD y de los permisos de IAM necesarios, consulte UNLOAD.

En el siguiente ejemplo, se descargan datos en Amazon S3 con formato Parquet.

UNLOAD ('SELECT * FROM region_nations') TO 's3://xxxxxx/' IAM_ROLE 'arn:aws:iam::xxxxxxxxxxxx:role/Redshift-S3-Write' FORMAT PARQUET;

Puede descargar tablas con columnas de datos SUPER en Amazon S3 en un formato de valores separados por comas (CSV) o de texto. Mediante una combinación de cláusulas de navegación y eliminación de anidamiento, Amazon Redshift descarga datos jerárquicos en formato de datos SUPER en Amazon S3 en formato CSV o de texto. Posteriormente, puede crear tablas externas para los datos descargados y consultarlas con Redshift Spectrum. Para obtener más información acerca del uso de UNLOAD y de los permisos de IAM necesarios, consulte UNLOAD.

Antes de ejecutar el siguiente ejemplo, rellene la tabla region_nations siguiendo los procesos de Carga de datos semiestructurados en Amazon Redshift. Para obtener información acerca de las tablas utilizadas en los ejemplos siguientes, consulte Conjunto de datos de muestra SUPER.

En el siguiente ejemplo, se descargan datos en Amazon S3.

UNLOAD ('SELECT * FROM region_nations') TO 's3://xxxxxx/' IAM_ROLE 'arn:aws:iam::xxxxxxxxxxxx:role/Redshift-S3-Write' DELIMITER AS '|' GZIP ALLOWOVERWRITE;

A diferencia de otros tipos de datos en los que una cadena definida por el usuario representa un valor nulo, Amazon Redshift exporta las columnas de datos SUPER mediante el formato JSON y lo representa como nulo, de acuerdo con lo determinado por el formato JSON. Como resultado, las columnas de datos SUPER ignoran la opción NULL [AS] utilizada en los comandos UNLOAD.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.