Uso de tablas del Catálogo de datos para el origen de datos
En todos los orígenes de datos, excepto Amazon S3 y los conectores, debe existir una tabla en el AWS Glue Data Catalog para el tipo de fuente que elija. AWS Glue no crea la tabla del Catálogo de datos.
Para configurar un nodo de origen de datos en función de una tabla del Catálogo de datos
-
Vaya al editor visual para acceder a un trabajo nuevo o guardado.
-
Elija un nodo de origen de datos en el diagrama de trabajo.
-
Elija la pestaña Data source properties (Propiedades de origen de datos) y, a continuación, escriba la información siguiente:
-
S3 source type (Tipo de origen S3): (solo para orígenes de datos de Amazon S3) elija la opción Select a Catalog table (Seleccionar una tabla del catálogo) para utilizar una tabla del AWS Glue Data Catalog existente.
-
Database (Base de datos): elija la base de datos del Catálogo de datos que contiene la tabla de origen que desea utilizar para este trabajo. Puede utilizar el campo de búsqueda para buscar una base de datos por su nombre.
-
Table (Tabla): elija la tabla asociada a los datos de origen de la lista. Esta tabla ya debe existir en AWS Glue Data Catalog. Puede utilizar el campo de búsqueda para buscar una tabla por su nombre.
-
Partition predicate (Predicado de partición): (sólo para orígenes de datos de Amazon S3) ingrese una expresión booleana basada en Spark SQL que incluya sólo las columnas de partición. Por ejemplo:
"(year=='2020' and month=='04')"
. -
Temporary directory (Directorio temporal): (sólo para orígenes de datos de Amazon Redshift) ingrese una ruta de acceso para la ubicación de un directorio de trabajo en Amazon S3 donde su trabajo de ETL puede escribir resultados intermedios temporales.
-
Role associated with the cluster (Rol asociado al clúster): (sólo para orígenes de datos de Amazon Redshift) ingrese un rol para que utilice su trabajo de ETL que contenga permisos para clústeres de Amazon Redshift. Para obtener más información, consulte Permisos de origen de datos y destino de datos.
-