Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Parámetros de conexión
En las siguientes tablas se detallan las propiedades de Python compatibles para AWS Glue las conexiones por banco de datos.
Parámetros de conexiones de Amazon Redshift
Las AWS Glue conexiones a Amazon Redshift admiten los siguientes parámetros de conexión de Python.
Clave | Tipo | Descripción | Restricciones | Obligatorio |
---|---|---|---|---|
auto_create |
Tipo: boolean |
Indica si se debe crear el usuario si no existe. El valor predeterminado es false . |
true , false |
No |
aws_secret_arn |
Tipo: string |
El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. | ARN válido | No |
cluster_identifier |
Tipo: string - maxLength: 63 |
El identificador de clúster del clúster de Amazon Redshift. | ^(?!.*—)[a-z][a-z0-9-]{0,61}[a-z0-9]$ | No |
database |
Tipo: string - maxLength: 127 |
Nombre de la base de datos a la que se va a conectar. | No | |
database_metadata_current_db_only |
Tipo: boolean |
Indica si la aplicación admite catálogos de recursos compartidos de datos de varias bases de datos. El valor predeterminado es true para indicar que la aplicación no admite catálogos de recursos compartidos de datos de varias bases de datos para compatibilidad con versiones anteriores. |
true , false |
No |
db_groups |
Tipo: string |
Una lista separada por comas de los nombres de grupos de bases de datos existentes que db_user une para la sesión actual. |
No | |
db_user |
Tipo: string |
El ID de usuario que se utilizará con Amazon Redshift. | No | |
host |
Tipo: string - maxLength: 256 |
El nombre del host del clúster de Amazon Redshift. | No | |
iam |
Tipo: boolean |
Marca para habilitar o deshabilitar la autenticación basada en IAM para una conexión. El valor predeterminado es false . |
true , false |
No |
iam_disable_cache |
Tipo: boolean |
Esta opción especifica si las credenciales de IAM se almacenan en caché. El valor predeterminado es true . De este modo, se mejora el rendimiento en los casos en que las solicitudes a la API Gateway tienen limitación controlada. |
true , false |
No |
max_prepared_statements |
Tipo: integer |
El número máximo de instrucciones preparadas que se pueden abrir a la vez. | No | |
numeric_to_float |
Decimal a flotante | Especifica si los valores NUMERIC de los tipos de datos se convertirán de decimales. Por defecto, los valores NUMERIC se reciben como objetos decimal.Decimal de Python. No se recomienda activar esta opción para los casos de uso en los que se prefiera la máxima precisión, ya que los resultados podrían redondearse. Consulte la documentación de Python en decimal.Decimal decimal.Decimal y float antes de habilitar esta opción. El valor predeterminado es false . |
true , false |
No |
port |
Tipo: integer |
El número de puerto del clúster de Amazon Redshift. | Rango: 1150-65535 | No |
profile |
Tipo: string - maxLength: 256 |
El nombre del perfil que contiene las credenciales y la configuración que utiliza AWS CLI. | No | |
region |
Tipo: string |
La AWS región en la que se encuentra el clúster. | AWS Región válida | No |
serverless_acct_id |
Tipo: string - maxLength: 256 |
El ID de AWS cuenta asociado al recurso sin servidor de Amazon Redshift. | No | |
serverless_work_group |
Tipo: string - maxLength: 256 |
El nombre del grupo de trabajo del punto de conexión de Amazon Redshift sin servidor. | No | |
ssl |
Tipo: boolean |
true si SSL está habilitado. |
true , false |
No |
ssl_mode |
Tipo: enum[verify-ca , verify-full , null]) |
La seguridad de la conexión a Amazon Redshift. Se admiten verify-ca (se debe utilizar SSL y se debe verificar el certificado del servidor) y verify-full (se debe usar SSL. Se debe verificar el certificado del servidor y el nombre de host del servidor debe ser igual al atributo de nombre de host del certificado). Para obtener más información, consulte Configuración de las opciones de seguridad para las conexiones en la documentación de Amazon Redshift. El valor predeterminado es verify-ca . |
verify-ca , verify-full |
No |
timeout |
Tipo: integer |
La cantidad de segundos antes de que la conexión al servidor se agote. | 0 | No |
Parámetros de conexión de Athena
Las conexiones a Athena admiten los siguientes parámetros de AWS Glue conexión de Python.
Clave | Tipo | Descripción | Restricciones | Obligatorio |
---|---|---|---|---|
aws_access_key_id |
Tipo: string - maxLength: 256 |
Especifica una clave de AWS acceso asociada a una cuenta de IAM. Recomendamos almacenar esta información en el aws_secret . |
Longitud: 16-128 | No |
aws_secret_access_key |
Tipo: string - maxLength: 256 |
Parte secreta de una clave de AWS acceso. Recomendamos almacenar esta información en el aws_secret . |
No | |
aws_secret_arn |
Tipo: string |
El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. | ARN válido | No |
catalog_name |
Tipo: string - maxLength: 256 |
El catálogo que contiene las bases de datos y las tablas a las que se accede con el controlador. Para obtener información sobre los catálogos, consulte DataCatalog. | No | |
duration_seconds |
Tipo: number |
La duración de la sesión del rol en segundos. Esta opción puede tener un valor comprendido entre 1 y 12 horas. De forma predeterminada, la duración está establecida en 3600 segundos (1 hora). | Oscila entre 900 segundos (15 minutos) y el valor de la duración máxima de la sesión para el rol. | No |
encryption_option |
Tipo: enum[SSE_S3 , SSE_KMS , CSE_KMS , null]) |
Cifrado en reposo para Amazon S3. Consulte la sección Cifrado en reposo en la Guía del usuario de Athena. | SSE_S3 , SSE_KMS , CSE_KMS |
No |
kms_key |
Tipo: string - maxLength: 256 |
AWS KMS clave si se usa CSE_KMS enencrytion_option . |
No | |
poll_interval |
Tipo: number |
Intervalo en segundos para sondear el estado de los resultados de la consulta en Athena. | No | |
profile_name |
Tipo: string - maxLength: 256 |
El nombre del perfil de AWS configuración cuyas credenciales deben usarse para autenticar la solicitud a Athena. | No | |
region_name |
Tipo: string |
La AWS región en la que se ejecutan las consultas. | AWS Región válida | No |
result_reuse_enable |
Tipo: boolean |
Habilite la reutilización del resultado de la consulta anterior. | true , false |
No |
result_reuse_minutes |
Tipo: integer |
Especifica, en minutos, la antigüedad máxima de un resultado de consulta anterior que Athena debe tener en cuenta para su reutilización. El valor predeterminado es 60. | >= 1 | No |
role_arn |
Tipo: string |
El rol que se utilizará para ejecutar consultas. | ARN válido | No |
schema_name |
Tipo: string - maxLength: 256 |
Nombre del esquema predeterminado que se va a usar en la base de datos. | No | |
s3_staging_dir |
Tipo: string - maxLength: 1024 |
La ubicación en Amazon S3 en la que se almacenan los resultados de las consultas. | Se necesita s3_staging_dir o work_group |
|
work_group |
Tipo: string |
El grupo de trabajo en el que se ejecutarán las consultas. Para obtener información sobre los grupos de trabajo, consulte WorkGroup. | ^[a-zA-Z0-9._-]{1,128}$ | Se necesita s3_staging_dir o work_group |
Parámetros de conexión de Snowflake
Las conexiones a Snowflake admiten los siguientes parámetros de AWS Glue conexión de Python.
Parámetros de conexión de Snowflake
Clave | Tipo | Descripción | Restricciones | Obligatorio |
---|---|---|---|---|
account |
Tipo: string - maxLength: 256 |
El identificador de la cuenta de Snowflake. El identificador de la cuenta no incluye el sufijo snowflakecomputing.com . |
Sí | |
arrow_number_to_decimal |
Tipo: boolean |
De forma predeterminada, es False, lo que significa que los valores de la columna NUMBER se devuelven como números de coma flotante de doble precisión (float64 ). Establézcalo en True para devolver los valores de las columnas DECIMAL como números decimales (decimal.Decimal ) al llamar a los métodos fetch_pandas_all() y fetch_pandas_batches() . |
true , false |
No |
autocommit |
Tipo: boolean |
El valor predeterminado es false , lo que respeta el parámetro de Snowflake AUTOCOMMIT . Configúrelo en true o false para habilitar o deshabilitar el modo autocommit en la sesión, respectivamente. |
true , false |
No |
aws_secret_arn |
Tipo: string |
El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. | ARN válido | No |
client_prefetch_threads |
Tipo: integer |
El número de subprocesos utilizados para descargar los conjuntos de resultados (4 de manera predeterminada). Si se aumenta el valor, se mejora el rendimiento de la búsqueda, pero se requiere más memoria. | No | |
database |
Tipo: string - maxLength: 256 |
El nombre de la base de datos predeterminada que se va a utilizar. | No | |
login_timeout |
Tipo: integer |
El tiempo de espera en segundos para la solicitud de inicio de sesión. El valor predeterminado es de 60 segundos. La solicitud de inicio de sesión se cancela una vez transcurrido el tiempo de espera si la respuesta de HTTP no es success . |
No | |
network_timeout |
Tipo: integer |
El tiempo de espera en segundos para todas las demás operaciones. El valor predeterminado es none (infinito). Una solicitud general se cancela una vez transcurrido el tiempo de espera si la respuesta de HTTP no es success . |
No | |
paramstyle |
Tipo: string - maxLength: 256 |
Sintaxis de los marcadores de posición utilizados para la sustitución de parámetros al ejecutar consultas de SQL desde el código de Python. El valor predeterminado es pyformat para la vinculación en el cliente. Especifique qmark o numeric para cambiar los formatos de las variables de enlace para el enlace en el servidor. |
No | |
role |
Tipo: string - maxLength: 256 |
El nombre del rol predeterminado que se debe utilizar. | No | |
schema |
Tipo: string - maxLength: 256 |
El nombre del esquema predeterminado que se va a usar en la base de datos. | No | |
timezone |
Tipo: string - maxLength: 128 |
Es Ninguno de manera predeterminada para respetar el parámetro de Snowflake TIMEZONE . Configúrelo en una zona horaria válida (por ejemplo, America/Los_Angeles ) para establecer la zona horaria de la sesión. |
Zona horaria en un formato similar a America/Los_Angeles |
No |
validate_default_parameters |
Tipo: boolean |
Configúrelo en true para generar una excepción si la base de datos, el esquema o el almacén especificados no existen. El valor predeterminado es false . |
No | |
warehouse |
Tipo: string - maxLength: 256 |
El nombre del almacén predeterminado que se debe utilizar. | No |