Parámetros de conexión - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Parámetros de conexión

En las siguientes tablas se detallan las propiedades de Python compatibles para AWS Glue las conexiones por banco de datos.

Parámetros de conexiones de Amazon Redshift

Las AWS Glue conexiones a Amazon Redshift admiten los siguientes parámetros de conexión de Python.

Clave Tipo Descripción Restricciones Obligatorio
auto_create Tipo: boolean Indica si se debe crear el usuario si no existe. El valor predeterminado es false. true, false No
aws_secret_arn Tipo: string El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. ARN válido No
cluster_identifier Tipo: string - maxLength: 63 El identificador de clúster del clúster de Amazon Redshift. ^(?!.*—)[a-z][a-z0-9-]{0,61}[a-z0-9]$ No
database Tipo: string - maxLength: 127 Nombre de la base de datos a la que se va a conectar. No
database_metadata_current_db_only Tipo: boolean Indica si la aplicación admite catálogos de recursos compartidos de datos de varias bases de datos. El valor predeterminado es true para indicar que la aplicación no admite catálogos de recursos compartidos de datos de varias bases de datos para compatibilidad con versiones anteriores. true, false No
db_groups Tipo: string Una lista separada por comas de los nombres de grupos de bases de datos existentes que db_user une para la sesión actual. No
db_user Tipo: string El ID de usuario que se utilizará con Amazon Redshift. No
host Tipo: string - maxLength: 256 El nombre del host del clúster de Amazon Redshift. No
iam Tipo: boolean Marca para habilitar o deshabilitar la autenticación basada en IAM para una conexión. El valor predeterminado es false. true, false No
iam_disable_cache Tipo: boolean Esta opción especifica si las credenciales de IAM se almacenan en caché. El valor predeterminado es true. De este modo, se mejora el rendimiento en los casos en que las solicitudes a la API Gateway tienen limitación controlada. true, false No
max_prepared_statements Tipo: integer El número máximo de instrucciones preparadas que se pueden abrir a la vez. No
numeric_to_float Decimal a flotante Especifica si los valores NUMERIC de los tipos de datos se convertirán de decimales. Por defecto, los valores NUMERIC se reciben como objetos decimal.Decimal de Python. No se recomienda activar esta opción para los casos de uso en los que se prefiera la máxima precisión, ya que los resultados podrían redondearse. Consulte la documentación de Python en decimal.Decimal para conocer las ventajas y desventajas de decimal.Decimal y float antes de habilitar esta opción. El valor predeterminado es false. true, false No
port Tipo: integer El número de puerto del clúster de Amazon Redshift. Rango: 1150-65535 No
profile Tipo: string - maxLength: 256 El nombre del perfil que contiene las credenciales y la configuración que utiliza AWS CLI. No
region Tipo: string La AWS región en la que se encuentra el clúster. AWS Región válida No
serverless_acct_id Tipo: string - maxLength: 256 El ID de AWS cuenta asociado al recurso sin servidor de Amazon Redshift. No
serverless_work_group Tipo: string - maxLength: 256 El nombre del grupo de trabajo del punto de conexión de Amazon Redshift sin servidor. No
ssl Tipo: boolean true si SSL está habilitado. true, false No
ssl_mode Tipo: enum[verify-ca, verify-full, null]) La seguridad de la conexión a Amazon Redshift. Se admiten verify-ca (se debe utilizar SSL y se debe verificar el certificado del servidor) y verify-full (se debe usar SSL. Se debe verificar el certificado del servidor y el nombre de host del servidor debe ser igual al atributo de nombre de host del certificado). Para obtener más información, consulte Configuración de las opciones de seguridad para las conexiones en la documentación de Amazon Redshift. El valor predeterminado es verify-ca. verify-ca, verify-full No
timeout Tipo: integer La cantidad de segundos antes de que la conexión al servidor se agote. 0 No

Parámetros de conexión de Athena

Las conexiones a Athena admiten los siguientes parámetros de AWS Glue conexión de Python.

Clave Tipo Descripción Restricciones Obligatorio
aws_access_key_id Tipo: string - maxLength: 256 Especifica una clave de AWS acceso asociada a una cuenta de IAM. Recomendamos almacenar esta información en el aws_secret. Longitud: 16-128 No
aws_secret_access_key Tipo: string - maxLength: 256 Parte secreta de una clave de AWS acceso. Recomendamos almacenar esta información en el aws_secret. No
aws_secret_arn Tipo: string El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. ARN válido No
catalog_name Tipo: string - maxLength: 256 El catálogo que contiene las bases de datos y las tablas a las que se accede con el controlador. Para obtener información sobre los catálogos, consulte DataCatalog. No
duration_seconds Tipo: number La duración de la sesión del rol en segundos. Esta opción puede tener un valor comprendido entre 1 y 12 horas. De forma predeterminada, la duración está establecida en 3600 segundos (1 hora). Oscila entre 900 segundos (15 minutos) y el valor de la duración máxima de la sesión para el rol. No
encryption_option Tipo: enum[SSE_S3, SSE_KMS, CSE_KMS, null]) Cifrado en reposo para Amazon S3. Consulte la sección Cifrado en reposo en la Guía del usuario de Athena. SSE_S3, SSE_KMS, CSE_KMS No
kms_key Tipo: string - maxLength: 256 AWS KMS clave si se usa CSE_KMS enencrytion_option. No
poll_interval Tipo: number Intervalo en segundos para sondear el estado de los resultados de la consulta en Athena. No
profile_name Tipo: string - maxLength: 256 El nombre del perfil de AWS configuración cuyas credenciales deben usarse para autenticar la solicitud a Athena. No
region_name Tipo: string La AWS región en la que se ejecutan las consultas. AWS Región válida No
result_reuse_enable Tipo: boolean Habilite la reutilización del resultado de la consulta anterior. true, false No
result_reuse_minutes Tipo: integer Especifica, en minutos, la antigüedad máxima de un resultado de consulta anterior que Athena debe tener en cuenta para su reutilización. El valor predeterminado es 60. >= 1 No
role_arn Tipo: string El rol que se utilizará para ejecutar consultas. ARN válido No
schema_name Tipo: string - maxLength: 256 Nombre del esquema predeterminado que se va a usar en la base de datos. No
s3_staging_dir Tipo: string - maxLength: 1024 La ubicación en Amazon S3 en la que se almacenan los resultados de las consultas. Se necesita s3_staging_dir o work_group
work_group Tipo: string El grupo de trabajo en el que se ejecutarán las consultas. Para obtener información sobre los grupos de trabajo, consulte WorkGroup. ^[a-zA-Z0-9._-]{1,128}$ Se necesita s3_staging_dir o work_group

Parámetros de conexión de Snowflake

Las conexiones a Snowflake admiten los siguientes parámetros de AWS Glue conexión de Python.

Parámetros de conexión de Snowflake

Clave Tipo Descripción Restricciones Obligatorio
account Tipo: string - maxLength: 256 El identificador de la cuenta de Snowflake. El identificador de la cuenta no incluye el sufijo snowflakecomputing.com.
arrow_number_to_decimal Tipo: boolean De forma predeterminada, es False, lo que significa que los valores de la columna NUMBER se devuelven como números de coma flotante de doble precisión (float64). Establézcalo en True para devolver los valores de las columnas DECIMAL como números decimales (decimal.Decimal) al llamar a los métodos fetch_pandas_all() y fetch_pandas_batches(). true, false No
autocommit Tipo: boolean El valor predeterminado es false, lo que respeta el parámetro de Snowflake AUTOCOMMIT. Configúrelo en true o false para habilitar o deshabilitar el modo autocommit en la sesión, respectivamente. true, false No
aws_secret_arn Tipo: string El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. ARN válido No
client_prefetch_threads Tipo: integer El número de subprocesos utilizados para descargar los conjuntos de resultados (4 de manera predeterminada). Si se aumenta el valor, se mejora el rendimiento de la búsqueda, pero se requiere más memoria. No
database Tipo: string - maxLength: 256 El nombre de la base de datos predeterminada que se va a utilizar. No
login_timeout Tipo: integer El tiempo de espera en segundos para la solicitud de inicio de sesión. El valor predeterminado es de 60 segundos. La solicitud de inicio de sesión se cancela una vez transcurrido el tiempo de espera si la respuesta de HTTP no es success. No
network_timeout Tipo: integer El tiempo de espera en segundos para todas las demás operaciones. El valor predeterminado es none (infinito). Una solicitud general se cancela una vez transcurrido el tiempo de espera si la respuesta de HTTP no es success. No
paramstyle Tipo: string - maxLength: 256 Sintaxis de los marcadores de posición utilizados para la sustitución de parámetros al ejecutar consultas de SQL desde el código de Python. El valor predeterminado es pyformat para la vinculación en el cliente. Especifique qmark o numeric para cambiar los formatos de las variables de enlace para el enlace en el servidor. No
role Tipo: string - maxLength: 256 El nombre del rol predeterminado que se debe utilizar. No
schema Tipo: string - maxLength: 256 El nombre del esquema predeterminado que se va a usar en la base de datos. No
timezone Tipo: string - maxLength: 128 Es Ninguno de manera predeterminada para respetar el parámetro de Snowflake TIMEZONE. Configúrelo en una zona horaria válida (por ejemplo, America/Los_Angeles) para establecer la zona horaria de la sesión. Zona horaria en un formato similar a America/Los_Angeles No
validate_default_parameters Tipo: boolean Configúrelo en true para generar una excepción si la base de datos, el esquema o el almacén especificados no existen. El valor predeterminado es false. No
warehouse Tipo: string - maxLength: 256 El nombre del almacén predeterminado que se debe utilizar. No