As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Parâmetros de conexão
As tabelas a seguir detalham as propriedades Python suportadas para AWS Glue conexões por armazenamento de dados.
Parâmetros de conexão do Amazon Redshift
Os seguintes parâmetros de conexão do Python são compatíveis com AWS Glue conexões com o Amazon Redshift.
Chave | Tipo | Descrição | Restrições | Obrigatório |
---|---|---|---|---|
auto_create |
Tipo: boolean |
Indica se o usuário deve ser criado se ele não existir. Padronizado como false . |
true , false |
Não |
aws_secret_arn |
Tipo: string |
O ARN do segredo usado para recuperar os parâmetros adicionais para a conexão. | Válido ARN | Não |
cluster_identifier |
Tipo: string -maxLength: 63 |
O identificador de clusters do cluster do Amazon Redshift. | ^ (?!. *—) [a-z] [a-z0-9-] {0,61} [a-z0-9] $ | Não |
database |
Tipo: string -maxLength: 127 |
É o nome do banco de dados ao qual se conectar. | Não | |
database_metadata_current_db_only |
Tipo: boolean |
Indica se o aplicativo oferece suporte a catálogos de compartilhamento de dados com vários bancos de dados. O padrão é indicar que o true aplicativo não oferece suporte a catálogos de compartilhamento de dados de vários bancos de dados para compatibilidade com versões anteriores. |
true , false |
Não |
db_groups |
Tipo: string |
Uma lista separada por vírgula dos nomes de grupos de bancos de dados existentes aos quais db_user se juntam para a sessão atual. |
Não | |
db_user |
Tipo: string |
O ID de usuário a ser usado com o Amazon Redshift. | Não | |
host |
Tipo: string -maxLength: 256 |
O nome do host do cluster Amazon Redshift. | Não | |
iam |
Tipo: boolean |
Sinalize para ativar ou desativar a autenticação IAM baseada em uma conexão. Padronizado como false . |
true , false |
Não |
iam_disable_cache |
Tipo: boolean |
Essa opção especifica se as IAM credenciais são armazenadas em cache. Padronizado como true . Isso melhora o desempenho quando as solicitações para o API gateway são limitadas. |
true , false |
Não |
max_prepared_statements |
Tipo: integer |
O número máximo de declarações preparadas que podem ser abertas de uma só vez. | Não | |
numeric_to_float |
Decimal para flutuar | Especifica se os valores do NUMERIC tipo de dados serão convertidos de decimal. Por padrão, NUMERIC os valores são recebidos como decimal.Decimal objetos Python. Não é recomendável ativar essa opção para casos de uso que preferem a maior precisão, pois os resultados podem ser arredondados. Consulte a documentação do Python decimal.Decimal decimal.Decimal e float antes de habilitar essa opção. Padronizado como false . |
true , false |
Não |
port |
Tipo: integer |
O número da porta do cluster Amazon Redshift. | Intervalo 1150-65535 | Não |
profile |
Tipo: string -maxLength: 256 |
O nome do perfil que contém as credenciais e a configuração usadas pelo AWS CLI. | Não | |
region |
Tipo: string |
A AWS região em que o cluster está localizado. | AWS Região válida | Não |
serverless_acct_id |
Tipo: string -maxLength: 256 |
O ID da AWS conta que está associado ao recurso sem servidor do Amazon Redshift. | Não | |
serverless_work_group |
Tipo: string -maxLength: 256 |
O nome do grupo de trabalho do endpoint sem servidor do Amazon Redshift. | Não | |
ssl |
Tipo: boolean |
true se SSL estiver ativado. |
true , false |
Não |
ssl_mode |
Tipo: enum [verify-ca ,verify-full , null]) |
A segurança da conexão com o Amazon Redshift. verify-ca (SSLdeve ser usado e o certificado do servidor deve ser verificado.) e verify-full (SSLdeve ser usado. O certificado do servidor deve ser verificado e o nome do host do servidor deve corresponder ao atributo do nome do host no certificado.) são suportados. Para obter mais informações, consulte Configuração de opções de segurança para conexões na documentação do Amazon Redshift. Padronizado como verify-ca . |
verify-ca , verify-full |
Não |
timeout |
Tipo: integer |
O número de segundos antes de a conexão com o servidor atingir o tempo limite. | 0 | Não |
Parâmetros de conexão do Athena
Os seguintes parâmetros de conexão do Python são compatíveis com AWS Glue conexões com o Athena.
Chave | Tipo | Descrição | Restrições | Obrigatório |
---|---|---|---|---|
aws_access_key_id |
Tipo: string -maxLength: 256 |
Especifica uma chave de AWS acesso associada a uma IAM conta. Recomendamos armazenar essas informações noaws_secret . |
Comprimento 16-128 | Não |
aws_secret_access_key |
Tipo: string -maxLength: 256 |
Parte secreta de uma chave de AWS acesso. Recomendamos armazenar essas informações noaws_secret . |
Não | |
aws_secret_arn |
Tipo: string |
O ARN do segredo usado para recuperar os parâmetros adicionais para a conexão. | Válido ARN | Não |
catalog_name |
Tipo: string -maxLength: 256 |
O catálogo que contém os bancos de dados e as tabelas que são acessadas com o driver. Para obter informações sobre catálogos, consulte DataCatalog. | Não | |
duration_seconds |
Tipo: number |
A duração, em segundos, da sessão do perfil. Essa configuração pode ter um valor de 1 hora a 12 horas. Por padrão, a duração é definida como 3600 segundos (1 hora). | Faixa de 900 segundos (15 minutos) até a configuração de duração máxima da sessão para a função | Não |
encryption_option |
Tipo: enum [SSE_S3 ,, SSE_KMS CSE_KMS , null]) |
Criptografia em repouso para o Amazon S3. Consulte a seção Criptografia em repouso no guia do Athena. | SSE_S3 , SSE_KMS , CSE_KMS |
Não |
kms_key |
Tipo: string -maxLength: 256 |
AWS KMS chave se estiver usando CSE_KMS emencrytion_option . |
Não | |
poll_interval |
Tipo: number |
Intervalo em segundos para pesquisar o status dos resultados da consulta no Athena. | Não | |
profile_name |
Tipo: string -maxLength: 256 |
O nome do perfil de AWS configuração cujas credenciais devem ser usadas para autenticar a solicitação para o Athena. | Não | |
region_name |
Tipo: string |
A AWS região em que as consultas são executadas. | AWS Região válida | Não |
result_reuse_enable |
Tipo: boolean |
Habilite a reutilização do resultado da consulta anterior. | true , false |
Não |
result_reuse_minutes |
Tipo: integer |
Especifica, em minutos, a idade máxima de um resultado de consulta anterior que o Athena deverá considerar para reutilização. O padrão é 60. | >=1 | Não |
role_arn |
Tipo: string |
Função a ser usada para executar consultas. | Válido ARN | Não |
schema_name |
Tipo: string -maxLength: 256 |
Nome do esquema padrão a ser usado para o banco de dados. | Não | |
s3_staging_dir |
Tipo: string -maxLength: 1024 |
O local no Amazon S3 onde os resultados da consulta são armazenados. | s3_staging_dir Ou work_group é obrigatório |
|
work_group |
Tipo: string |
O grupo de trabalho no qual as consultas serão executadas. Para obter informações sobre grupos de trabalho, consulte WorkGroup. | ^ [a-zA-Z0-9._-] {1,128} $ | s3_staging_dir Ou work_group é obrigatório |
Parâmetros de conexão Snowflake
Os seguintes parâmetros de conexão do Python são compatíveis com AWS Glue conexões com o Snowflake.
Parâmetros de conexão Snowflake
Chave | Tipo | Descrição | Restrições | Obrigatório |
---|---|---|---|---|
account |
Tipo: string -maxLength: 256 |
O identificador da conta Snowflake. O identificador da conta não inclui o snowflakecomputing.com sufixo. |
Sim | |
arrow_number_to_decimal |
Tipo: boolean |
False por padrão, o que significa que os valores das NUMBER colunas são retornados como números de ponto flutuante de precisão dupla (float64 ). Defina isso como True para retornar os valores DECIMAL da coluna como números decimais (decimal.Decimal ) ao chamar os fetch_pandas_batches() métodos fetch_pandas_all() e. |
true , false |
Não |
autocommit |
Tipo: boolean |
O padrão éfalse , que respeita o parâmetro Snowflake. AUTOCOMMIT Defina true false para ativar ou desativar o autocommit modo na sessão, respectivamente. |
true , false |
Não |
aws_secret_arn |
Tipo: string |
O ARN do segredo usado para recuperar os parâmetros adicionais para a conexão. | Válido ARN | Não |
client_prefetch_threads |
Tipo: integer |
O número de segmentos usados para baixar os conjuntos de resultados (4 por padrão). Aumentar o valor melhora o desempenho da busca, mas requer mais memória. | Não | |
database |
Tipo: string -maxLength: 256 |
O nome do banco de dados padrão a ser usado. | Não | |
login_timeout |
Tipo: integer |
O tempo limite em segundos para a solicitação de login. O padrão é 60 segundos. A solicitação de login desiste após o tempo limite, se a HTTP resposta não success for. |
Não | |
network_timeout |
Tipo: integer |
O tempo limite em segundos para todas as outras operações. O padrão é none (infinito). Uma solicitação geral desiste após o tempo limite, se a HTTP resposta não success for. |
Não | |
paramstyle |
Tipo: string -maxLength: 256 |
Sintaxes de espaço reservado usadas para substituição de parâmetros ao executar consultas SQL a partir do código Python. O padrão é pyformat para vinculação do lado do cliente. Especifique qmark ou numeric altere os formatos das variáveis de associação para vinculação do lado do servidor. |
Não | |
role |
Tipo: string -maxLength: 256 |
O nome da função padrão a ser usada. | Não | |
schema |
Tipo: string -maxLength: 256 |
O nome do esquema padrão a ser usado para o banco de dados. | Não | |
timezone |
Tipo: string -maxLength: 128 |
Nenhum por padrão, o que respeita o parâmetro Snowflake. TIMEZONE Defina um fuso horário válido (comoAmerica/Los_Angeles ) para definir o fuso horário da sessão. |
Fuso horário em um formato semelhante ao America/Los_Angeles |
Não |
validate_default_parameters |
Tipo: boolean |
Defina como true para gerar uma exceção se o banco de dados, esquema ou depósito especificado não existir. Padronizado como false . |
Não | |
warehouse |
Tipo: string -maxLength: 256 |
O nome do depósito padrão a ser usado. | Não |