本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
連線參數
下表詳細說明每個資料存放區 AWS Glue 連線支援的 Python 屬性。
Amazon Redshift 連線參數
Amazon Redshift 的連線支援下列 Python AWS Glue 連線參數。
金錀 | Type | 描述 | 限制 | 必要 |
---|---|---|---|---|
auto_create |
類型:boolean |
指示如果使用者不存在,是否應該建立使用者。預設為 false 。 |
true , false |
否 |
aws_secret_arn |
類型:string |
用於擷取連線其他參數ARN的秘密 。 | 有效 ARN | 否 |
cluster_identifier |
類型:string -maxLength:63 |
Amazon Redshift 叢集的叢集識別碼。 | ^(?!.*—)【a-z】【a-z0-9-】{0,61}【a-z0-9】$ | 否 |
database |
類型:string -maxLength:127 |
要連線到之資料庫的名稱。 | 否 | |
database_metadata_current_db_only |
類型:boolean |
指示應用程式是否支援多資料庫資料共用目錄。預設為 ,true 表示應用程式不支援用於向後相容性的多資料庫資料共用目錄。 |
true , false |
否 |
db_groups |
類型:string |
目前工作階段db_user 聯結的現有資料庫群組名稱逗號分隔清單。 |
否 | |
db_user |
類型:string |
要與 Amazon Redshift 搭配使用的使用者 ID。 | 否 | |
host |
類型:string -maxLength:256 |
Amazon Redshift 叢集的主機名稱。 | 否 | |
iam |
類型:boolean |
標記以啟用或停用連線的 IAM 型身分驗證。預設為 false 。 |
true , false |
否 |
iam_disable_cache |
類型:boolean |
此選項指定憑證是否IAM快取。預設為 true 。這可改善對API閘道的請求受到限流時的效能。 |
true , false |
否 |
max_prepared_statements |
類型:integer |
一次可以開啟的已準備陳述式數目上限。 | 否 | |
numeric_to_float |
要浮動的十進位 | 指定NUMERIC 資料類型值是否將從小數點轉換。依預設,系統會將NUMERIC 值接收為 decimal.Decimal Python 物件。對於偏好最精確的使用案例,不建議啟用此選項,因為結果可能會四捨五入。啟用此選項float 之前,請參閱 上的 Python 文件decimal.Decimal decimal.Decimal 和 之間的權衡。預設為 false 。 |
true , false |
否 |
port |
類型:integer |
Amazon Redshift 叢集的連接埠號碼。 | 範圍 1150-65535 | 否 |
profile |
類型:string -maxLength:256 |
包含 使用的憑證和設定的設定檔名稱 AWS CLI。 | 否 | |
region |
類型:string |
叢集所在的 AWS 區域。 | 有效 AWS 區域 | 否 |
serverless_acct_id |
類型:string -maxLength:256 |
與 Amazon Redshift 無伺服器資源相關聯的 AWS 帳戶 ID。 | 否 | |
serverless_work_group |
類型:string -maxLength:256 |
Amazon Redshift 無伺服器端點的工作群組名稱。 | 否 | |
ssl |
類型:boolean |
true 如果SSL已啟用。 |
true , false |
否 |
ssl_mode |
類型:enum【verify-ca 、verify-full 、 null】) |
Amazon Redshift 連線的安全性。 verify-ca (SSL 必須使用,且必須驗證伺服器憑證。) 和 verify-full (SSL 必須使用。 伺服器憑證必須經過驗證,且伺服器主機名稱必須與憑證上的主機名稱屬性相符。)。如需詳細資訊,請參閱在 Amazon Redshift 文件中設定連線的安全選項。預設為 verify-ca 。 |
verify-ca , verify-full |
否 |
timeout |
類型:integer |
對伺服器的連線在逾時前要經過的秒數。 | 0 | 否 |
Athena 連線參數
Athena 的連線支援下列 Python AWS Glue 連線參數。
金錀 | Type | 描述 | 限制 | 必要 |
---|---|---|---|---|
aws_access_key_id |
類型:string -maxLength:256 |
指定與IAM帳戶相關聯的 AWS 存取金鑰。建議您將此資訊儲存在 中aws_secret 。 |
長度 16-128 | 否 |
aws_secret_access_key |
類型:string -maxLength:256 |
AWS 存取金鑰的秘密部分。建議您將此資訊儲存在 中aws_secret 。 |
否 | |
aws_secret_arn |
類型:string |
用於擷取連線其他參數ARN的秘密 。 | 有效 ARN | 否 |
catalog_name |
類型:string -maxLength:256 |
包含使用驅動程式存取之資料庫和資料表的目錄。如需目錄的相關資訊,請參閱 DataCatalog。 | 否 | |
duration_seconds |
類型:number |
角色工作階段的持續時間 (以秒為單位)。此設定的值可介於 1 小時至 12 小時。根據預設,持續時間設定為 3600 秒 (1 小時)。 | 範圍從 900 秒 (15 分鐘) 到角色的工作階段持續時間上限設定 | 否 |
encryption_option |
類型:enum【SSE_S3 、SSE_KMS CSE_KMS 、 null】) |
Amazon S3 的靜態加密。請參閱 Athena 指南 中的靜態加密一節。 | SSE_S3 , SSE_KMS , CSE_KMS |
否 |
kms_key |
類型:string -maxLength:256 |
AWS KMS 如果在 CSE_KMS 中使用 金鑰encrytion_option 。 |
否 | |
poll_interval |
類型:number |
在 Athena 中輪詢查詢結果狀態的間隔秒數。 | 否 | |
profile_name |
類型:string -maxLength:256 |
應使用其憑證來驗證 Athena 請求的 AWS 組態設定檔名稱。 | 否 | |
region_name |
類型:string |
執行查詢 AWS 的區域。 | 有效 AWS 區域 | 否 |
result_reuse_enable |
類型:boolean |
啟用重複使用先前的查詢結果。 | true , false |
否 |
result_reuse_minutes |
類型:integer |
指定 Athena 應考慮重複使用的之前查詢結果的最長期限 (以分鐘為單位)。預設為 60。 | >= 1 | 否 |
role_arn |
類型:string |
用於執行查詢的角色。 | 有效 ARN | 否 |
schema_name |
類型:string -maxLength:256 |
用於資料庫的預設結構描述名稱。 | 否 | |
s3_staging_dir |
類型:string -maxLength:1024 |
Amazon S3 中存放查詢結果的位置。 | s3_staging_dir 或 work_group 為必要項目 |
|
work_group |
類型:string |
將在其中執行查詢的工作群組。如需工作群組的相關資訊,請參閱 WorkGroup。 | ^【a-zA-Z0-9._-】{1,128}$ | s3_staging_dir 或 work_group 為必要項目 |
Snowflake 連線參數
Snowflake 的連線支援下列 Python AWS Glue 連線參數。
Snowflake 連線參數
金錀 | Type | 描述 | 限制 | 必要 |
---|---|---|---|---|
account |
類型:string -maxLength:256 |
Snowflake 帳戶識別碼。帳戶識別碼不包含snowflakecomputing.com 尾碼。 |
是 | |
arrow_number_to_decimal |
類型:boolean |
根據預設,假,這表示NUMBER資料欄值會傳回為雙精度浮點數 (float64 )。將此設定為 True,以在呼叫 fetch_pandas_all() 和 fetch_pandas_batches() 方法時,將DECIMAL資料欄值傳回為小數 (decimal.Decimal )。 |
true , false |
否 |
autocommit |
類型:boolean |
預設為 false ,此值會承兌 Snowflake 參數 AUTOCOMMIT 。分別將 設定為 true 或 false 以啟用或停用工作階段中的 autocommit 模式。 |
true , false |
否 |
aws_secret_arn |
類型:string |
用於擷取連線其他參數ARN的秘密 。 | 有效 ARN | 否 |
client_prefetch_threads |
類型:integer |
用於下載結果集的執行緒數目 (預設為 4)。增加值可改善擷取效能,但需要更多記憶體。 | 否 | |
database |
類型:string -maxLength:256 |
要使用的預設資料庫名稱。 | 否 | |
login_timeout |
類型:integer |
登入請求以秒為單位的逾時。預設為 60 秒。如果HTTP回應不是 ,則登入請求會在逾時長度後放棄success 。 |
否 | |
network_timeout |
類型:integer |
所有其他操作的逾時,以秒為單位。預設為 none (無限)。如果HTTP回應不是 ,一般請求會在逾時長度後放棄success 。 |
否 | |
paramstyle |
類型:string -maxLength:256 |
從 Python 程式碼執行SQL查詢時,用於參數取代的預留位置語法。用戶端繫結預設為 pyformat 。指定 qmark 或 numeric 以變更伺服器端繫結的繫結變數格式。 |
否 | |
role |
類型:string -maxLength:256 |
要使用的預設角色名稱。 | 否 | |
schema |
類型:string -maxLength:256 |
要用於資料庫的預設結構描述名稱。 | 否 | |
timezone |
類型:string -maxLength:128 |
依預設,無 可承接 Snowflake 參數 TIMEZONE 。設定為有效的時區 (例如 America/Los_Angeles ) 以設定工作階段時區。 |
時區的格式類似於 America/Los_Angeles |
否 |
validate_default_parameters |
類型:boolean |
如果指定的資料庫、結構描述或倉儲不存在,請將 設定為 true 以提出例外狀況。預設為 false 。 |
否 | |
warehouse |
類型:string -maxLength:256 |
要使用的預設倉儲名稱。 | 否 |