連線參數 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

連線參數

下表詳細說明每個資料存放區 AWS Glue 連線支援的 Python 屬性。

Amazon Redshift 連線參數

Amazon Redshift 的連線支援下列 Python AWS Glue 連線參數。

金錀 Type 描述 限制 必要
auto_create 類型:boolean 指示如果使用者不存在,是否應該建立使用者。預設為 false true, false
aws_secret_arn 類型:string 用於擷取連線其他參數ARN的秘密 。 有效 ARN
cluster_identifier 類型:string-maxLength:63 Amazon Redshift 叢集的叢集識別碼。 ^(?!.*—)【a-z】【a-z0-9-】{0,61}【a-z0-9】$
database 類型:string-maxLength:127 要連線到之資料庫的名稱。
database_metadata_current_db_only 類型:boolean 指示應用程式是否支援多資料庫資料共用目錄。預設為 ,true表示應用程式不支援用於向後相容性的多資料庫資料共用目錄。 true, false
db_groups 類型:string 目前工作階段db_user聯結的現有資料庫群組名稱逗號分隔清單。
db_user 類型:string 要與 Amazon Redshift 搭配使用的使用者 ID。
host 類型:string-maxLength:256 Amazon Redshift 叢集的主機名稱。
iam 類型:boolean 標記以啟用或停用連線的 IAM 型身分驗證。預設為 false true, false
iam_disable_cache 類型:boolean 此選項指定憑證是否IAM快取。預設為 true。這可改善對API閘道的請求受到限流時的效能。 true, false
max_prepared_statements 類型:integer 一次可以開啟的已準備陳述式數目上限。
numeric_to_float 要浮動的十進位 指定NUMERIC資料類型值是否將從小數點轉換。依預設,系統會將NUMERIC值接收為 decimal.Decimal Python 物件。對於偏好最精確的使用案例,不建議啟用此選項,因為結果可能會四捨五入。啟用此選項float之前,請參閱 上的 Python 文件decimal.Decimal,以了解 decimal.Decimal 和 之間的權衡。預設為 false true, false
port 類型:integer Amazon Redshift 叢集的連接埠號碼。 範圍 1150-65535
profile 類型:string-maxLength:256 包含 使用的憑證和設定的設定檔名稱 AWS CLI。
region 類型:string 叢集所在的 AWS 區域。 有效 AWS 區域
serverless_acct_id 類型:string-maxLength:256 與 Amazon Redshift 無伺服器資源相關聯的 AWS 帳戶 ID。
serverless_work_group 類型:string-maxLength:256 Amazon Redshift 無伺服器端點的工作群組名稱。
ssl 類型:boolean true 如果SSL已啟用。 true, false
ssl_mode 類型:enum【verify-caverify-full、 null】) Amazon Redshift 連線的安全性。 verify-ca(SSL 必須使用,且必須驗證伺服器憑證。) 和 verify-full(SSL 必須使用。 伺服器憑證必須經過驗證,且伺服器主機名稱必須與憑證上的主機名稱屬性相符。)。如需詳細資訊,請參閱在 Amazon Redshift 文件中設定連線的安全選項。預設為 verify-ca verify-ca, verify-full
timeout 類型:integer 對伺服器的連線在逾時前要經過的秒數。 0

Athena 連線參數

Athena 的連線支援下列 Python AWS Glue 連線參數。

金錀 Type 描述 限制 必要
aws_access_key_id 類型:string-maxLength:256 指定與IAM帳戶相關聯的 AWS 存取金鑰。建議您將此資訊儲存在 中aws_secret 長度 16-128
aws_secret_access_key 類型:string-maxLength:256 AWS 存取金鑰的秘密部分。建議您將此資訊儲存在 中aws_secret
aws_secret_arn 類型:string 用於擷取連線其他參數ARN的秘密 。 有效 ARN
catalog_name 類型:string-maxLength:256 包含使用驅動程式存取之資料庫和資料表的目錄。如需目錄的相關資訊,請參閱 DataCatalog
duration_seconds 類型:number 角色工作階段的持續時間 (以秒為單位)。此設定的值可介於 1 小時至 12 小時。根據預設,持續時間設定為 3600 秒 (1 小時)。 範圍從 900 秒 (15 分鐘) 到角色的工作階段持續時間上限設定
encryption_option 類型:enum【SSE_S3SSE_KMSCSE_KMS、 null】) Amazon S3 的靜態加密。請參閱 Athena 指南 中的靜態加密一節。 SSE_S3, SSE_KMS, CSE_KMS
kms_key 類型:string-maxLength:256 AWS KMS 如果在 CSE_KMS中使用 金鑰encrytion_option
poll_interval 類型:number 在 Athena 中輪詢查詢結果狀態的間隔秒數。
profile_name 類型:string-maxLength:256 應使用其憑證來驗證 Athena 請求的 AWS 組態設定檔名稱。
region_name 類型:string 執行查詢 AWS 的區域。 有效 AWS 區域
result_reuse_enable 類型:boolean 啟用重複使用先前的查詢結果。 true, false
result_reuse_minutes 類型:integer 指定 Athena 應考慮重複使用的之前查詢結果的最長期限 (以分鐘為單位)。預設為 60。 >= 1
role_arn 類型:string 用於執行查詢的角色。 有效 ARN
schema_name 類型:string-maxLength:256 用於資料庫的預設結構描述名稱。
s3_staging_dir 類型:string-maxLength:1024 Amazon S3 中存放查詢結果的位置。 s3_staging_dirwork_group 為必要項目
work_group 類型:string 將在其中執行查詢的工作群組。如需工作群組的相關資訊,請參閱 WorkGroup ^【a-zA-Z0-9._-】{1,128}$ s3_staging_dirwork_group 為必要項目

Snowflake 連線參數

Snowflake 的連線支援下列 Python AWS Glue 連線參數。

Snowflake 連線參數

金錀 Type 描述 限制 必要
account 類型:string-maxLength:256 Snowflake 帳戶識別碼。帳戶識別碼不包含snowflakecomputing.com尾碼。
arrow_number_to_decimal 類型:boolean 根據預設,假,這表示NUMBER資料欄值會傳回為雙精度浮點數 (float64)。將此設定為 True,以在呼叫 fetch_pandas_all()fetch_pandas_batches()方法時,將DECIMAL資料欄值傳回為小數 (decimal.Decimal)。 true, false
autocommit 類型:boolean 預設為 false,此值會承兌 Snowflake 參數 AUTOCOMMIT。分別將 設定為 truefalse以啟用或停用工作階段中的 autocommit 模式。 true, false
aws_secret_arn 類型:string 用於擷取連線其他參數ARN的秘密 。 有效 ARN
client_prefetch_threads 類型:integer 用於下載結果集的執行緒數目 (預設為 4)。增加值可改善擷取效能,但需要更多記憶體。
database 類型:string-maxLength:256 要使用的預設資料庫名稱。
login_timeout 類型:integer 登入請求以秒為單位的逾時。預設為 60 秒。如果HTTP回應不是 ,則登入請求會在逾時長度後放棄success
network_timeout 類型:integer 所有其他操作的逾時,以秒為單位。預設為 none(無限)。如果HTTP回應不是 ,一般請求會在逾時長度後放棄success
paramstyle 類型:string-maxLength:256 從 Python 程式碼執行SQL查詢時,用於參數取代的預留位置語法。用戶端繫結預設為 pyformat 。指定 qmarknumeric 以變更伺服器端繫結的繫結變數格式。
role 類型:string-maxLength:256 要使用的預設角色名稱。
schema 類型:string-maxLength:256 要用於資料庫的預設結構描述名稱。
timezone 類型:string-maxLength:128 依預設,無 可承接 Snowflake 參數 TIMEZONE。設定為有效的時區 (例如 America/Los_Angeles) 以設定工作階段時區。 時區的格式類似於 America/Los_Angeles
validate_default_parameters 類型:boolean 如果指定的資料庫、結構描述或倉儲不存在,請將 設定為 true以提出例外狀況。預設為 false
warehouse 類型:string-maxLength:256 要使用的預設倉儲名稱。