資料欄統計資料 API - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料欄統計資料 API

資料欄統計資料 API 將說明傳回資料表資料欄統計資料的 AWS Glue API。

資料類型

ColumnStatisticsTaskRun 結構

顯示資料欄統計資料執行之詳細資料的物件。

欄位
  • CustomerId – UTF-8 字串,長度不可超過 12 個位元組。

    AWS 帳戶 ID。

  • ColumnStatisticsTaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    適用於特定資料欄統計資料任務執行的識別碼。

  • DatabaseName – UTF-8 字串。

    資料表所在的資料庫。

  • TableName – UTF-8 字串。

    產生資料欄統計資料之資料表的名稱。

  • ColumnNameList – UTF-8 字串陣列。

    欄名稱之清單。若未提供,則依預設系統將會使用資料表的所有資料欄名稱。

  • CatalogID – 目錄 ID 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    資料表所在的 Data Catalog 的 ID。若沒有提供,則依預設會使用 AWS 帳戶 ID。

  • Role – UTF-8 字串。

    服務用於產生統計資料的 IAM 角色。

  • SampleSize:數字 (雙位數),不可大於 100。

    用來產生統計資料的資料列百分比。若未提供,則系統將會使用整個資料表產生統計資料。

  • SecurityConfiguration – UTF-8 字串,長度不可超過 128 個位元組。

    用於加密資料欄統計資料任務執行之 CloudWatch 日誌的安全組態名稱。

  • NumberOfWorkers – 數字 (整數),至少為 1。

    用於產生資料欄統計資料的工作者數量。此工作已預先設定為自動擴展至 25 個執行個體。

  • WorkerType – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    用於產生統計資料的工作者類型。預設值為 g.1x

  • Status – UTF-8 字串 (有效值:STARTING | RUNNING | SUCCEEDED | FAILED | STOPPED)。

    任務執行的狀態。

  • CreationTime – 時間戳記。

    此任務建立的時間。

  • LastUpdated – 時間戳記。

    此任務上次修改的時間點。

  • StartTime – 時間戳記。

    任務的開始時間。

  • EndTime – 時間戳記。

    任務的結束時間。

  • ErrorMessage – 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern

    工作的錯誤訊息。

  • DPUSeconds – 數字 (雙精度浮點數),不可大於 None (無)。

    所有自動擴展之工作者的計算 DPU 用量 (以秒為單位)。

ColumnStatisticsTaskRunningException 結構

當您在執行資料欄統計資料產生工作期間,嘗試啟動其他工作時發生的例外狀況。

欄位
  • Message – UTF-8 字串。

    說明問題的訊息。

ColumnStatisticsTaskNotRunningException 結構

當您在沒有任務執行期間,嘗試停止任務執行時發生的例外狀況。

欄位
  • Message – UTF-8 字串。

    說明問題的訊息。

ColumnStatisticsTaskStoppingException 結構

當您嘗試停止任務執行時發生的例外狀況。

欄位
  • Message – UTF-8 字串。

    說明問題的訊息。

操作

StartColumnStatisticsTaskRun 動作 (Python:start_column_statistics_task_run)

針對指定的資料表和資料欄,啟動資料欄統計資料任務執行。

請求
  • DatabaseName必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    資料表所在的資料庫名稱。

  • TableName必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    用於產生統計資料的資料表名稱。

  • ColumnNameList – UTF-8 字串陣列。

    用於產生統計資料之資料欄名稱的清單。若未提供,則依預設系統將會使用資料表的所有資料欄名稱。

  • Role必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    服務用於產生統計資料的 IAM 角色。

  • SampleSize:數字 (雙位數),不可大於 100。

    用來產生統計資料的資料列百分比。若未提供,則系統將會使用整個資料表產生統計資料。

  • CatalogID – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    資料表所在之 Data Catalog 的 ID。若沒有提供,則依預設會使用 AWS 帳戶 ID。

  • SecurityConfiguration – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    用於加密資料欄統計資料任務執行之 CloudWatch 日誌的安全組態名稱。

回應
  • ColumnStatisticsTaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    資料欄統計資料任務執行的識別碼。

錯誤
  • AccessDeniedException

  • EntityNotFoundException

  • ColumnStatisticsTaskRunningException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InvalidInputException

GetColumnStatisticsTaskRun 動作 (Python:get_column_statistics_task_run)

取得已知任務執行 ID 之任務執行的相關中繼資料/資訊。

請求
  • ColumnStatisticsTaskRunId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    適用於特定資料欄統計資料任務執行的識別碼。

回應
  • ColumnStatisticsTaskRunColumnStatisticsTaskRun 物件。

    表示資料欄統計資料執行之詳細資料的 ColumnStatisticsTaskRun 物件。

錯誤
  • EntityNotFoundException

  • OperationTimeoutException

  • InvalidInputException

GetColumnStatisticsTaskRuns 動作 (Python:get_column_statistics_task_runs)

擷取與指定資料表相關聯之所有執行的相關資訊。

請求
  • DatabaseName必要:UTF-8 字串。

    資料表所在的資料庫名稱。

  • TableName必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    資料表的名稱。

  • MaxResults – 數字 (整數),不可小於 1,也不可以大於 1000。

    回應的大小上限。

  • NextToken – UTF-8 字串。

    接續符記,如果這是接續呼叫。

回應
  • ColumnStatisticsTaskRuns – 一個 ColumnStatisticsTaskRun 物件陣列。

    資料欄統計資料任務執行的清單。

  • NextToken – UTF-8 字串。

    持續權杖 (如果尚未傳回所有任務執行)。

錯誤
  • OperationTimeoutException

ListColumnStatisticsTaskRuns 動作 (Python:list_column_statistics_task_runs)

列出特定帳戶的所有任務執行。

請求
  • MaxResults – 數字 (整數),不可小於 1,也不可以大於 1000。

    回應的大小上限。

  • NextToken – UTF-8 字串。

    接續符記,如果這是接續呼叫。

回應
  • ColumnStatisticsTaskRunIds – UTF-8 字串的陣列,不可超過 100 個字串。

    資料欄統計資料任務執行 ID 的清單。

  • NextToken – UTF-8 字串。

    持續權杖 (如果尚未傳回所有任務執行 ID)。

錯誤
  • OperationTimeoutException

StopColumnStatisticsTaskRun 動作 (Python:stop_column_statistics_task_run)

停止指定資料表的任務執行。

請求
  • DatabaseName必要:UTF-8 字串。

    資料表所在的資料庫名稱。

  • TableName必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    資料表的名稱。

回應
  • 無回應參數。

錯誤
  • EntityNotFoundException

  • ColumnStatisticsTaskNotRunningException

  • ColumnStatisticsTaskStoppingException

  • OperationTimeoutException