API delle statistiche delle colonne - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

API delle statistiche delle colonne

L'API delle statistiche delle colonne descrive le API AWS Glue per la restituzione di statistiche delle colonne di una tabella.

Tipi di dati

Struttura ColumnStatisticsTaskRun

L'oggetto che mostra i dettagli dell'esecuzione delle statistiche delle colonne.

Campi
  • CustomerId: stringa UTF-8, non superiore a 12 byte di lunghezza.

    ID dell'account AWS.

  • ColumnStatisticsTaskRunId: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'identificatore per l'esecuzione dell'attività delle statistiche delle colonne specifica.

  • DatabaseName: stringa UTF-8.

    Il database in cui risiede la tabella.

  • TableName: stringa UTF-8.

    Il nome della tabella per cui vengono generate le statistiche delle colonne.

  • ColumnNameList: una matrice di stringhe UTF-8.

    Un elenco dei nomi delle colonne. Se non viene fornito, per impostazione predefinita verranno utilizzati tutti i nomi delle colonne della tabella.

  • CatalogID: stringa ID catalogo, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID del catalogo dati in cui risiede la tabella Se non viene fornito, per impostazione predefinita viene utilizzato l'ID dell'account AWS.

  • Role: stringa UTF-8.

    Il ruolo IAM che assume il servizio per generare statistiche.

  • SampleSize: numero (doppio), non superiore a 100.

    La percentuale di righe utilizzate per generare statistiche. Se non viene fornita, per generare statistiche verrà utilizzata l'intera tabella.

  • SecurityConfiguration: stringa UTF-8, non superiore a 128 byte di lunghezza.

    Nome della configurazione di sicurezza utilizzata per crittografare i log di CloudWatch per l'esecuzione dell'attività delle statistiche delle colonne.

  • NumberOfWorkers: numero (intero), almeno 1.

    Il numero di worker utilizzati per generare statistiche delle colonne. Il processo è preconfigurato per scalare automaticamente fino a 25 istanze.

  • WorkerType: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il tipo di worker utilizzati per generare statistiche. Il valore predefinito è g.1x.

  • Status: stringa UTF-8 (valori validi: STARTING | RUNNING | SUCCEEDED | FAILED | STOPPED).

    Lo stato dell'esecuzione dell'attività.

  • CreationTime: timestamp.

    L'ora di creazione di questa attività.

  • LastUpdated: timestamp.

    Il momento dell'ultima modifica di questa attività.

  • StartTime: timestamp.

    L'orario di inizio dell'attività.

  • EndTime: timestamp.

    L'orario di fine dell'attività.

  • ErrorMessage: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Il messaggio di errore per il processo.

  • DPUSeconds: numero (doppio), non superiore a None (Nessuno).

    L'utilizzo della DPU calcolato in secondi per tutti i worker con scalabilità automatica.

Struttura ColumnStatisticsTaskRunningException

Un'eccezione generata quando si cerca di avviare un altro processo durante l'esecuzione di un processo di generazione di statistiche delle colonne.

Campi
  • Message: stringa UTF-8.

    Messaggio che descrive il problema.

Struttura ColumnStatisticsTaskNotRunningException

Un'eccezione generata quando si tenta di interrompere l'esecuzione di un'attività quando non è in esecuzione alcuna attività.

Campi
  • Message: stringa UTF-8.

    Messaggio che descrive il problema.

Struttura ColumnStatisticsTaskStoppingException

Un'eccezione generata quando si tenta di interrompere l'esecuzione di un'attività.

Campi
  • Message: stringa UTF-8.

    Messaggio che descrive il problema.

Operazioni

Operazione StartColumnStatisticsTaskRun (Python: start_column_statistics_task_run)

Avvia l'esecuzione di un'attività di statistica delle colonne, per una tabella e delle colonne specificate.

Richiesta
  • DatabaseName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome del database in cui risiede la tabella.

  • TableName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il nome della tabella per generare statistiche.

  • ColumnNameList: una matrice di stringhe UTF-8.

    Un elenco dei nomi delle colonne per generare statistiche. Se non viene fornito, per impostazione predefinita verranno utilizzati tutti i nomi delle colonne della tabella.

  • Role: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il ruolo IAM che assume il servizio per generare statistiche.

  • SampleSize: numero (doppio), non superiore a 100.

    La percentuale di righe utilizzate per generare statistiche. Se non viene fornita, per generare statistiche verrà utilizzata l'intera tabella.

  • CatalogID: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID del catalogo dati in cui risiede la tabella. Se non viene fornito, per impostazione predefinita viene utilizzato l'ID dell'account AWS.

  • SecurityConfiguration: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome della configurazione di sicurezza utilizzata per crittografare i log di CloudWatch per l'esecuzione dell'attività delle statistiche delle colonne.

Risposta
  • ColumnStatisticsTaskRunId: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'identificatore per l'esecuzione dell'attività delle statistiche delle colonne.

Errori
  • AccessDeniedException

  • EntityNotFoundException

  • ColumnStatisticsTaskRunningException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InvalidInputException

Operazione GetColumnStatisticsTaskRun (Python: get_column_statistics_task_run)

Ottieni i metadati/le informazioni associati per l'esecuzione di un'attività, con un ID di esecuzione attività.

Richiesta
  • ColumnStatisticsTaskRunId: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'identificatore per l'esecuzione dell'attività delle statistiche delle colonne specifica.

Risposta
  • ColumnStatisticsTaskRun: un oggetto ColumnStatisticsTaskRun.

    Un oggetto ColumnStatisticsTaskRun che rappresenta i dettagli dell'esecuzione delle statistiche delle colonne.

Errori
  • EntityNotFoundException

  • OperationTimeoutException

  • InvalidInputException

Operazione GetColumnStatisticsTaskRuns (Python: get_column_statistics_task_runs)

Recupera le informazioni su tutte le esecuzioni associate alla tabella specificata.

Richiesta
  • DatabaseName: obbligatorio: stringa UTF-8.

    Nome del database in cui risiede la tabella.

  • TableName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome della tabella.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    La dimensione massima della risposta.

  • NextToken: stringa UTF-8.

    Un token di continuazione, se si tratta di una chiamata di continuazione.

Risposta
  • ColumnStatisticsTaskRuns: una matrice di oggetti ColumnStatisticsTaskRun.

    Un elenco delle esecuzioni dell'attività delle statistiche delle colonne.

  • NextToken: stringa UTF-8.

    Un token di continuazione, se non sono ancora stati restituite tutte le esecuzioni dell'attività.

Errori
  • OperationTimeoutException

Operazione ListColumnStatisticsTaskRuns (Python: list_column_statistics_task_runs)

Elenca tutte le attività eseguite per un determinato account.

Richiesta
  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    La dimensione massima della risposta.

  • NextToken: stringa UTF-8.

    Un token di continuazione, se si tratta di una chiamata di continuazione.

Risposta
  • ColumnStatisticsTaskRunIds: una matrice di stringhe UTF-8, non superiore a 100.

    Un elenco degli ID delle esecuzioni dell'attività delle statistiche delle colonne.

  • NextToken: stringa UTF-8.

    Un token di continuazione, se non sono ancora stati restituiti tutti gli ID delle esecuzioni dell'attività.

Errori
  • OperationTimeoutException

Operazione StopColumnStatisticsTaskRun (Python: stop_column_statistics_task_run)

Interrompe l'esecuzione di un'operazione per la tabella specificata.

Richiesta
  • DatabaseName: obbligatorio: stringa UTF-8.

    Nome del database in cui risiede la tabella.

  • TableName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome della tabella.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • ColumnStatisticsTaskNotRunningException

  • ColumnStatisticsTaskStoppingException

  • OperationTimeoutException