API de estadísticas de columna - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

API de estadísticas de columna

La API de estadísticas de columnas describe las API de AWS Glue para devolver las estadísticas de las columnas de una tabla.

Tipos de datos

Estructura ColumnStatisticsTaskRun

El objeto que muestra los detalles de la ejecución de las estadísticas de la columna.

Campos
  • CustomerId: cadena UTF-8, no más de 12 bytes de largo.

    El ID de la cuenta de AWS.

  • ColumnStatisticsTaskRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de la ejecución de la tarea de estadísticas de columna en particular.

  • DatabaseName: cadena UTF-8.

    La base de datos en la que se encuentra la tabla.

  • TableName: cadena UTF-8.

    El nombre de la tabla para la que se generan las estadísticas de las columnas.

  • ColumnNameList: matriz de cadenas UTF-8.

    Una lista de los nombres de las columnas. Si no se proporciona ninguno, todos los nombres de columna de la tabla se usarán de forma predeterminada.

  • CatalogID: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del Catálogo de datos donde reside la tabla. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.

  • Role: cadena UTF-8.

    El rol de IAM que el servicio asume para generar estadísticas.

  • SampleSize: número (doble), 100 como máximo.

    El porcentaje de filas que se utilizan para generar estadísticas. Si no se proporciona ninguno, la tabla completa se usará para generar estadísticas.

  • SecurityConfiguration: cadena UTF-8 de 128 bytes de largo como máximo.

    Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch para la ejecución de la tarea de estadísticas de columnas.

  • NumberOfWorkers: número (entero), como mínimo 1.

    El número de empleados utilizados para generar las estadísticas de las columnas. El trabajo está preconfigurado para escalar automáticamente hasta 25 instancias.

  • WorkerType: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El tipo de trabajadores que se utilizan para generar estadísticas. El valor predeterminado es g.1x.

  • Status: cadena UTF-8 (valores válidos: STARTING | RUNNING | SUCCEEDED | FAILED | STOPPED).

    El estado de la ejecución de la tarea.

  • CreationTime: marca temporal.

    La hora en que se creó esta tarea.

  • LastUpdated: marca temporal.

    El último punto temporal en que se modificó esta tarea.

  • StartTime: marca temporal.

    La hora de inicio de la tarea.

  • EndTime: marca temporal.

    La hora de finalización de la tarea.

  • ErrorMessage: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    El mensaje de error del trabajo.

  • DPUSeconds: número (doble), cero como máximo.

    El uso de la DPU calculado en segundos para todos los trabajadores con escalado automático.

Estructura ColumnStatisticsTaskRunningException

Se produce una excepción cuando se intenta iniciar otro trabajo mientras se ejecuta un trabajo de generación de estadísticas de columnas.

Campos
  • Message: cadena UTF-8.

    Mensaje que describe el problema.

Estructura ColumnStatisticsTaskNotRunningException

Una excepción que se produce cuando se intenta detener la ejecución de una tarea cuando no hay ninguna tarea en ejecución.

Campos
  • Message: cadena UTF-8.

    Mensaje que describe el problema.

Estructura ColumnStatisticsTaskStopingException

Una excepción que se produce cuando se intenta detener la ejecución de una tarea.

Campos
  • Message: cadena UTF-8.

    Mensaje que describe el problema.

Operaciones

StartColumnStatisticsTaskRun action (Python: start_column_statistics_task_run)

Inicia la ejecución de una tarea de estadísticas de columnas para una tabla y columnas especificadas.

Solicitud
  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos donde reside la tabla.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla con que se van a generar estadísticas.

  • ColumnNameList: matriz de cadenas UTF-8.

    Una lista de los nombres de las columnas para generar estadísticas. Si no se proporciona ninguno, todos los nombres de columna de la tabla se usarán de forma predeterminada.

  • Role: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El rol de IAM que el servicio asume para generar estadísticas.

  • SampleSize: número (doble), 100 como máximo.

    El porcentaje de filas que se utilizan para generar estadísticas. Si no se proporciona ninguno, la tabla completa se usará para generar estadísticas.

  • CatalogID: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo de datos donde reside la tabla. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.

  • SecurityConfiguration: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch para la ejecución de la tarea de estadísticas de columnas.

Respuesta
  • ColumnStatisticsTaskRunId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de ejecución de la tarea de estadísticas de las columnas.

Errores
  • AccessDeniedException

  • EntityNotFoundException

  • ColumnStatisticsTaskRunningException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InvalidInputException

GetColumnStatisticsTaskRun action (Python: get_column_statistics_task_run)

Obtenga los metadatos o la información asociados a la ejecución de una tarea, con un identificador de ejecución de la tarea determinado.

Solicitud
  • ColumnStatisticsTaskRunId: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El identificador de la ejecución de la tarea de estadísticas de columna en particular.

Respuesta
  • ColumnStatisticsTaskRun: un objeto ColumnStatisticsTaskRun.

    Un objeto de ColumnStatisticsTaskRun que representa los detalles de la ejecución de las estadísticas de la columna.

Errores
  • EntityNotFoundException

  • OperationTimeoutException

  • InvalidInputException

GetColumnStatisticsTaskRuns action (Python: get_column_statistics_task_runs)

Recupera información sobre todas las ejecuciones asociadas a la tabla especificada.

Solicitud
  • DatabaseNameObligatorio: cadena UTF-8.

    El nombre de la base de datos donde reside la tabla.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    Tamaño máximo de la respuesta.

  • NextToken: cadena UTF-8.

    Token de continuación si se trata de una llamada de continuidad.

Respuesta
  • ColumnStatisticsTaskRuns: matriz de objetos ColumnStatisticsTaskRun.

    Una lista de las ejecuciones de tareas de estadísticas de las columnas.

  • NextToken: cadena UTF-8.

    Un token de continuación, si todavía no se han devuelto todas las ejecuciones de tareas.

Errores
  • OperationTimeoutException

ListColumnStatisticsTaskRuns action (Python: list_column_statistics_task_runs)

Enumera todas las ejecuciones de tareas para una cuenta en particular.

Solicitud
  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    Tamaño máximo de la respuesta.

  • NextToken: cadena UTF-8.

    Token de continuación si se trata de una llamada de continuidad.

Respuesta
  • ColumnStatisticsTaskRunIds: matriz de cadenas UTF-8, con 100 cadenas como máximo.

    Una lista de los identificadores de ejecución de las tareas de estadísticas de las columnas.

  • NextToken: cadena UTF-8.

    Un token de continuación, si todavía no se han devuelto todos los identificadores de ejecución de tareas.

Errores
  • OperationTimeoutException

StopColumnStatisticsTaskRun action (Python: stop_column_statistics_task_run)

Detiene la ejecución de una tarea para la tabla especificada.

Solicitud
  • DatabaseNameObligatorio: cadena UTF-8.

    El nombre de la base de datos donde reside la tabla.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • ColumnStatisticsTaskNotRunningException

  • ColumnStatisticsTaskStoppingException

  • OperationTimeoutException