API de partición - AWS Glue

API de partición

La API de partición describe los tipos de datos y las operaciones que se utilizan para trabajar con particiones.

Tipos de datos

Estructura Partition

Representa un sector de los datos de la tabla.

Campos
  • Values: matriz de cadenas UTF-8.

    Los valores de la partición.

  • DatabaseName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde se crea la partición.

  • TableName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla de base de datos en la que se desea crear la partición.

  • CreationTime: marca temporal.

    La hora a la que se creó la partición.

  • LastAccessTime: marca temporal.

    La última vez que se obtuvo acceso a la partición.

  • StorageDescriptor: un objeto StorageDescriptor.

    Ofrece información sobre la ubicación física donde se almacena la partición.

  • Parameters: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Estos pares de clave-valor definen los parámetros de partición.

  • LastAnalyzedTime: marca temporal.

    La última vez que se calcularon las estadísticas de columna para esta partición.

  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    ID del Data Catalog donde reside la partición.

Estructura PartitionInput

La estructura que se utiliza para crear y actualizar una partición.

Campos
  • Values: matriz de cadenas UTF-8.

    Los valores de la partición. Aunque este parámetro no lo requiere el SDK, debe especificarlo para una entrada válida.

    Los valores de las claves de la nueva partición deben pasarse como una matriz de objetos String que deben ordenarse en el mismo orden que las claves de partición que aparecen en el prefijo de Amazon S3. De lo contrario, AWS Glue agregará los valores a las claves erróneas.

  • LastAccessTime: marca temporal.

    La última vez que se obtuvo acceso a la partición.

  • StorageDescriptor: un objeto StorageDescriptor.

    Ofrece información sobre la ubicación física donde se almacena la partición.

  • Parameters: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Estos pares de clave-valor definen los parámetros de partición.

  • LastAnalyzedTime: marca temporal.

    La última vez que se calcularon las estadísticas de columna para esta partición.

Estructura PartitionSpecWithSharedStorageDescriptor

Especificación de partición para las particiones que comparten una ubicación física.

Campos
  • StorageDescriptor: un objeto StorageDescriptor.

    La información compartida sobre el almacenamiento físico.

  • Partitions: matriz de objetos Partición.

    Lista de las particiones que comparten esta ubicación física.

Estructura PartitionListComposingSpec

Muestra las particiones relacionadas.

Campos
  • Partitions: matriz de objetos Partición.

    Lista de las particiones en la especificación de composición.

Estructura PartitionSpecProxy

Ofrece una ruta hacia las particiones especificadas.

Campos
  • DatabaseName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    La base de datos de catálogos donde residen las particiones.

  • TableName: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla que contiene las particiones.

  • RootPath: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    La ruta raíz del proxy para abordar las particiones.

  • PartitionSpecWithSharedSD: un objeto PartitionSpecWithSharedStorageDescriptor.

    Especificación de las particiones que comparten la misma ubicación de almacenamiento física.

  • PartitionListComposingSpec: un objeto PartitionListComposingSpec.

    Especifica una lista de particiones.

Estructura PartitionValueList

Contiene una lista de valores que definen particiones.

Campos
  • ValuesObligatorio: una matriz de cadenas UTF-8.

    La lista de valores.

Estructura Segment

Define una región de particiones de una tabla que no se solapa, lo que permite ejecutar varias solicitudes a la vez.

Campos
  • SegmentNumberObligatorio: número (entero), cero como máximo.

    El número de índice de base cero del segmento. Por ejemplo, si el número total de segmentos es de 4, los valores SegmentNumber van de 0 a 3.

  • TotalSegmentsObligatorio: número (entero), uno como mínimo o 10 como máximo.

    El número total de segmentos.

Estructura PartitionError

Contiene información sobre un error de partición.

Campos
  • PartitionValues: matriz de cadenas UTF-8.

    Los valores que definen la partición.

  • ErrorDetail: un objeto ErrorDetail.

    Detalles sobre el error de la partición.

Estructura BatchUpdatePartitionFailureEntry

Contiene información sobre un error de partición de actualización por lotes.

Campos
  • PartitionValueList: matriz de cadenas UTF-8, con 100 cadenas como máximo.

    Una lista de los valores que definen las particiones.

  • ErrorDetail: un objeto ErrorDetail.

    Los detalles sobre el error de partición del actualización por lotes.

Estructura BatchUpdatePartitionRequestEntry

Una estructura que contiene los valores y la estructura utilizados para actualizar una partición.

Campos
  • PartitionValueListObligatorio: matriz de cadenas UTF-8, con 100 cadenas como máximo.

    Una lista de los valores que definen las particiones.

  • PartitionInput: obligatorio: objeto PartitionInput.

    La estructura que se utiliza para actualizar una partición.

Estructura StorageDescriptor

Describe el almacenamiento físico de los datos de la tabla.

Campos
  • Columns: matriz de objetos Columna.

    Una lista de las Columns de la tabla.

  • Location: cadena de ubicación de un máximo de 2056 bytes de largo, que coincide con el URI address multi-line string pattern.

    Ubicación física de la tabla. De forma predeterminada, adopta la forma de la ubicación de almacén, seguida de la ubicación de la base de datos en el almacén, seguida del nombre de tabla.

  • AdditionalLocations: matriz de cadenas UTF-8.

    Lista de ubicaciones que apuntan a la ruta en la que se encuentra una tabla Delta.

  • InputFormat: cadena de formato de un máximo de 128 bytes de largo, que coincide con el Single-line string pattern.

    Formato de entrada: SequenceFileInputFormat (binario), TextInputFormat o formato personalizado.

  • OutputFormat: cadena de formato de un máximo de 128 bytes de largo, que coincide con el Single-line string pattern.

    Formato de salida: SequenceFileOutputFormat (binario), IgnoreKeyTextOutputFormat o formato personalizado.

  • Compressed: booleano.

    True si los datos de la tabla están comprimidos o False si no.

  • NumberOfBuckets: número (entero).

    Debe especificarse si la tabla contiene alguna columna de dimensión.

  • SerdeInfo: un objeto SerDeInfo.

    La información de serialización y deserialización (SerDe).

  • BucketColumns: matriz de cadenas UTF-8.

    Lista de columnas de agrupamiento del reductor, columnas de clústeres y columnas de almacenamiento en bucket de la tabla.

  • SortColumns: matriz de objetos Order.

    Una lista donde se especifica el orden de clasificación de cada bucket en la tabla.

  • Parameters: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Las propiedades facilitadas por el usuario en formato clave-valor.

  • SkewedInfo: un objeto SkewedInfo.

    La información sobre los valores que aparecen con frecuencia en una columna (valores sesgados).

  • StoredAsSubDirectories: booleano.

    True si los datos de la tabla se almacenan en subdirectorios o False si no.

  • SchemaReference: un objeto SchemaReference.

    Objeto que hace referencia a un esquema almacenado en AWS Glue Schema Registry.

    Al crear una tabla, puede pasar una lista vacía de columnas para el esquema y, en su lugar, utilizar una referencia de esquema.

Estructura SchemaReference

Objeto que hace referencia a un esquema almacenado en AWS Glue Schema Registry.

Campos
  • SchemaId: un objeto SchemaId.

    Estructura que contiene campos de identidad de esquema. Este o el SchemaVersionId tiene que ser proporcionado.

  • SchemaVersionId: cadena UTF-8, con 36 bytes de largo como mínimo y 36 bytes de largo como máximo, que coincide con el Custom string pattern #17.

    El ID único asignado a una versión del esquema. Este o el SchemaId tiene que ser proporcionado.

  • SchemaVersionNumber: número (largo) que no es inferior a 1 ni es superior a 100 000.

    El número de versión del esquema.

Estructura SerDeInfo

Información sobre un programa de serialización y deserialización (SerDe) que sirve de extractor y cargador.

Campos
  • Name: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre del SerDe.

  • SerializationLibrary: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    En general, la clase que implementa el SerDe. Un ejemplo es org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe.

  • Parameters: matriz de mapas de pares clave-valor.

    Cada clave es una cadena de claves con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Cada valor es una cadena UTF-8 que no tiene más de 512000 bytes de largo.

    Estos pares de clave-valor definen parámetros de inicialización para el SerDe.

Estructura SkewedInfo

Especifica valores sesgados en una tabla. Los valores sesgados son los que se producen con una frecuencia muy alta.

Campos
  • SkewedColumnNames: matriz de cadenas UTF-8.

    Una lista de nombres de columnas que contienen valores de sesgado.

  • SkewedColumnValues: matriz de cadenas UTF-8.

    Una lista de valores que aparecen con tanta frecuencia como para considerarse de sesgado.

  • SkewedColumnValueLocationMaps: matriz de mapas de pares clave-valor.

    Cada clave es una cadena UTF-8.

    Cada valor es una cadena UTF-8.

    Un mapeo de valores de sesgado a las columnas que los contienen.

Operaciones

Acción CreatePartition (Python: create_partition)

Crea una partición nueva.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID de cuenta de AWS del catálogo en el que se creará la partición.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de metadatos donde se va a crear la partición.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla de datos de metadatos donde se va a crear la partición.

  • PartitionInput: obligatorio: objeto PartitionInput.

    Estructura PartitionInput que define la partición que se va a crear.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • InvalidInputException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • EntityNotFoundException

  • OperationTimeoutException

  • GlueEncryptionException

Acción BatchCreatePartition (Python: batch_create_partition)

Crea una o varias particiones en una operación por lotes.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo en el que se va a crear la partición. En la actualidad, debe ser el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de metadatos donde se va a crear la partición.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla de datos de metadatos donde se va a crear la partición.

  • PartitionInputListObligatorio: matriz de objetos PartitionInput, con 100 estructuras como máximo.

    Lista de estructuras PartitionInput que definen las particiones que se van a crear.

Respuesta
  • Errors: matriz de objetos PartitionError.

    Los errores encontrados al intentar crear las particiones solicitadas.

Errores
  • InvalidInputException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • EntityNotFoundException

  • OperationTimeoutException

  • GlueEncryptionException

Acción UpdatePartition (Python: update_partition)

Actualiza una partición.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo de datos donde reside la partición que se va a actualizar. Si no se proporciona ninguno, se usará de forma predeterminada el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde reside la tabla relevante.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla donde se encuentra la partición que se va a actualizar.

  • PartitionValueListObligatorio: matriz de cadenas UTF-8, con 100 cadenas como máximo.

    Lista de valores de clave de partición que definen la partición que se va a actualizar.

  • PartitionInput: obligatorio: objeto PartitionInput.

    El nuevo objeto de la partición para el que se actualiza la partición.

    La propiedad Values no puede modificarse. Si desea modificar los valores de clave de partición de una partición, elimine y vuelva a crear la partición.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

Acción DeletePartition (Python: delete_partition)

Elimina la partición especificada.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo de datos donde reside la partición que se va a eliminar. Si no se proporciona ninguno, se usará de forma predeterminada el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde reside la tabla relevante.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla que contiene la partición que se va a eliminar.

  • PartitionValuesObligatorio: una matriz de cadenas UTF-8.

    Los valores que definen la partición.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

Acción BatchDeletePartition (Python: batch_delete_partition)

Elimina una o varias particiones en una operación por lotes.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo de datos donde reside la partición que se va a eliminar. Si no se proporciona ninguno, se usará de forma predeterminada el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde reside la tabla relevante.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla que contiene las particiones que se van a eliminar.

  • PartitionsToDeleteObligatorio: matriz de objetos PartitionValueList, con 25 estructuras como máximo.

    Lista de estructuras PartitionInput que definen las particiones que se van a eliminar.

Respuesta
  • Errors: matriz de objetos PartitionError.

    Los errores encontrados al intentar eliminar las particiones solicitadas.

Errores
  • InvalidInputException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

Acción GetPartition (Python: get_partition)

Recupera información sobre una partición especificada.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo de datos donde reside la partición en cuestión. Si no se proporciona ninguno, se usará de forma predeterminada el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde reside la partición.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de particiones.

  • PartitionValuesObligatorio: una matriz de cadenas UTF-8.

    Los valores que definen la partición.

Respuesta
  • Partition: un objeto Partición.

    La información solicitada, con formato de objeto Partition.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • FederationSourceException

  • FederationSourceRetryableException

Acción GetPartitions (Python: get_partitions)

Recupera información acerca de las particiones de una tabla.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del Catálogo de datos donde residen las particiones en cuestión. Si no se proporciona ninguno, se usará de forma predeterminada el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde residen las particiones.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de las particiones.

  • Expression: cadena de predicado de un máximo de 2048 bytes de largo, que coincide con el URI address multi-line string pattern.

    Una expresión que filtra las particiones que se van a devolver.

    La expresión usa una sintaxis SQL similar a la cláusula de filtro WHERE de SQL. El analizador de instrucciones SQL JSQLParser analiza la expresión.

    Operadores: estos son los operadores que puede usar en la llamada a la API Expression:

    =

    Comprueba si los valores de los dos operandos son iguales o no; en caso afirmativo, la condición será "true".

    Ejemplo: supongamos que la "variable a" tiene 10 y, la "variable b", 20.

    (a = b) no es "true".

    < >

    Comprueba si los valores de los dos operandos son iguales o no; en caso negativo, la condición será "true".

    Ejemplo: (a < > b) es "true".

    >

    Comprueba si el valor del operando izquierdo es mayor que el valor del operando derecho; en caso afirmativo, la condición será "true".

    Ejemplo: (a > b) no es "true".

    <

    Comprueba si el valor del operando izquierdo es menor que el valor del operando derecho; en caso afirmativo, la condición será "true".

    Ejemplo: (a < b) es "true".

    >=

    Comprueba si el valor del operando izquierdo es mayor o igual que el valor del operando derecho; en caso afirmativo, la condición será "true".

    Ejemplo: (a >= b) no es "true".

    <=

    Comprueba si el valor del operando izquierdo es menor o igual que el valor del operando derecho; en caso afirmativo, la condición será "true".

    Ejemplo: (a <= b) es "true".

    AND, OR, IN, BETWEEN, LIKE, NOT, IS NULL

    Operadores lógicos.

    Tipos de clave de partición admitidos: estas son las claves de partición admitidas.

    • string

    • date

    • timestamp

    • int

    • bigint

    • long

    • tinyint

    • smallint

    • decimal

    Si se encuentra un tipo no válido, se produce una excepción.

    En la siguiente lista se muestran todos los tipos de operador válido. Al definir un rastreador, se crea el tipo partitionKey como STRING, para ser compatible con las particiones del catálogo.

    Ejemplo de llamada a la API:

    La tabla twitter_partition tiene tres particiones:

    year = 2015 year = 2016 year = 2017

    Get Partition year equivale a 2015

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year*=*'2015'"

    Get Partition year entre 2016 y 2018 (exclusivo)

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year>'2016' AND year<'2018'"

    Get Partition year entre 2015 y 2018 (incluido). Las siguientes llamadas a la API son equivalentes entre sí:

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year>='2015' AND year<='2018'" aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year BETWEEN 2015 AND 2018" aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year IN (2015,2016,2017,2018)"

    Filtro comodín de partición, donde la siguiente salida de llamadas será el año de partición, 2017. No se admite una expresión regular en LIKE.

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year LIKE '%7'"
  • NextToken: cadena UTF-8.

    Token de continuación, si no es la primera llamada para recuperar estas particiones.

  • Segment: un objeto Segmento.

    El segmento de las particiones de la tabla que se va a analizar en esta solicitud.

  • MaxResults: número (entero) que no es inferior a 1 ni es superior a 1000.

    El número máximo de particiones que se devuelven en una única respuesta.

  • ExcludeColumnSchema: booleano.

    Si es verdadero, especifica no devolver el esquema de columna de partición. Es útil cuando solo está interesado en otros atributos de partición, como valores de partición o ubicación. Este enfoque evita el problema de una respuesta grande al no devolver datos duplicados.

  • TransactionId: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Custom string pattern #16.

    ID de transacción en el que se va a leer el contenido de la partición.

  • QueryAsOfTime: marca temporal.

    El momento a partir del que se debe leer el contenido de la partición. Si no se establece, se utilizará el tiempo de confirmación de la transacción más reciente. No se puede especificar junto con TransactionId.

Respuesta
  • Partitions: matriz de objetos Partición.

    Lista de particiones solicitadas.

  • NextToken: cadena UTF-8.

    Un token de continuación, si la lista de particiones que se devuelve no incluye la última.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

  • InvalidStateException

  • ResourceNotReadyException

  • FederationSourceException

  • FederationSourceRetryableException

Acción BatchGetPartition (Python: batch_get_partition)

Recupera particiones en una solicitud por lotes.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del Catálogo de datos donde residen las particiones en cuestión. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde residen las particiones.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de las particiones.

  • PartitionsToGetObligatorio: matriz de objetos PartitionValueList, con 1000 estructuras como máximo.

    Lista de los valores de partición que identifican las particiones que se van a recuperar.

Respuesta
  • Partitions: matriz de objetos Partición.

    Lista de las particiones solicitadas.

  • UnprocessedKeys: matriz de objetos PartitionValueList, con 1000 estructuras como máximo.

    Una lista de los valores de partición en la solicitud para la que no se devolvieron particiones.

Errores
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

  • InvalidStateException

  • FederationSourceException

  • FederationSourceRetryableException

Acción BatchUpdatePartition (Python: batch_update_partition)

Actualiza una o varias particiones en una operación por lotes.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del catálogo en el que se va a actualizar la partición. En la actualidad, debe ser el ID de cuenta de AWS.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de metadatos donde se va a actualizar la partición.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la tabla de metadatos donde se va a actualizar la partición.

  • EntriesObligatorio: una matriz de objetos BatchUpdatePartitionRequestEntry, con 1 estructura como mínimo y 100 estructuras como máximo.

    Lista de hasta 100 objetos BatchUpdatePartitionRequestEntry que se van a actualizar.

Respuesta
  • Errors: matriz de objetos BatchUpdatePartitionFailureEntry.

    Los errores encontrados al intentar actualizar las particiones solicitadas. Una lista de objetos BatchUpdatePartitionFailureEntry.

Errores
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

Acción GetColumnStatisticsForPartition (Python: get_column_statistics_for_partition)

Recupera estadísticas de las columnas de las particiones.

El permiso de Identity and Access Management (IAM) necesario para esta operación es GetPartition.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del Catálogo de datos donde residen las particiones en cuestión. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde residen las particiones.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de las particiones.

  • PartitionValuesObligatorio: una matriz de cadenas UTF-8.

    Una lista de los valores de las particiones que identifican la partición.

  • ColumnNamesObligatorio: matriz de cadenas UTF-8, con 100 cadenas como máximo.

    Una lista de los nombres de las columnas.

Respuesta
  • ColumnStatisticsList: matriz de objetos ColumnStatistics.

    Lista de ColumnStatistics que no se pudieron recuperar.

  • Errors: matriz de objetos ColumnError.

    Error al recuperar los datos estadísticos de la columna.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

Acción UpdateColumnStatisticsForPartition (Python: update_column_statistics_for_partition)

Crea o actualiza las estadísticas de las columnas de las particiones.

El permiso de Identity and Access Management (IAM) necesario para esta operación es UpdatePartition.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del Catálogo de datos donde residen las particiones en cuestión. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde residen las particiones.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de las particiones.

  • PartitionValuesObligatorio: una matriz de cadenas UTF-8.

    Una lista de los valores de las particiones que identifican la partición.

  • ColumnStatisticsListObligatorio: matriz de objetos ColumnStatistics, con 25 estructuras como máximo.

    Una lista de las estadísticas de las columnas.

Respuesta
  • Errors: matriz de objetos ColumnaStatisticsError.

    Error al actualizar los datos de estadísticas de columna.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

Acción DeleteColumnStatisticsForPartition (Python: delete_column_statistics_for_partition)

Elimine las estadísticas de columnas de la partición de una columna.

El permiso de Identity and Access Management (IAM) necesario para esta operación es DeletePartition.

Solicitud
  • CatalogId: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El ID del Catálogo de datos donde residen las particiones en cuestión. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.

  • DatabaseName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la base de datos de catálogos donde residen las particiones.

  • TableName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre de la tabla de las particiones.

  • PartitionValuesObligatorio: una matriz de cadenas UTF-8.

    Una lista de los valores de las particiones que identifican la partición.

  • ColumnName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre de la columna.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException