Tipos de dados comuns - AWS Glue

Tipos de dados comuns

Tipos de dados comuns descrevem os diversos tipos de dados comuns no AWS Glue.

Estrutura Tag

O objeto Tag representa um rótulo que pode ser atribuído a um recurso da AWS. Cada tag consiste em uma chave e um valor opcional, ambos definidos por você.

Para obter mais informações sobre tags e como controlar o acesso aos recursos no AWS Glue, consulte Marcações da AWS no AWS Glue) e Especificação de ARNs de recurso no AWS Glue no guia do desenvolvedor.

Campos
  • key – String UTF-8, superior a 1 e inferior a 128 bytes de comprimento.

    A chave de tags. A chave é necessária ao criar uma tag em um objeto. A chave diferencia maiúsculas de minúsculas e não deve conter o prefixo aws.

  • value – String UTF-8 com comprimento não superior a 256 bytes.

    O valor da tag. O valor é opcional ao criar uma tag em um objeto. O valor diferencia maiúsculas de minúsculas e não deve conter o prefixo aws.

Estrutura DecimalNumber

Contém um valor numérico em formato decimal.

Campos
  • UnscaledValue: obrigatório: blob.

    O valor numérico não escalado.

  • Scale: obrigatório: número (inteiro).

    A escala que determina a posição do ponto decimal no valor não escalado.

Estrutura ErrorDetail

Contém detalhes sobre um erro.

Campos
  • ErrorCode – String UTF-8, superior a 1 e inferior a 255 bytes de comprimento, correspondente a Single-line string pattern.

    O código associado a este erro.

  • ErrorMessage – String de descrição, inferior a 2048 bytes de comprimento, correspondente a URI address multi-line string pattern.

    Uma mensagem descrevendo o erro.

Estrutura PropertyPredicate

Define um predicado de propriedade.

Campos
  • Key: valor de string não superior a 1.024 bytes de comprimento.

    A chave da propriedade.

  • Value: valor de string não superior a 1.024 bytes de comprimento.

    O valor da propriedade.

  • Comparator – String UTF-8 (valores válidos: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    O comparador costumava comparar esta propriedade com outras.

Estrutura ResourceUri

Os URIs para recursos de função.

Campos
  • ResourceType – String UTF-8 (valores válidos: JAR | FILE | ARCHIVE).

    O tipo de recurso.

  • Uri – URI (Uniform Resource Identifier), maior que 1 ou maior que 1024 bytes de comprimento, correspondente a URI address multi-line string pattern.

    O URI para acessar o recurso.

Estrutura ColumnStatistics

Representa as estatísticas de nível de coluna geradas para uma tabela ou partição.

Campos
  • ColumnNameObrigatório: string UTF-8, no mínimo 1 ou mais de 255 bytes de comprimento, correspondente a Single-line string pattern.

    Nome da coluna à qual as estatísticas pertencem.

  • ColumnType: obrigatório: nome do tipo, no máximo 20.000 bytes de comprimento, correspondente a Single-line string pattern.

    O tipo de dados da coluna.

  • AnalyzedTime: obrigatório: carimbo de data e hora.

    O carimbo de data e hora do momento em que as estatísticas da coluna foram geradas.

  • StatisticsDataObrigatório: um objeto ColumnStatisticsData.

    Um objeto ColumnStatisticData que contém os valores de dados de estatísticas.

Estrutura ColumnStatisticsError

Encapsula um objeto ColumnStatistics que tenha falhado e o motivo da falha.

Campos
  • ColumnStatistics – Um objeto ColumnStatistics.

    As ColumnStatistics da coluna.

  • Error – Um objeto ErrorDetail.

    Uma mensagem de erro com o motivo da falha de uma operação.

Estrutura ColumnError

Encapsula um nome de coluna que tenha falhado e o motivo da falha.

Campos
  • ColumnName – String UTF-8, superior a 1 e inferior a 255 bytes de comprimento, correspondente a Single-line string pattern.

    O nome da coluna que falhou.

  • Error – Um objeto ErrorDetail.

    Uma mensagem de erro com o motivo da falha de uma operação.

Estrutura ColumnStatisticsData

Contém os tipos individuais de dados de estatísticas de coluna. Apenas um objeto de dados deve ser definido e indicado pelo atributo Type.

Campos
  • Type: obrigatório: string UTF-8 (valores válidos: BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY).

    O tipo de dados de estatísticas de coluna.

  • BooleanColumnStatisticsData – Um objeto BooleanColumnStatisticsData.

    Dados de estatísticas de coluna booleanos.

  • DateColumnStatisticsData – Um objeto DateColumnStatisticsData.

    Dados de estatísticas de coluna de data.

  • DecimalColumnStatisticsData – Um objeto DecimalColumnStatisticsData.

    Dados de estatísticas de coluna decimais. UnscaledValues internos são objetos binários codificados na Base64 que armazenam representações big-endian de complemento de dois do valor da decimal sem escala.

  • DoubleColumnStatisticsData – Um objeto DoubleColumnStatisticsData.

    Dados de estatísticas de coluna double.

  • LongColumnStatisticsData – Um objeto LongColumnStatisticsData.

    Dados de estatísticas de coluna inteiros longos.

  • StringColumnStatisticsData – Um objeto StringColumnStatisticsData.

    Dados de estatísticas de coluna de string.

  • BinaryColumnStatisticsData – Um objeto BinaryColumnStatisticsData.

    Dados de estatísticas de coluna binários.

Estrutura BooleanColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados booleanos.

Campos
  • NumberOfTrues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores true na coluna.

  • NumberOfFalses: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores false na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

Estrutura DateColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados de carimbo de data e hora.

Campos
  • MinimumValue – Timestamp.

    O valor mais baixo na coluna.

  • MaximumValue – Timestamp.

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura DecimalColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados de números de ponto fixo.

Campos
  • MinimumValue – Um objeto DecimalNumber.

    O valor mais baixo na coluna.

  • MaximumValue – Um objeto DecimalNumber.

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura DoubleColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados de números de ponto flutuante.

Campos
  • MinimumValue – Número (duplo).

    O valor mais baixo na coluna.

  • MaximumValue – Número (duplo).

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura LongColumnStatisticsData

Define estatísticas de coluna suportadas para colunas de dados inteiros.

Campos
  • MinimumValue – Número (extenso).

    O valor mais baixo na coluna.

  • MaximumValue – Número (extenso).

    O valor mais alto na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura StringColumnStatisticsData

Define estatísticas de coluna suportadas para valores de dados de sequência de caracteres.

Campos
  • MaximumLength: obrigatório: número (inteiro longo), no máximo nenhum.

    O tamanho da string mais longa na coluna.

  • AverageLength: obrigatório: número (double), no máximo nenhum.

    O comprimento médio da string na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

  • NumberOfDistinctValues: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores distintos em uma coluna.

Estrutura BinaryColumnStatisticsData

Define estatísticas de coluna suportadas para valores de dados de sequência de bits.

Campos
  • MaximumLength: obrigatório: número (inteiro longo), no máximo nenhum.

    O tamanho da sequência de bits mais longa na coluna.

  • AverageLength: obrigatório: número (double), no máximo nenhum.

    O comprimento médio da sequência de bits na coluna.

  • NumberOfNulls: obrigatório: número (inteiro longo), no máximo nenhum.

    O número de valores nulos na coluna.

Padrões de string

A API usa as seguintes expressões regulares para definir o que é conteúdo válido para vários membros e parâmetros de string:

  • Single-line string pattern – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • Padrão de string com várias linhas de endereço URI – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Um padrão de string Logstash Grok – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Padrão de string do identificador – "[A-Za-z_][A-Za-z0-9_]*"

  • Padrão de string do ARN da AWS IAM – "arn:aws:iam::\d{12}:role/.*"

  • Versão do padrão de string – "^[a-zA-Z0-9-_]+$"

  • Padrão de string do grupo de logs – "[\.\-_/#A-Za-z0-9]+"

  • Padrão de string do stream de logs – "[^:*]*"

  • Padrão de string personalizado n.º 10: “[^\r\n]

  • Padrão de string personalizado n.º 11: “^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$

  • Padrão de string personalizado n.º 12: “^(https?)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]

  • Padrão de string personalizado n.º 13: “\S+

  • Padrão de string personalizado n.º 14: “^(https?):\/\/[^\s/$.?#].[^\s]*$

  • Padrão de string personalizado n.º 15: “^subnet-[a-z0-9]+$

  • Padrão de string personalizado n.º 16: “[\p{L}\p{N}\p{P}]*

  • Padrão de string personalizado n.º 17: “[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}

  • Padrão de string personalizado n.º 18: “[a-zA-Z0-9-_$#.]+

  • Padrão de string personalizado n.º 19: “^\w+\.\w+\.\w+$

  • Padrão de string personalizado n.º 20: “^\w+\.\w+$

  • Padrão de string personalizado n.º 21: “^([2-3]|3[.]9)$

  • Padrão de string personalizado n.º 22: “arn:(aws|aws-us-gov|aws-cn):glue:.*

  • Padrão de string personalizado n.º 23: "(^arn:aws:iam::\w{12}:root)"

  • Padrão de string personalizado n.º 24: "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+"

  • Padrão de string personalizado n.º 25: "arn:aws:kms:.*"

  • Padrão de string personalizado n.º 26: "arn:aws[^:]*:iam::[0-9]*:role/.+"

  • Padrão de string personalizado n.º 27: "[\.\-_A-Za-z0-9]+"

  • Padrão de string personalizado n.º 28: "^s3://([^/]+)/([^/]+/)*([^/]+)$"

  • Padrão de string personalizado n.º 29: ".*"

  • Padrão de string personalizado n.º 30: "^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$"

  • Padrão de string personalizado n.º 31: "[a-zA-Z0-9_.-]+"

  • Padrão de string personalizado n.º 32: "[A-Z][A-Za-z\.]+"

  • Padrão de string personalizado n.º 33: ".*\S.*"

  • Padrão de string personalizado n.º 34: "[a-zA-Z0-9-=._/@]+"

  • Padrão de string personalizado n.º 35: "[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*"

  • Padrão de string personalizado n.º 36: "[\s\S]*"

  • Padrão de string personalizado n.º 37: "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*"

  • Padrão de string personalizado n.º 38: "^[A-Z\_]+$"

  • Padrão de string personalizado n.º 39: "^[A-Za-z0-9]+$"

  • Padrão de string personalizado n.º 40: "[*A-Za-z0-9_-]*"

  • Padrão de string personalizado n.º 41: "([\u0020-\u007E\r\s\n])*"

  • Padrão de string personalizado n.º 42: "[A-Za-z0-9_-]*"

  • Padrão de string personalizado n.º 43: “([\u0009\u000B\u000C\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF])*

  • Padrão de string personalizado n.º 44: “([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*

  • Padrão de string personalizado n.º 45: “([^\r\n])*