Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Partitions-API
Die Partitions-API beschreibt Datentypen und Operationen für die Arbeit mit Partitionen.
Datentypen
Partitionsstruktur
Stellt ein Segment der Tabellendaten dar.
Felder
-
Values
– Ein UTF-8-Zeichenfolgen-Array.Die Werte der Partition.
-
DatabaseName
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die Name der Katalogdatenbank, in der die Partition angelegt wird.
-
TableName
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Datenbanktabelle, in der die Partition erstellt wird.
-
CreationTime
– Zeitstempel.Die Uhrzeit, zu der die Partition erstellt wurde.
-
LastAccessTime
– Zeitstempel.Die Uhrzeit, zu der das letzte Mal auf die Partition zugegriffen wurde.
-
StorageDescriptor
– Ein StorageDescriptor-Objekt.Stellt Informationen über den physischen Standort bereit, an dem die Partition gespeichert ist.
-
Parameters
– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.
Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.
Diese Schlüssel-Wert-Paare definieren Partitionsparameter.
-
LastAnalyzedTime
– Zeitstempel.Der letzte Zeitpunkt, zu dem die Spaltenstatistiken für diese Partition berechnet wurden.
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalogs, in dem die Partition gespeichert ist.
PartitionInput Struktur
Die Struktur, die zum Erstellen und Aktualisieren einer Partition verwendet wird.
Felder
-
Values
– Ein UTF-8-Zeichenfolgen-Array.Die Werte der Partition. Obwohl dieser Parameter nicht von der SDK gefordert wird, müssen Sie diesen Parameter als einen gültigen Wert angeben.
Die Werte für die Schlüssel für die neue Partition müssen als Array von Zeichenfolgenobjekten übergeben werden, die in derselben Reihenfolge wie die Partitionsschlüssel im Amazon S3-Präfix sortiert werden müssen. Andernfalls AWS Glue werden die Werte zu den falschen Schlüsseln hinzugefügt.
-
LastAccessTime
– Zeitstempel.Die Uhrzeit, zu der das letzte Mal auf die Partition zugegriffen wurde.
-
StorageDescriptor
– Ein StorageDescriptor-Objekt.Stellt Informationen über den physischen Standort bereit, an dem die Partition gespeichert ist.
-
Parameters
– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.
Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.
Diese Schlüssel-Wert-Paare definieren Partitionsparameter.
-
LastAnalyzedTime
– Zeitstempel.Der letzte Zeitpunkt, zu dem die Spaltenstatistiken für diese Partition berechnet wurden.
PartitionSpecWithSharedStorageDescriptor Struktur
Eine Partitionsspezifikation für Partitionen mit einem gemeinsamen physischen Standort.
Felder
-
StorageDescriptor
– Ein StorageDescriptor-Objekt.Die freigegebenen physischen Speicherinformationen.
-
Partitions
– Ein Array mit Partition-Objekten.Eine Liste der Partitionen, die diesen physischen Standort gemeinsam verwenden.
PartitionListComposingSpec Struktur
Listet die zugehörigen Partitionen auf.
Felder
-
Partitions
– Ein Array mit Partition-Objekten.Eine Liste der Partitionen in der Erstellungsspezifikation.
PartitionSpecProxy Struktur
Bietet einen Stammpfad für angegebene Partitionen.
Felder
-
DatabaseName
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die Katalogdatenbank, in der die Partitionen gespeichert sind.
-
TableName
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Tabelle, die die Partitionen enthält.
-
RootPath
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Stammpfad des Proxys zur Adressierung der Partitionen.
-
PartitionSpecWithSharedSD
– Ein PartitionSpecWithSharedStorageDescriptor-Objekt.Eine Spezifikation für Partitionen, die denselben physischen Standort verwenden.
-
PartitionListComposingSpec
– Ein PartitionListComposingSpec-Objekt.Gibt eine Liste der Partitionen an.
PartitionValueList Struktur
Enthält eine Liste von Werten zur Definition von Partitionen.
Felder
-
Values
– Erforderlich: Ein Array von UTF-8 Zeichenketten.Die Liste der Werte.
Segmentstruktur
Definiert eine nicht überlappende Region der Partitionen einer Tabelle, sodass mehrere Anforderungen parallel ausgeführt werden können.
Felder
-
SegmentNumber
– Erforderlich: Zahl (Ganzzahl), nicht mehr als Keine.Die nullbasierte Indexnummer dieses Segments. Wenn beispielsweise die Gesamtzahl der Segmente 4 ist, liegen die
SegmentNumber
-Werte im Bereich von 0 bis 3. -
TotalSegments
– Erforderlich:Zahl (Ganzzahl), nicht weniger als 1 oder mehr als 10.Die Gesamtzahl der Segmente.
PartitionError Struktur
Enthält Informationen zu einem Partitionsfehler.
Felder
-
PartitionValues
– Ein UTF-8-Zeichenfolgen-Array.Die Werte, die die Partition definieren.
-
ErrorDetail
– Ein ErrorDetail-Objekt.Details zum Partitionsfehler.
BatchUpdatePartitionFailureEntry Struktur
Enthält Informationen zu einem Batch-Update-Partitionsfehler.
Felder
-
PartitionValueList
– Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.Eine Liste der Werte zur Definition der Partitionen.
-
ErrorDetail
– Ein ErrorDetail-Objekt.Details zum Batch-Update-Partitionsfehler.
BatchUpdatePartitionRequestEntry Struktur
Eine Struktur, welche die Werte und die Struktur enthält, die zum Aktualisieren einer Partition verwendet werden.
Felder
-
PartitionValueList
– Erforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.Eine Liste der Werte zur Definition der Partitionen.
-
PartitionInput
– Erforderlich: Ein PartitionInput-Objekt.Die Struktur, die zum Aktualisieren einer Partition verwendet wird.
StorageDescriptor Struktur
Beschreibt den physischen Speicher von Tabellendaten.
Felder
-
Columns
– Ein Array mit Spalte-Objekten.Eine Liste der
Columns
in der Tabelle. -
Location
– Standort-Zeichenfolge, nicht mehr als 2056 Bytes lang, passend zum URI address multi-line string pattern.Der physische Speicherort der Tabelle. Standardmäßig ist dies der Lager-Speicherort, gefolgt vom Datenbank-Standort in der Lagerorganisation, gefolgt vom Namen der Tabelle.
-
AdditionalLocations
– Ein UTF-8-Zeichenfolgen-Array.Eine Liste von Speicherorten, die auf den Pfad verweisen, in dem sich eine Delta-Tabelle befindet.
-
InputFormat
– Format-Zeichenfolge, nicht mehr als 128 Bytes lang, passend zum Single-line string pattern.Eingabeformat
SequenceFileInputFormat
(binär),TextInputFormat
oder ein benutzerdefiniertes Format. -
OutputFormat
– Format-Zeichenfolge, nicht mehr als 128 Bytes lang, passend zum Single-line string pattern.Ausgabeformat
SequenceFileOutputFormat
(binär),IgnoreKeyTextOutputFormat
oder ein benutzerdefiniertes Format. -
Compressed
– Boolesch.True
, wenn die Daten in der Tabelle komprimiert sind undFalse
, wenn dies nicht der Fall ist. -
NumberOfBuckets
– Zahl (Ganzzahl).Muss angegeben werden, wenn die Tabelle Dimensionsspalten enthält.
-
SerdeInfo
– Ein SerDeInformationen-Objekt.Die Informationen zur Serialisierung/Deserialisierung (). SerDe
-
BucketColumns
– Ein UTF-8-Zeichenfolgen-Array.Eine Liste mit Reducer-Gruppierungsspalten, Cluster-Spalten und Bucketing-Spalten in der Tabelle.
-
SortColumns
– Ein Array mit Order-Objekten.Eine Liste mit der Sortierreihenfolge der einzelnen Buckets in der Tabelle.
-
Parameters
– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.
Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.
Vom Benutzer angegebene Eigenschaften im Schlüssel-Wert-Format.
-
SkewedInfo
– Ein SkewedInfo-Objekt.Informationen über Werte, die sehr häufig in einer Spalte vorkommen (verzerrte Werte).
-
StoredAsSubDirectories
– Boolesch.True
, wenn die Tabellendaten in Unterverzeichnissen gespeichert werden, andernfallsFalse
. -
SchemaReference
– Ein SchemaReference-Objekt.Ein Objekt, das auf ein in der Schemaregistry gespeichertes Schema verweist. AWS Glue
Beim Erstellen einer Tabelle können Sie eine leere Liste von Spalten für das Schema übergeben und stattdessen eine Schemaverweisung verwenden.
SchemaReference Struktur
Ein Objekt, das auf ein in der Schemaregistry gespeichertes AWS Glue Schema verweist.
Felder
-
SchemaId
– Ein SchemaId-Objekt.Eine Struktur, die Schema-Identitätsfelder enthält. Entweder dies oder
SchemaVersionId
muss zur Verfügung gestellt werden. -
SchemaVersionId
– UTF-8-Zeichenfolge, nicht weniger als 36 oder mehr als 36 Bytes lang, passend zum Custom string pattern #17.Die eindeutige ID, die einer Version des Schemas zugewiesen ist. Entweder dies oder
SchemaId
muss zur Verfügung gestellt werden. -
SchemaVersionNumber
– Zahl (lang), nicht kleiner als 1 oder größer als 100 000.Die Versionsnummer des Schemas.
SerDeInfo Struktur
Informationen über ein Serialisierungs-/Deserialisierungsprogramm (SerDe), das als Extraktor und Loader dient.
Felder
-
Name
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.SerDeName des.
-
SerializationLibrary
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Normalerweise die Klasse, die das implementiert SerDe. Ein Beispiel ist
org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe
. -
Parameters
– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.
Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.
Diese Schlüssel-Wert-Paare definieren Initialisierungsparameter für. SerDe
SkewedInfo Struktur
Gibt verzerrte Werte in einer Tabelle an. Verzerrte Werte sind solche, die mit sehr hoher Häufigkeit auftreten.
Felder
-
SkewedColumnNames
– Ein UTF-8-Zeichenfolgen-Array.Eine Liste der Namen von Spalten, die verzerrte Werte enthalten.
-
SkewedColumnValues
– Ein UTF-8-Zeichenfolgen-Array.Eine Liste der Werte, die so häufig auftreten, dass sie als verzerrt betrachtet werden.
-
SkewedColumnValueLocationMaps
– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8-Zeichenfolge.
Jeder Wert ist eine UTF-8-Zeichenfolge.
Ein Mapping verzerrter Werte zu den Spalten, die sie enthalten.
Operationen
BatchCreatePartition Aktion (Python: batch_create_partition)
BatchDeletePartition Aktion (Python: batch_delete_partition)
BatchUpdatePartition Aktion (Python: batch_update_partition)
GetColumnStatisticsForPartition Aktion (Python: get_column_statistics_for_partition)
UpdateColumnStatisticsForPartition Aktion (Python: update_column_statistics_for_partition)
DeleteColumnStatisticsForPartition Aktion (Python: delete_column_statistics_for_partition)
CreatePartition Aktion (Python: create_partition)
Erstellt eine neue Partition.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die AWS Konto-ID des Katalogs, in dem die Partition erstellt werden soll.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Metadatendatenbank, in der die Partition erstellt werden soll.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Metadatendatentabelle, in der die Partition erstellt werden soll.
-
PartitionInput
– Erforderlich: Ein PartitionInput-Objekt.Eine
PartitionInput
-Struktur, die die zu erstellende Partition definiert.
Antwort
Keine Antwortparameter.
Fehler
InvalidInputException
AlreadyExistsException
ResourceNumberLimitExceededException
InternalServiceException
EntityNotFoundException
OperationTimeoutException
GlueEncryptionException
BatchCreatePartition Aktion (Python: batch_create_partition)
Erstellt eine oder mehrere Partitionen in einem Batchvorgang.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Katalogs, in dem die Partition erstellt wird. Derzeit sollte dies die Konto-ID sein. AWS
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Metadatendatenbank, in der die Partition erstellt werden soll.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Metadatendatentabelle, in der die Partition erstellt werden soll.
-
PartitionInputList
– Erforderlich: Ein Array mit PartitionInput-Objekten, nicht mehr als 100 Strukturen.Eine Liste der
PartitionInput
-Strukturen, die die zu erstellenden Partitionen definieren.
Antwort
-
Errors
– Ein Array mit PartitionError-Objekten.Die beim Erstellen der angeforderten Partitionen aufgetretenen Fehler.
Fehler
InvalidInputException
AlreadyExistsException
ResourceNumberLimitExceededException
InternalServiceException
EntityNotFoundException
OperationTimeoutException
GlueEncryptionException
UpdatePartition Aktion (Python: update_partition)
Aktualisiert eine Partition.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die zu aktualisierende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die entsprechende Tabelle befindet.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Tabelle, in der sich die zu aktualisierende Partition befindet.
-
PartitionValueList
– Erforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.Liste von Partitionsschlüsselwerten, welche die Partition definieren.
-
PartitionInput
– Erforderlich: Ein PartitionInput-Objekt.Das neue Partitionsobjekt zur Aktualisierung der Partition.
Die
Values
-Eigenschaft kann nicht geändert werden. Wenn Sie die Partitionsschlüsselwerte für eine Partition ändern möchten, löschen Sie die Partition und erstellen Sie sie neu.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundException
InvalidInputException
InternalServiceException
OperationTimeoutException
GlueEncryptionException
DeletePartition Aktion (Python: delete_partition)
Löscht eine angegebene Partition.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die zu löschende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die entsprechende Tabelle befindet.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Tabelle, die die Partition enthält, die gelöscht werden soll.
-
PartitionValues
– Erforderlich: Ein Array von UTF-8-Zeichenketten.Die Werte, die die Partition definieren.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundException
InvalidInputException
InternalServiceException
OperationTimeoutException
BatchDeletePartition Aktion (Python: batch_delete_partition)
Löscht eine oder mehrere Partitionen in einem Batchvorgang.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die zu löschende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die entsprechende Tabelle befindet.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Tabelle, die die Partitionen enthält, die gelöscht werden sollen.
-
PartitionsToDelete
– Erforderlich: Ein Array mit PartitionValueListe-Objekten, nicht mehr als 25 Strukturen.Eine Liste der
PartitionInput
-Strukturen, die die zu löschenden Partitionen definieren.
Antwort
-
Errors
– Ein Array mit PartitionError-Objekten.Die beim Löschen der angeforderten Partitionen aufgetretenen Fehler.
Fehler
InvalidInputException
EntityNotFoundException
InternalServiceException
OperationTimeoutException
GetPartition Aktion (Python: get_partition)
Ruft Informationen zu einer bestimmten Partition ab.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die entsprechende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die Partition befindet.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Partitionstabelle.
-
PartitionValues
– Erforderlich: Ein Array von UTF-8-Zeichenketten.Die Werte, die die Partition definieren.
Antwort
-
Partition
– Ein Partition-Objekt.Die angeforderten Informationen in Form eines
Partition
-Objekts.
Fehler
EntityNotFoundException
InvalidInputException
InternalServiceException
OperationTimeoutException
GlueEncryptionException
FederationSourceException
FederationSourceRetryableException
GetPartitions Aktion (Python: get_partitions)
Ruft Informationen über die Partitionen in einer Tabelle ab.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die Partitionen befinden.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Partitionentabelle.
-
Expression
– Prädikatszeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Ein Ausdruck, der die Partitionen filtert, die zurückgegeben werden sollen.
Der Ausdruck verwendet SQL-Syntax ähnlich wie die SQL-Filterklausel
WHERE
. Die SQL-Anweisungsparser JSQLParseranalysiert den Ausdruck. Operatoren: Im Folgenden finden Sie die Operatoren, die Sie im
Expression
API-Aufruf verwenden können:- =
-
Prüft, ob die Werte der beiden Operanden gleich sind. Wenn ja, wird die Bedingung wahr.
Beispiel: Angenommen, 'variable a' hat den Wert 10, und 'variable b' hat den Wert 20.
(a = b) ist nicht wahr.
- < >
-
Prüft, ob die Werte der beiden Operanden gleich sind. Sind die Werte nicht gleich, wird die Bedingung wahr.
Beispiel: (a < > b) ist wahr.
- >
-
Prüft, ob der Wert des linken Operanden größer als der Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.
Beispiel: (a > b) ist nicht wahr.
- <
-
Prüft, ob der Wert des linken Operanden kleiner als der Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.
Beispiel: (a < b) ist wahr.
- >=
-
Prüft, ob der Wert des linken Operanden größer oder gleich dem Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.
Beispiel: (a >= b) ist nicht wahr.
- <=
-
Prüft, ob der Wert des linken Operanden kleiner oder gleich dem Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.
Beispiel: (a <= b) ist wahr.
- AND, OR, IN, BETWEEN, LIKE, NOT, IS NULL
-
Logische Operatoren.
Unterstützte Partitionsschlüsseltypen: Im Folgenden finden Sie die unterstützten Partitionsschlüssel.
-
string
-
date
-
timestamp
-
int
-
bigint
-
long
-
tinyint
-
smallint
-
decimal
Wird ein Typ erkannt, der nicht gültig ist, wird eine Ausnahme ausgegeben.
Die folgende Liste zeigt die gültigen Operatoren für jeden Typ. Wenn Sie einen Crawler definieren, wird der
partitionKey
-Typ alsSTRING
erstellt, damit er mit den Katalogpartitionen kompatibel ist.API-Beispielaufruf:
Die Tabelle
twitter_partition
hat drei Partitionen:year = 2015 year = 2016 year = 2017
Partition
year
gleich 2015 abrufebaws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year*=*'2015'"
Partition
year
zwischen 2016 und 2018 (ausschließlich) abrufenaws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year>'2016' AND year<'2018'"
Partition
year
zwischen 2015 und 2018 (einschließlich) abrufen. Die folgenden API-Aufrufe sind miteinander äquivalent:aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year>='2015' AND year<='2018'" aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year BETWEEN 2015 AND 2018" aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year IN (2015,2016,2017,2018)"
Ein Platzhalter-Partitionsfilter, wobei die Ausgabe des folgendes Aufrufs Partition Jahr = 2017 ist. Ein regulärer Ausdruck wird in
LIKE
nicht unterstützt.aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year LIKE '%7'"
-
NextToken
– UTF-8-Zeichenfolge.Ein Fortsetzungs-Token, wenn dies nicht der erste Aufruf zum Abrufen dieser Partitionen ist.
-
Segment
– Ein Segment-Objekt.Das Segment der Tabellenpartitionen, das in dieser Anforderung gescannt werden soll.
-
MaxResults
– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Gibt die maximale Anzahl der Partitionen an, die in einer Antwort zurückzugeben sind.
-
ExcludeColumnSchema
– Boolesch.Wenn der Wert „true“ ist, wird das Partitionsspaltenschema nicht zurückgegeben. Nützlich, wenn Sie nur an anderen Partitionsattributen wie Partitionswerten oder Speicherort interessiert sind. Bei diesem Ansatz wird eine große Antwort vermieden, da keine doppelten Daten zurückgegeben werden.
-
TransactionId
– UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Custom string pattern #16.Die Transaktions-ID, an der der Partitionsinhalt gelesen werden soll.
-
QueryAsOfTime
– Zeitstempel.Die Zeit, zu der der Partitionsinhalt gelesen werden muss. Wenn nicht festgelegt, wird die letzte Transaktions-Commit-Zeit verwendet. Kann nicht zusammen mit
TransactionId
angegeben werden.
Antwort
-
Partitions
– Ein Array mit Partition-Objekten.Eine Liste von angeforderten Partitionen.
-
NextToken
– UTF-8-Zeichenfolge.Ein Fortsetzungs-Token, falls die zurückgegebene Liste der Partitionen die letzte nicht enthält.
Fehler
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GlueEncryptionException
InvalidStateException
ResourceNotReadyException
FederationSourceException
FederationSourceRetryableException
BatchGetPartition Aktion (Python: batch_get_partition)
Ruft Partitionen in einer Batchanforderung ab.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die Partitionen befinden.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Partitionentabelle.
-
PartitionsToGet
– Erforderlich: Ein Array mit PartitionValueListe-Objekten, nicht mehr als 1000 Strukturen.Eine Liste der Partitionswerte, die die abzurufenden Partitionen identifizieren.
Antwort
-
Partitions
– Ein Array mit Partition-Objekten.Eine Liste der angeforderten Partitionen.
-
UnprocessedKeys
– Ein Array mit PartitionValueListe-Objekten, nicht mehr als 1000 Strukturen.Eine Liste der Partitionswerte in der Anforderung, für die keine Partitionen zurückgegeben wurden.
Fehler
InvalidInputException
EntityNotFoundException
OperationTimeoutException
InternalServiceException
GlueEncryptionException
InvalidStateException
FederationSourceException
FederationSourceRetryableException
BatchUpdatePartition Aktion (Python: batch_update_partition)
Aktualisiert eine oder mehrere Partitionen in einem Batchvorgang.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Katalogs, in dem die Partition aktualisiert wird. Derzeit sollte dies die Konto-ID sein. AWS
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Metadatendatenbank, in der die Partition aktualisiert werden soll.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Metadatentabelle, in der die Partition aktualisiert werden soll.
-
Entries
– Erforderlich: Ein Array mit BatchUpdatePartitionRequestEintrag-Objekten, nicht weniger als 1 und nicht mehr als 100 Strukturen.Eine Liste von bis zu 100
BatchUpdatePartitionRequestEntry
-Objekte, die aktualisiert werden sollen.
Antwort
-
Errors
– Ein Array mit BatchUpdatePartitionFailureEintrag-Objekten.Die beim Aktualisieren der angeforderten Partitionen aufgetretenen Fehler. Eine Liste von
BatchUpdatePartitionFailureEntry
-Objekten.
Fehler
InvalidInputException
EntityNotFoundException
OperationTimeoutException
InternalServiceException
GlueEncryptionException
GetColumnStatisticsForPartition Aktion (Python: get_column_statistics_for_partition)
Ruft Partitionsstatistiken von Spalten ab.
Die für diesen Vorgang erforderliche Identity and Access Management (IAM)-Berechtigung lautet GetPartition
.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die Konto-ID verwendet. AWS
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die Partitionen befinden.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Partitionentabelle.
-
PartitionValues
– Erforderlich: Ein Array von UTF-8-Zeichenketten.Eine Liste der Partitionswerte, welche die Partition identifizieren.
-
ColumnNames
– Erforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.Eine Liste der Spaltennamen.
Antwort
-
ColumnStatisticsList
– Ein Array mit ColumnStatistics-Objekten.Die Liste ColumnStatistics davon konnte nicht abgerufen werden.
-
Errors
– Ein Array mit ColumnError-Objekten.Beim Abrufen von Spaltenstatistikdaten ist ein Fehler aufgetreten.
Fehler
EntityNotFoundException
InvalidInputException
InternalServiceException
OperationTimeoutException
GlueEncryptionException
UpdateColumnStatisticsForPartition Aktion (Python: update_column_statistics_for_partition)
Erstellt oder aktualisiert die Partitionsstatistiken von Spalten.
Die für diesen Vorgang erforderliche Identity and Access Management (IAM)-Berechtigung lautet UpdatePartition
.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die Konto-ID verwendet. AWS
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die Partitionen befinden.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Partitionentabelle.
-
PartitionValues
– Erforderlich: Ein Array von UTF-8-Zeichenketten.Eine Liste der Partitionswerte, welche die Partition identifizieren.
-
ColumnStatisticsList
– Erforderlich: Ein Array mit ColumnStatistics-Objekten, nicht mehr als 25 Strukturen.Eine Liste der Spaltenstatistiken.
Antwort
-
Errors
– Ein Array mit ColumnStatisticsError-Objekten.Beim Aktualisieren von Spaltenstatistikdaten ist ein Fehler aufgetreten.
Fehler
EntityNotFoundException
InvalidInputException
InternalServiceException
OperationTimeoutException
GlueEncryptionException
DeleteColumnStatisticsForPartition Aktion (Python: delete_column_statistics_for_partition)
Löscht die Partitionsspaltenstatistiken einer Spalte.
Die für diesen Vorgang erforderliche Identity and Access Management (IAM)-Berechtigung lautet DeletePartition
.
Anforderung
-
CatalogId
– Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die Konto-ID verwendet. AWS
-
DatabaseName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Katalogdatenbank, in der sich die Partitionen befinden.
-
TableName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Der Name der Partitionentabelle.
-
PartitionValues
– Erforderlich: Ein Array von UTF-8-Zeichenketten.Eine Liste der Partitionswerte, welche die Partition identifizieren.
-
ColumnName
– Erforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.Name der Spalte.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundException
InvalidInputException
InternalServiceException
OperationTimeoutException
GlueEncryptionException