Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Voraussetzungen
-
Ein Google SpreadSheet , aus dem Sie gerne lesen würden. Sie benötigen die SpreadSheet ID und tabName die Tabelle.
Entitäts- und Felddetails von Google Sheets:
Entität | Datentyp | Unterstützte Operatoren |
---|---|---|
Tabellenkalkulation | String | N/A (Filter wird nicht unterstützt) |
Beispiel
googleSheets_read = glueContext.create_dynamic_frame.from_options(
connection_type="googlesheets",
connection_options={
"connectionName": "connectionName",
"ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
"API_VERSION": "v4"
}
Partitionierung von Abfragen
Nur für die Partitionierung auf Datensatzbasis. NUM_PARTITIONS
Kann als zusätzliche Spark-Option bereitgestellt werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesem Parameter würde die ursprüngliche Abfrage in eine NUM_PARTITIONS
Reihe von Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.
Beispiel mit NUM_PARTITIONS
googlesheets_read = glueContext.create_dynamic_frame.from_options(
connection_type="googlesheets",
connection_options={
"connectionName": "connectionName",
"ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
"API_VERSION": "v4",
"NUM_PARTITIONS": "10"
}