Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Lecture à partir d'entités Google Sheets
Prérequis
-
Un Google SpreadSheet que vous aimeriez lire. Vous aurez besoin de l' SpreadSheet identifiant et tabName de la feuille de calcul.
Détails des entités et des champs Google Sheets :
Entité | Type de données | Opérateurs pris en charge |
---|---|---|
Feuille de calcul | Chaîne | N/A (le filtre n'est pas pris en charge) |
Exemple
googleSheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4" }
Requêtes de partitionnement
Pour le partitionnement de base d'enregistrements uniquement, vous NUM_PARTITIONS
pouvez fournir des options Spark supplémentaires si vous souhaitez utiliser la simultanéité dans Spark. Avec ce paramètre, la requête d'origine serait divisée en NUM_PARTITIONS
plusieurs sous-requêtes pouvant être exécutées simultanément par les tâches Spark.
Exemple avec NUM_PARTITIONS
googlesheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4", "NUM_PARTITIONS": "10" }