Lecture à partir d'entités Google Sheets - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Lecture à partir d'entités Google Sheets

Prérequis

  • Un Google SpreadSheet que vous aimeriez lire. Vous aurez besoin de l' SpreadSheet identifiant et tabName de la feuille de calcul.

Détails des entités et des champs Google Sheets :

Entité Type de données Opérateurs pris en charge
Feuille de calcul Chaîne N/A (le filtre n'est pas pris en charge)

Exemple

googleSheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4" }

Requêtes de partitionnement

Pour le partitionnement de base d'enregistrements uniquement, vous NUM_PARTITIONS pouvez fournir des options Spark supplémentaires si vous souhaitez utiliser la simultanéité dans Spark. Avec ce paramètre, la requête d'origine serait divisée en NUM_PARTITIONS plusieurs sous-requêtes pouvant être exécutées simultanément par les tâches Spark.

Exemple avec NUM_PARTITIONS

googlesheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4", "NUM_PARTITIONS": "10" }