Lecture à partir d'entités Google Sheets

Prérequis

Un Google SpreadSheet que vous aimeriez lire. Vous aurez besoin de l' SpreadSheet identifiant et tabName de la feuille de calcul.

Détails des entités et des champs Google Sheets :

Entité	Type de données	Opérateurs pris en charge
Feuille de calcul	Chaîne	N/A (le filtre n'est pas pris en charge)

Exemple


googleSheets_read = glueContext.create_dynamic_frame.from_options(
    connection_type="googlesheets",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
        "API_VERSION": "v4"
    }

Requêtes de partitionnement

Pour le partitionnement de base d'enregistrements uniquement, vous NUM_PARTITIONS pouvez fournir des options Spark supplémentaires si vous souhaitez utiliser la simultanéité dans Spark. Avec ce paramètre, la requête d'origine serait divisée en NUM_PARTITIONS plusieurs sous-requêtes pouvant être exécutées simultanément par les tâches Spark.

Exemple avec NUM_PARTITIONS


googlesheets_read = glueContext.create_dynamic_frame.from_options(
    connection_type="googlesheets",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
        "API_VERSION": "v4",
        "NUM_PARTITIONS": "10"
    }

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration des connexions Google Sheets

Options de connexion à Google Sheets