Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Préparation des données d'entrée
Formatez vos données d'entrée sous forme de fichiers Apache Parquet
Vue d'ensemble du schéma d'entrée
Vos données d'entrée doivent être conformes au schéma du type d'action de travail spécifique que vous souhaitez exécuter. Chaque type d'action définit son propre ensemble de champs obligatoires et facultatifs.
Tous les schémas de saisie prennent en charge un Id champ facultatif. Utilisez ce champ pour attribuer un identifiant à chaque enregistrement d'entrée. Si vous fournissez une Id valeur, elle apparaît comme Input_Id dans la sortie, ce qui vous permet de corréler les enregistrements de sortie avec leurs entrées correspondantes.
Pour plus de détails sur le schéma d'entrée de validation d'adresse, voir Schéma d'entrée de validation d'adresse.
Limites de taille des fichiers
Les fichiers d'entrée présentent les limites suivantes :
-
Taille de fichier maximale : 10 Go par fichier
-
Taille maximale du groupe de rangées de parquet : 1 Go
-
Nombre maximum de fichiers par préfixe d'entrée : 1000