Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
FormatCase classe
La FormatCase
transformation remplace chaque chaîne d'une colonne par le type de majuscule spécifié.
Exemple
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Sortie
La FormatCase
transformation convertira les valeurs de la colonne « city » en minuscules en fonction du paramètre « CASE_TYPE="LOWER"`. Le `df_output` qui en DataFrame résultera contiendra toutes les colonnes du `datasource1` original, mais avec les valeurs des colonnes `city` DataFrame en minuscules.
Méthodes
__call__ (spark_context, data_frame, source_column, cas_type)
La FormatCase
transformation remplace chaque chaîne d'une colonne par le type de majuscule spécifié.
-
source_column
: nom d’une colonne existante. -
case_type
— Les types de boîtiers pris en charge sontCAPITAL
LOWER
,UPPER
,SENTENCE
.
apply(cls, *args, **kwargs)
Hérité de GlueTransform
s'appliquent.
name(cls)
Hérité de GlueTransform
name.
describeArgs(cls)
Hérité de GlueTransform
describeArgs.
describeReturn(cls)
Hérité de GlueTransform
describeReturn.
describeTransform(cls)
Hérité de GlueTransform
describeTransform.
describeErrors(cls)
Hérité de GlueTransform
describeErrors.
describe(cls)
Hérité de GlueTransform
describe.