FormatCase classe - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

FormatCase classe

La FormatCase transformation remplace chaque chaîne d'une colonne par le type de majuscule spécifié.

Exemple

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

Sortie

La FormatCase transformation convertira les valeurs de la colonne « city » en minuscules en fonction du paramètre « CASE_TYPE="LOWER"`. Le `df_output` qui en DataFrame résultera contiendra toutes les colonnes du `datasource1` original, mais avec les valeurs des colonnes `city` DataFrame en minuscules.

Méthodes

__call__ (spark_context, data_frame, source_column, cas_type)

La FormatCase transformation remplace chaque chaîne d'une colonne par le type de majuscule spécifié.

  • source_column : nom d’une colonne existante.

  • case_type— Les types de boîtiers pris en charge sont CAPITALLOWER,UPPER,SENTENCE.

apply(cls, *args, **kwargs)

Hérité de GlueTransform s'appliquent.

name(cls)

Hérité de GlueTransform name.

describeArgs(cls)

Hérité de GlueTransform describeArgs.

describeReturn(cls)

Hérité de GlueTransform describeReturn.

describeTransform(cls)

Hérité de GlueTransform describeTransform.

describeErrors(cls)

Hérité de GlueTransform describeErrors.

describe(cls)

Hérité de GlueTransform describe.