FormatCase classe - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

FormatCase classe

La FormatCase trasformazione modifica ogni stringa in una colonna nel tipo di caso specificato.

Esempio

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

Output

La FormatCase trasformazione convertirà i valori nella colonna `city` in lettere minuscole in base al parametro `case_TYPE="lower"`. Il `df_output` risultante conterrà tutte le colonne dell'originale DataFrame `datasource1`, ma con i valori della colonna `city` in minuscolo. DataFrame

Metodi

__call__ (spark_context, data_frame, source_column, case_type)

La FormatCase trasformazione modifica ogni stringa in una colonna nel tipo di caso specificato.

  • source_column: il nome di una colonna esistente.

  • case_type— I tipi di casi supportati sono CAPITALLOWER,UPPER,SENTENCE.

apply(cls, *args, **kwargs)

Ereditato da GlueTransform apply.

name(cls)

Ereditato da GlueTransform name.

describeArgs(cls)

Ereditato da GlueTransform describeArgs.

describeReturn(cls)

Ereditato da GlueTransform describeReturn.

describeTransform(cls)

Ereditato da GlueTransform describeTransform.

describeErrors(cls)

Ereditato da GlueTransform describeErrors.

describe(cls)

Ereditato da GlueTransform describe.