Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
FormatCase classe
La FormatCase
trasformazione modifica ogni stringa in una colonna nel tipo di caso specificato.
Esempio
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Output
La FormatCase
trasformazione convertirà i valori nella colonna `city` in lettere minuscole in base al parametro `case_TYPE="lower"`. Il `df_output` risultante conterrà tutte le colonne dell'originale DataFrame `datasource1`, ma con i valori della colonna `city` in minuscolo. DataFrame
Metodi
__call__ (spark_context, data_frame, source_column, case_type)
La FormatCase
trasformazione modifica ogni stringa in una colonna nel tipo di caso specificato.
-
source_column
: il nome di una colonna esistente. -
case_type
— I tipi di casi supportati sonoCAPITAL
LOWER
,UPPER
,SENTENCE
.
apply(cls, *args, **kwargs)
Ereditato da GlueTransform
apply.
name(cls)
Ereditato da GlueTransform
name.
describeArgs(cls)
Ereditato da GlueTransform
describeArgs.
describeReturn(cls)
Ereditato da GlueTransform
describeReturn.
describeTransform(cls)
Ereditato da GlueTransform
describeTransform.
describeErrors(cls)
Ereditato da GlueTransform
describeErrors.
describe(cls)
Ereditato da GlueTransform
describe.