Clase FormatCase - AWS Glue

Clase FormatCase

La transformación FormatCase cambia cada cadena de una columna al tipo de mayúsculas y minúsculas especificado.

Ejemplo

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

Salida

La transformación FormatCase convertirá los valores de la columna `city` a minúsculas según el parámetro `case_type="LOWER"`. El elemento DataFrame `df_output` resultante contendrá todas las columnas de la `datasource1` original, pero con los valores de la columna `city` en minúsculas.

Métodos

__call__(spark_context, data_frame, source_column, case_type)

La transformación FormatCase cambia cada cadena de una columna al tipo de mayúsculas y minúsculas especificado.

  • source_column: el nombre de una columna existente.

  • case_type: los tipos de mayúsculas y minúsculas admitidos son CAPITAL, LOWER, UPPER, SENTENCE.

apply(cls, *args, **kwargs)

Heredado de GlueTransform apply.

name(cls)

Heredado de GlueTransform name.

describeArgs(cls)

Heredado de GlueTransform describeArgs.

describeReturn(cls)

Heredado de GlueTransform describeReturn.

describeTransform(cls)

Heredado de GlueTransform describeTransform.

describeErrors(cls)

Heredado de GlueTransform describeErrors.

describe(cls)

Heredado de GlueTransform describe.