FormatCase 클래스 - AWS Glue

FormatCase 클래스

FormatCase 변환은 열의 각 문자열을 지정된 케이스 유형으로 변경합니다.

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

출력

FormatCase 변환은 `case_type="LOWER"` 파라미터를 기반으로 `city` 열의 값을 소문자로 변환합니다. 결과 `df_output` DataFrame에는 원래 `datasource1` DataFrame의 모든 열이 포함되지만 `city` 열 값은 소문자로 표시됩니다.

메서드

__call__(spark_context, data_frame, source_column, case_type)

FormatCase 변환은 열의 각 문자열을 지정된 케이스 유형으로 변경합니다.

  • source_column – 기존 열의 이름입니다.

  • case_type – 지원되는 케이스 유형은 CAPITAL, LOWER, UPPER, SENTENCE입니다.

apply(cls, *args, **kwargs)

GlueTransform apply에서 상속됩니다.

name(cls)

GlueTransform name에서 상속됩니다.

describeArgs(cls)

GlueTransform describeArgs에서 상속됩니다.

describeReturn(cls)

GlueTransform describeReturn에서 상속됩니다.

describeTransform(cls)

GlueTransform describeTransform에서 상속됩니다.

describeErrors(cls)

GlueTransform describeErrors에서 상속됩니다.

describe(cls)

GlueTransform describe에서 상속됩니다.