FormatCase class
FormatCase
変換により、列内の各文字列が指定されたケースタイプに変更されます。
例
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
出力
FormatCase
変換により、「case_type="LOWER"」 パラメータに基づいて、「city」列の値が小文字に変換されます。結果の「df_output」 DataFrame には、元の「datasource1」 DataFrame のすべての列が含まれますが、「city」列値は小文字です。
方法
__call__(spark_context、data_frame、source_column、case_type)
FormatCase
変換により、列内の各文字列が指定されたケースタイプに変更されます。
-
source_column
- 既存の列の名前。 -
case_type
– サポートされているケースタイプはCAPITAL
、LOWER
、UPPER
、SENTENCE
です。
apply(cls, *args, **kwargs)
継承元は GlueTransform
apply。
name(cls)
継承元は GlueTransform
name。
describeArgs(cls)
継承元は GlueTransform
describeArgs。
describeReturn(cls)
継承元は GlueTransform
describeReturn。
describeTransform(cls)
継承元は GlueTransform
describeTransform。
describeErrors(cls)
継承元は GlueTransform
describeErrors。
describe(cls)
継承元は GlueTransform
説明。