例出力 — 方法 —__call__apply name describeArgs describeReturn describeTransform describeErrors 説明

FormatCase class

FormatCase 変換により、列内の各文字列が指定されたケースタイプに変更されます。

例


from pyspark.context import SparkContext
from pyspark.sql import SparkSession
from awsgluedi.transforms import *

sc = SparkContext()
spark = SparkSession(sc)

datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data")

try:
    df_output = data_cleaning.FormatCase.apply(
        data_frame=datasource1,
        spark_context=sc,
        source_column="city",
        case_type="LOWER"
    )    
except:
    print("Unexpected Error happened ")
    raise

出力

FormatCase 変換により、「case_type="LOWER"」パラメータに基づいて、「city」列の値が小文字に変換されます。結果の「df_output」 DataFrame には、元の「datasource1」 DataFrame のすべての列が含まれますが、「city」列値は小文字です。

call(spark_context、data_frame、source_column、case_type)

FormatCase 変換により、列内の各文字列が指定されたケースタイプに変更されます。

source_column - 既存の列の名前。
case_type – サポートされているケースタイプは CAPITAL、LOWER、UPPER、SENTENCE です。

apply(cls, *args, **kwargs)

継承元は GlueTransform apply。

name(cls)

継承元は GlueTransform name。

describeArgs(cls)

継承元は GlueTransform describeArgs。

describeReturn(cls)

継承元は GlueTransform describeReturn。

describeTransform(cls)

継承元は GlueTransform describeTransform。

describeErrors(cls)

継承元は GlueTransform describeErrors。

describe(cls)

継承元は GlueTransform 説明。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

FormatPhoneNumber

FillWithMode