FormatPhoneNumber class - AWS Glue

FormatPhoneNumber class

FormatPhoneNumber 変換は、電話番号文字列がフォーマットされた値に変換される列を返します。

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ ("408-341-5669",), ("4083415669",) ], ["phone"], ) try: df_output = column_formatting.FormatPhoneNumber.apply( data_frame=input_df, spark_context=sc, source_column="phone", default_region="US" ) df_output.show() except: print("Unexpected Error happened ") raise

出力

出力は次のとおりです。

``` +---------------+ | phone| +---------------+ |(408) 341-5669| |(408) 341-5669| +---------------+ ```

FormatPhoneNumber 変換では、「source_column」を「『phone』」、「default_region」を「『US』」と指定します。

変換は、最初のフォーマットに関係なく、両方の電話番号を標準的な米国フォーマット 「+1-408-341-5669」に正常にフォーマットします。

方法

__call__(spark_context, data_frame, source_column, phone_number_format=None, default_region=None, default_region_column=None)

FormatPhoneNumber 変換は、電話番号文字列がフォーマットされた値に変換される列を返します。

  • source_column - 既存の列の名前。

  • phone_number_format – 電話番号を変換するフォーマット。フォーマットが指定されていない場合、デフォルトは E.164です。これは国際的に認められている標準の電話番号フォーマットです。有効な値には次のようなものがあります。

    • E164 (E の後のピリオドは省略)

  • default_region – 番号自体に国コードが存在しない場合に電話番号のリージョンを指定する 2 つまたは 3 つの大文字で構成される有効なリージョンコード。最大で、defaultRegion または defaultRegionColumn のいずれかを指定できます。

  • default_region_column – アドバンストデータタイプ Country の列の名前。指定された列のリージョンコードは、電話番号自体に国コードがない場合に、電話番号の国コードを決定するために使用されます。最大で、defaultRegion または defaultRegionColumn のいずれかを指定できます。

apply(cls, *args, **kwargs)

継承元は GlueTransform apply

name(cls)

継承元は GlueTransform name

describeArgs(cls)

継承元は GlueTransform describeArgs

describeReturn(cls)

継承元は GlueTransform describeReturn

describeTransform(cls)

継承元は GlueTransform describeTransform

describeErrors(cls)

継承元は GlueTransform describeErrors

describe(cls)

継承元は GlueTransform 説明