FormatCase Klasse - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

FormatCase Klasse

Die FormatCase Transformation ändert jede Zeichenfolge in einer Spalte in den angegebenen Groß- und Kleinschreibung.

Beispiel

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

Output

Die FormatCase Transformation konvertiert die Werte in der Spalte `city` auf der Grundlage des Parameters `case_type="lower"` in Kleinbuchstaben. Das resultierende `df_output` DataFrame wird alle Spalten aus der ursprünglichen `datasource1` enthalten, jedoch mit den Werten der Spalte `city` in Kleinbuchstaben. DataFrame

Methoden

__call__ (spark_context, data_frame, source_column, case_type)

Die FormatCase Transformation ändert jede Zeichenfolge in einer Spalte in den angegebenen Falltyp.

  • source_column – Der Name einer vorhandenen Spalte.

  • case_type— Unterstützte Falltypen sindCAPITAL,LOWER,UPPER,SENTENCE.

apply(cls, *args, **kwargs)

Geerbt von GlueTransform apply.

name(cls)

Geerbt von GlueTransform Name.

describeArgs(cls)

Geerbt von GlueTransform describeArgs.

describeReturn(cls)

Geerbt von GlueTransform describeReturn.

describeTransform(cls)

Geerbt von GlueTransform describeTransform.

describeErrors(cls)

Geerbt von GlueTransform describeErrors.

describe(cls)

Geerbt von GlueTransform Beschreiben.