Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
MonthName Klasse
Die MonthName
Transformation erstellt aus einer Zeichenfolge, die ein Datum darstellt, eine neue Spalte, die den Namen des Monats enthält.
Beispiel
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) spark.conf.set("spark.sql.legacy.timeParserPolicy", "LEGACY") input_df = spark.createDataFrame( [ ("20-2018-12",), ("2018-20-12",), ("20182012",), ("12202018",), ("20122018",), ("20-12-2018",), ("12/20/2018",), ("02/02/02",), ("02 02 2009",), ("02/02/2009",), ("August/02/2009",), ("02/june/2009",), ("02/2020/june",), ("2013-02-21 06:35:45.658505",), ("August 02 2009",), ("2013/02/21",), (None,), ], ["column_1"], ) try: df_output = datetime_functions.MonthName.apply( data_frame=input_df, spark_context=sc, source_column="column_1", target_column="target_column" ) df_output.show() except: print("Unexpected Error happened ") raise
Output
Die Ausgabe wird wie folgt aussehen:
``` +------------+------------+ | column_1|target_column| +------------+------------+ |20-2018-12 | December | |2018-20-12 | null | | 20182012| null | | 12202018| null | | 20122018| null | |20-12-2018 | December | |12/20/2018 | December | | 02/02/02 | February | |02 02 2009 | February | |02/02/2009 | February | |August/02/2009| August | |02/june/2009| null | |02/2020/june| null | |2013-02-21 06:35:45.658505| February | |August 02 2009| August | | 2013/02/21| February | | null | null | +------------+------------+ ```
Die MonthName
Transformation nimmt die `source_column` als `"column_1"` und die `target_column` als `"target_column"`. Sie versucht, den Monatsnamen aus den Datums-/Uhrzeitzeichenfolgen in der Spalte `"column_1"` zu extrahieren und platziert ihn in der Spalte `"target_column"`. Falls die Datums-/Uhrzeitzeichenfolge ein unbekanntes Format hat oder nicht analysiert werden kann, wird der Wert `"target_column"` auf `null` gesetzt.
Die Transformation extrahiert erfolgreich den Monatsnamen aus verschiedenen Datums-/Uhrzeitformaten wie „20-12-2018", „20.12.2018", „02.02.2009“, „21.02.2013 06:35:45.658 505" und „02. August 2009“.
Methoden
__call__ (spark_context, data_frame, target_column, source_column=None, value=None)
Die MonthName
Transformation erstellt aus einer Zeichenfolge, die ein Datum darstellt, eine neue Spalte mit dem Namen des Monats.
-
source_column
– Der Name einer vorhandenen Spalte. -
value
— Eine auszuwertende Zeichenfolge.. -
target_column
— Ein Name für die neu erstellte Spalte.
apply(cls, *args, **kwargs)
Geerbt von GlueTransform
apply.
name(cls)
Geerbt von GlueTransform
Name.
describeArgs(cls)
Geerbt von GlueTransform
describeArgs.
describeReturn(cls)
Geerbt von GlueTransform
describeReturn.
describeTransform(cls)
Geerbt von GlueTransform
describeTransform.
describeErrors(cls)
Geerbt von GlueTransform
describeErrors.
describe(cls)
Geerbt von GlueTransform
Beschreiben.