Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
FillWithMode kelas
FillWithMode
Transformasi memformat kolom sesuai dengan format nomor telepon yang Anda tentukan. Anda juga dapat menentukan logika tie-breaker, di mana beberapa nilai identik. Misalnya, pertimbangkan nilai-nilai berikut: 1 2 2 3 3 4
ModeType MINIMUM
penyebab FillWithMode
mengembalikan 2 sebagai nilai mode. Jika ModeType adalahMAXIMUM
, modenya adalah 3. UntukAVERAGE
, modenya adalah 2.5.
Contoh
from awsglue.context import * from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ (105.111, 13.12), (1055.123, 13.12), (None, 13.12), (13.12, 13.12), (None, 13.12), ], ["source_column_1", "source_column_2"], ) try: df_output = data_quality.FillWithMode.apply( data_frame=input_df, spark_context=sc, source_column="source_column_1", mode_type="MAXIMUM" ) df_output.show() except: print("Unexpected Error happened ") raise
Output
Output dari kode yang diberikan adalah:
``` +---------------+---------------+ |source_column_1|source_column_2| +---------------+---------------+ | 105.111| 13.12| | 1055.123| 13.12| | 1055.123| 13.12| | 13.12| 13.12| | 1055.123| 13.12| +---------------+---------------+ ```
FillWithMode
Transformasi dari modul `awsglue.data_quality` diterapkan ke `input_df`. DataFrame Ini menggantikan nilai `null` di source_column_1
kolom dengan nilai maksimum (`mode_type="maximum"`) dari nilai non-null di kolom itu.
Dalam hal ini, nilai maksimum dalam source_column_1
kolom adalah `1055.123`. Oleh karena itu, nilai `null` di digantikan oleh `1055.123` dalam source_column_1
output `df_output`. DataFrame
Metode
__call__ (spark_context, data_frame, source_column, mode_type)
FillWithMode
Transformasi memformat kasus string dalam kolom.
-
source_column
— Nama kolom yang ada. -
mode_type
— Cara mengatasi nilai dasi dalam data. Nilai ini harus salah satu dariMINIMUM
,NONE
,AVERAGE
, atauMAXIMUM
.
apply(cls, *args, **kwargs)
Warisan dari GlueTransform
apply.
name(cls)
Warisan dari GlueTransform
nama.
describeArgs(cls)
Warisan dari GlueTransform
describeArgs.
describeReturn(cls)
Warisan dari GlueTransform
describeReturn.
describeTransform(cls)
Warisan dari GlueTransform
describeTransform.
describeErrors(cls)
Warisan dari GlueTransform
describeErrors.
describe(cls)
Warisan dari GlueTransform
describe.