Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
FillMissingValues kelas
Kelas FillMissingValues
menempatkan nilai nol dan string kosong dalam sebuah DynamicFrame
yang ditentukan dan menggunakan metode machine learning, seperti regresi linier dan hutan acak, untuk memprediksi nilai yang hilang. Tugas ETL menggunakan nilai-nilai dalam set data input untuk melatih model machine learning, yang kemudian memprediksi apa nilai-nilai yang hilang tersebut seharusnya.
Tip
Jika Anda menggunakan kumpulan data tambahan, maka setiap set tambahan digunakan sebagai data pelatihan untuk model machine learning, sehingga hasilnya mungkin tidak akurat.
Untuk mengimpor:
from awsglueml.transforms import FillMissingValues
Metode
apply(frame, missing_values_column, output_column ="", transformation_ctx ="", info ="", stageThreshold = 0, totalThreshold = 0)
Mengisi nilai-nilai yang hilang dari bingkai dinamis dalam kolom yang ditentukan dan mengembalikan bingkai baru dengan perkiraan dalam sebuah kolom baru. Untuk baris tanpa nilai yang hilang, nilai kolom yang ditentukan diduplikasi ke kolom baru tersebut.
frame
—DynamicFrame
tempat untuk mengisi nilai yang hilang. Wajib.missing_values_column
— Kolom yang berisi nilai-nilai yang hilang (nilainull
dan string kosong). Wajib.output_column
— Nama kolom baru yang akan berisi perkiraan nilai untuk semua baris yang nilainya hilang. Opsional; default-nya adalah namamissing_values_column
dengan sufiks"_filled"
.transformation_ctx
— Sebuah string unik yang digunakan untuk mengidentifikasi informasi status (opsional).info
— Sebuah string yang akan dikaitkan dengan kesalahan dalam transformasi (opsional).stageThreshold
— Jumlah maksimum kesalahan yang dapat terjadi dalam transformasi sebelum kesalahan keluar (opsional; default-nya adalah nol).totalThreshold
— Jumlah maksimum kesalahan yang dapat terjadi secara keseluruhan sebelum kesalahan keluar (opsional; default-nya adalah nol).
Mengembalikan sebuah DynamicFrame
baru dengan satu kolom tambahan yang berisi perkiraan untuk baris dengan nilai-nilai yang hilang dan nilai sekarang untuk baris lainnya.