Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengubah data
Untuk mengubah data di Data Wrangler, Anda menambahkan langkah Transform ke aliran data Anda. Data Wrangler mencakup lebih dari 300 transformasi yang dapat Anda gunakan untuk menyiapkan data, termasuk kolom Peta untuk transformasi Amazon Personalize. Dan Anda dapat menggunakan transformasi Data Wrangler umum untuk memperbaiki masalah seperti outlier, masalah tipe, dan nilai yang hilang.
Setelah Anda selesai mengubah data Anda, Anda dapat menganalisisnya dengan Data Wrangler. Atau, jika Anda selesai menyiapkan data Anda di Data Wrangler, Anda dapat memprosesnya dan mengimpornya ke Amazon Personalize. Untuk informasi tentang menganalisis data, lihatMenghasilkan visualisasi dan wawasan data. Untuk informasi tentang memproses dan mengimpor data, lihatMemproses data dan mengimpornya ke Amazon Personalize.
Kolom pemetaan untuk Amazon Personalisasi
Untuk mengubah data Anda sehingga memenuhi persyaratan Amazon Personalize, Anda menambahkan kolom Peta untuk Amazon Personalize mengubah dan memetakan kolom Anda ke bidang wajib dan opsional untuk Amazon Personalize.
Untuk menggunakan kolom Peta untuk Amazon Personalize transform
-
Pilih + untuk transformasi terbaru Anda dan pilih Tambahkan transformasi. Jika Anda belum menambahkan transformasi, pilih + untuk transformasi tipe Data. Data Wrangler menambahkan transformasi ini secara otomatis ke alur Anda.
-
Pilih Tambahkan langkah.
-
Pilih Transformasi untuk Amazon Personalisasi. Kolom Peta untuk transformasi Amazon Personalize dipilih secara default.
-
Gunakan bidang transformasi untuk memetakan data Anda ke atribut Amazon Personalize yang diperlukan.
-
Pilih jenis kumpulan data yang cocok dengan data Anda (Interaksi, Item, atau Pengguna).
-
Pilih domain Anda (ECOMMERCE, VIDEO _ON_DEMAND, atau kustom). Domain yang Anda pilih harus sesuai dengan domain yang Anda tentukan saat Anda membuat grup kumpulan data.
-
Pilih kolom yang cocok dengan bidang wajib dan opsional untuk Amazon Personalize. Misalnya, untuk kolom Item_ID, pilih kolom dalam data Anda yang menyimpan informasi identifikasi unik untuk setiap item Anda.
Setiap kolom kolom disaring berdasarkan tipe data. Hanya kolom dalam data Anda yang memenuhi persyaratan tipe data Amazon Personalize yang tersedia. Jika data Anda bukan tipe yang diperlukan, Anda dapat menggunakan Transformasi Parse Value as Type Data Wrangler untuk mengonversinya.
-
Data Umum Wrangler berubah
Transformasi Data Wrangler umum berikut dapat membantu Anda menyiapkan data untuk Amazon Personalize:
-
Konversi tipe data: Jika bidang Anda tidak terdaftar sebagai opsi yang memungkinkan di kolom Peta untuk transformasi Amazon Personalisasi, Anda mungkin perlu mengonversi tipe datanya. Data Wrangler mengubah Nilai Parse sebagai Jenis dapat membantu Anda mengonversi data Anda. Atau Anda dapat menggunakan transformasi tipe Data yang ditambahkan Data Wrangler secara default saat Anda membuat alur. Untuk menggunakan transformasi ini, Anda memilih tipe data dari daftar drop-down Jenis, pilih Pratinjau dan kemudian pilih Perbarui.
Untuk informasi tentang tipe data yang diperlukan untuk bidang, lihat bagian untuk jenis domain dan kumpulan data Anda. Membuat JSON file skema untuk skema Amazon Personalize
-
Menangani nilai dan outlier yang hilang: Jika Anda menghasilkan nilai yang hilang atau wawasan outlier, Anda dapat menggunakan Transformasi Data Wrangler Menangani Pencilan dan Menangani Nilai yang Hilang untuk mengatasi masalah ini.
-
Transformasi kustom: Dengan Data Wrangler, Anda dapat membuat transformasi Anda sendiri dengan Python (User-Defined Function),, pandas, atau () PySpark. PySpark SQL Anda dapat menggunakan transformasi khusus untuk melakukan tugas seperti menjatuhkan kolom duplikat atau pengelompokan berdasarkan kolom. Untuk informasi selengkapnya, lihat Transformasi Kustom di Panduan SageMaker Pengembang Amazon.