Mempersiapkan metadata pengguna untuk pelatihan - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mempersiapkan metadata pengguna untuk pelatihan

Data pengguna yang dapat Anda impor ke Amazon Personalize mencakup data numerik, seperti usia pengguna, dan metadata kategoris, seperti jenis kelamin atau keanggotaan loyalitas. Anda mengimpor metadata tentang pengguna Anda ke dalam kumpulan data Amazon Personalize Users.

Bergantung pada kasus penggunaan domain atau resep khusus Anda, metadata pengguna dapat membantu Amazon Personalize merekomendasikan item yang lebih relevan kepada pengguna atau merekomendasikan segmen pengguna yang lebih bermakna. Dan setelah pelatihan, ini dapat membantu model Anda merekomendasikan item untuk pengguna tanpa data interaksi apa pun. Untuk informasi selengkapnya tentang kasus penggunaan atau resep yang menggunakan metadata pengguna, lihat persyaratan data untuk kasus atau resep penggunaan domain Anda. Mencocokkan kasus penggunaan Anda dengan Amazon Personalize resource

Saat pelatihan, Amazon Personalize tidak menggunakan data pengguna string non-kategoris, seperti nama pengguna, kata kunci tentang pengguna, atau tag. Namun, mengimpor data ini masih dapat meningkatkan rekomendasi. Untuk informasi selengkapnya, lihat Data string non-kategoris.

Untuk semua kasus penggunaan domain dan resep khusus, data pengguna massal Anda harus ada dalam CSV file. Setiap baris dalam file harus mewakili pengguna yang unik. Setelah Anda selesai mempersiapkan data Anda, Anda siap untuk membuat JSON file skema. File ini memberi tahu Amazon Personalize tentang struktur data Anda. Untuk informasi selengkapnya, lihat Membuat JSON file skema untuk skema Amazon Personalize.

Bagian berikut memberikan informasi selengkapnya tentang cara menyiapkan data pengguna Anda untuk Amazon Personalize. Untuk pedoman format data massal untuk semua jenis data, lihat pedoman format data massal

Persyaratan data pengguna

Berikut ini adalah persyaratan data pengguna untuk Amazon Personalize. Anda bebas menambahkan kolom kustom tambahan tergantung pada kasus penggunaan dan data Anda.

  • Data Anda harus memiliki kolom USER _ID yang menyimpan pengenal unik untuk setiap pengguna. Setiap pengguna harus memiliki ID pengguna. Itu harus string dengan panjang maksimal 256 karakter.

  • Data Anda harus memiliki setidaknya satu string kategoris atau kolom metadata numerik. Kolom metadata pengguna dapat menyertakan nilai kosong/null untuk beberapa pengguna. Kami menyarankan agar kolom-kolom ini minimal 70 persen selesai.

  • Jumlah maksimum kolom metadata adalah 25.

Jika Anda tidak yakin memiliki cukup data atau jika Anda memiliki pertanyaan tentang kualitasnya, Anda dapat mengimpor data Anda ke kumpulan data Amazon Personalize dan menggunakan Amazon Personalize untuk menganalisisnya. Untuk informasi selengkapnya, lihat Menganalisis kualitas dan kuantitas data di Amazon Personalisasi kumpulan data.

Metadata kategoris

Dengan beberapa resep dan semua kasus penggunaan domain, Amazon Personalize menggunakan metadata kategoris, seperti jenis kelamin, minat, atau status keanggotaan pengguna, saat mengidentifikasi pola dasar yang mengungkapkan item paling relevan bagi pengguna Anda. Anda menentukan rentang nilai Anda sendiri berdasarkan kasus penggunaan Anda. Metadata kategoris bisa dalam bahasa apa pun.

Untuk pengguna dengan beberapa kategori, pisahkan setiap nilai dengan bilah vertikal, '|'. Misalnya, untuk INTERESTS bidang, data Anda untuk pengguna mungkinMovies|TV Shows|Music.

Dengan semua resep dan domain, Anda dapat mengimpor metadata kategoris dan menggunakannya untuk memfilter rekomendasi berdasarkan atribut pengguna. Untuk informasi tentang rekomendasi pemfilteran lihatMemfilter rekomendasi dan segmen pengguna.

Nilai kategoris dapat memiliki paling banyak 1000 karakter. Jika Anda memiliki pengguna dengan nilai kategoris dengan lebih dari 1000 karakter, pekerjaan impor dataset Anda akan gagal.

Data string non-kategoris

Kecuali untuk penggunaIDs, Amazon Personalize tidak menggunakan data string non-kategoris saat pelatihan, seperti nama pengguna, kata kunci tentang pengguna, atau tag. Namun, Amazon Personalize dapat menggunakannya saat memfilter rekomendasi. Anda dapat membuat filter untuk menyertakan atau menghapus item dari rekomendasi berdasarkan data string non-kategoris tentang pengguna yang Anda dapatkan rekomendasi untuk (the). CurrentUser Untuk informasi lebih lanjut tentang filter, lihat Memfilter rekomendasi dan segmen pengguna. Nilai non-kategoris dapat memiliki maksimum 1000 karakter.

Contoh metadata pengguna

Beberapa baris pertama metadata pengguna dalam CSV file mungkin terlihat seperti berikut ini.

USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...

USER_IDKolom diperlukan dan menyimpan pengidentifikasi unik untuk setiap pengguna individu. AGEKolom adalah metadata numerik. INTERESTKolom GENDER dan menyimpan metadata kategoris untuk setiap pengguna.

Setelah Anda selesai mempersiapkan data Anda, Anda siap untuk membuat JSON file skema. File ini memberi tahu Amazon Personalize tentang struktur data Anda. Untuk informasi selengkapnya, lihat Membuat JSON file skema untuk skema Amazon Personalize. Seperti inilah tampilan JSON file skema untuk data sampel di atas.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }