Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kumpulan data dan skema khusus
Saat membuat grup kumpulan data Kustom, Anda membuat skema sendiri dari awal. Kumpulan data dan skema grup kumpulan data khusus memiliki lebih sedikit bidang yang diperlukan dan lebih banyak fleksibilitas. Topik berikut menjelaskan skema dan persyaratan data untuk kumpulan data grup kumpulan data Kustom. Setiap bagian kumpulan data mencantumkan data yang diperlukan untuk jenis kumpulan data dan memberikan JSON contoh skema.
Untuk informasi tentang jenis data yang dapat Anda impor ke Amazon Personalize, lihat. Jenis data yang dapat digunakan Amazon Personalize Untuk informasi tentang persyaratan skema Amazon Personalisasi umum, seperti persyaratan pemformatan dan tipe data bidang yang tersedia, lihat. Membuat JSON file skema untuk skema Amazon Personalize Persyaratan ini berlaku untuk semua skema Amazon Personalize.
Topik
Dataset kustom dan persyaratan skema
Saat Anda membuat kumpulan data untuk grup Dataset Kustom, setiap jenis kumpulan data memiliki bidang wajib berikut dan kata kunci cadangan dengan tipe data yang diperlukan.
Jenis dataset | Bidang yang diperlukan | Kata kunci terpesan |
---|---|---|
Interaksi item (contoh skema) |
USER_ID () ITEM_ID () TIMESTAMP ( |
EVENT_TYPE ( EVENT_VALUE ( IMPRESSION ( RECOMMENDATION_ID ( EVENT_ATTRIBUTION_SOURCE ( |
Pengguna (contoh skema) |
USER_ID () 1 bidang metadata (kategoris |
|
Item (contoh skema) |
ITEM_ID () 1 bidang metadata (bidang kategoris atau |
CREATION_TIMESTAMP ( |
Tindakan (contoh skema) |
ACTION_ID () 1 bidang metadata (kategoris |
CREATION_TIMESTAMP ( VALUE ( TYPE ( EXPIRATION_TIMESTAMP ( REPEAT_FREQUENCY ( |
Interaksi aksi (contoh skema) |
USER_ID () ACTION_ID () EVENT_TYPE ( TIMESTAMP ( |
IMPRESSION ( RECOMMENDATION_ID ( |
Kolom metadata
Metadata mencakup bidang string atau non-string yang tidak diperlukan atau tidak menggunakan kata kunci cadangan. Skema metadata memiliki batasan berikut:
-
Skema Pengguna, Item, dan Tindakan memerlukan setidaknya satu bidang metadata.
-
Anda dapat menambahkan paling banyak 25 bidang metadata untuk skema Pengguna, 100 bidang metadata untuk skema Item, dan 10 bidang metadata untuk skema Tindakan.
-
Jika Anda menambahkan bidang metadata Anda sendiri dari tipe
string
, itu harus menyertakancategorical
atribut atautextual
atribut (hanya skema Item yang mendukung bidang dengan atribut tekstual). Jika tidak, Amazon Personalize tidak akan menggunakan bidang saat melatih model.
Kata kunci terpesan
Kata kunci yang dicadangkan adalah opsional, bidang non-metadata. Bidang ini dianggap dicadangkan karena Anda harus menentukan bidang sebagai tipe data yang diperlukan saat Anda menggunakannya, dan kata kunci tidak dapat digunakan sebagai nilai dalam data Anda. Bidang string kategoris yang dicadangkan harus categorical
disetel ketrue
, sementara bidang string yang dicadangkan tidak dapat dikategorikan. Berikut ini adalah kata kunci yang dicadangkan:
-
EVENT_TYPE: Untuk kumpulan data interaksi Item dengan satu atau beberapa jenis acara, seperti klik dan unduh, gunakan bidang.
EVENT_TYPE
Anda harus mendefinisikan TYPE bidang EVENT _ sebagai astring
dan tidak dapat ditetapkan sebagai kategoris. -
EVENT_VALUE: Untuk kumpulan data interaksi Item yang menyertakan data nilai untuk peristiwa, seperti persentase video yang ditonton pengguna, gunakan
EVENT_VALUE
bidang dengan tipefloat
dan opsional.null
-
CREATION_TIMESTAMP: Untuk kumpulan data Item atau Tindakan dengan stempel waktu untuk tanggal pembuatan setiap item, gunakan
CREATION_TIMESTAMP
bidang dengan tipe.long
Amazon Personalize menggunakanCREATION_TIMESTAMP
data untuk menghitung usia item dan menyesuaikan rekomendasi yang sesuai. Lihat Data stempel waktu pembuatan. -
IMPRESSION: Untuk kumpulan data interaksi Item dengan data tayangan eksplisit, gunakan
IMPRESSION
bidang dengan tipeString
dan tipe opsional.null
Tayangan adalah daftar item yang terlihat oleh pengguna saat berinteraksi dengan (misalnya, diklik atau ditonton) item tertentu. Untuk informasi selengkapnya, lihat Data tayangan. -
RECOMMENDATION_ID: Untuk kumpulan data interaksi Item yang menggunakan rekomendasi sebelumnya sebagai data tayangan implisit, secara opsional gunakan
RECOMMENDATION_ID
bidang dengan tipe dan tipe opsional.String
null
Anda tidak perlu menambahkan
RECOMMENDATION_ID
bidang untuk Amazon Personalize untuk menggunakan tayangan implisit saat membuat rekomendasi. Anda dapat lulusrecommendationId
dalam PutEvents operasi tanpa itu. Untuk informasi selengkapnya, lihat Data tayangan. -
VALUE: Untuk kumpulan data Tindakan, jika Anda memiliki nilai data untuk beberapa atau semua tindakan Anda, tambahkan
VALUE
bidang ke skema Anda. Untuk jenisnya, gunakanlong
dan ketiknull
opsional. Untuk informasi selengkapnya tentang tindakan dan nilainya, lihatData nilai. -
ACTION_ EXPIRATION _TIMESTAMP: Untuk kumpulan data Tindakan, jika Anda memiliki stempel waktu kedaluwarsa untuk beberapa atau semua tindakan Anda, tambahkan bidang ke skema Anda.
ACTION_EXPIRATION_TIMESTAMP
Untuk jenisnya, gunakanlong
dan ketiknull
opsional. Untuk informasi selengkapnya tentang cap waktu kedaluwarsa, lihat. Data stempel waktu kedaluwarsa tindakan -
REPEAT_FREQUENCY: Untuk kumpulan data Tindakan, jika Anda memiliki data frekuensi berulang untuk beberapa atau semua tindakan Anda, tambahkan
REPEAT_FREQUENCY
bidang ke skema Anda. Untuk jenisnya, gunakanlong
dan ketiknull
opsional. Untuk informasi selengkapnya tentang data frekuensi berulang, lihatUlangi data frekuensi.