Kumpulan data dan skema khusus - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kumpulan data dan skema khusus

Saat membuat grup kumpulan data Kustom, Anda membuat skema sendiri dari awal. Kumpulan data dan skema grup kumpulan data khusus memiliki lebih sedikit bidang yang diperlukan dan lebih banyak fleksibilitas. Topik berikut menjelaskan skema dan persyaratan data untuk kumpulan data grup kumpulan data Kustom. Setiap bagian kumpulan data mencantumkan data yang diperlukan untuk jenis kumpulan data dan memberikan JSON contoh skema.

Untuk informasi tentang jenis data yang dapat Anda impor ke Amazon Personalize, lihat. Jenis data yang dapat digunakan Amazon Personalize Untuk informasi tentang persyaratan skema Amazon Personalisasi umum, seperti persyaratan pemformatan dan tipe data bidang yang tersedia, lihat. Membuat JSON file skema untuk skema Amazon Personalize Persyaratan ini berlaku untuk semua skema Amazon Personalize.

Dataset kustom dan persyaratan skema

Saat Anda membuat kumpulan data untuk grup Dataset Kustom, setiap jenis kumpulan data memiliki bidang wajib berikut dan kata kunci cadangan dengan tipe data yang diperlukan.

Jenis dataset Bidang yang diperlukan Kata kunci terpesan
Interaksi item (contoh skema)

USER_ID () string

ITEM_ID () string

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (float, null)

IMPRESSION (string, null)

RECOMMENDATION_ID (string,null)

EVENT_ATTRIBUTION_SOURCE (string, null)

Pengguna (contoh skema)

USER_ID () string

1 bidang metadata (kategoris string atau numerik)

Item (contoh skema)

ITEM_ID () string

1 bidang metadata (bidang kategoris atau string tekstual atau bidang numerik)

CREATION_TIMESTAMP (long)

Tindakan (contoh skema)

ACTION_ID () string

1 bidang metadata (kategoris string atau numerik)

CREATION_TIMESTAMP (long)

VALUE (long, null)

TYPE (string, null)

EXPIRATION_TIMESTAMP (long, null)

REPEAT_FREQUENCY (long, null)

Interaksi aksi (contoh skema)

USER_ID () string

ACTION_ID () string

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string, null)

RECOMMENDATION_ID (string,null)

Kolom metadata

Metadata mencakup bidang string atau non-string yang tidak diperlukan atau tidak menggunakan kata kunci cadangan. Skema metadata memiliki batasan berikut:

  • Skema Pengguna, Item, dan Tindakan memerlukan setidaknya satu bidang metadata.

  • Anda dapat menambahkan paling banyak 25 bidang metadata untuk skema Pengguna, 100 bidang metadata untuk skema Item, dan 10 bidang metadata untuk skema Tindakan.

  • Jika Anda menambahkan bidang metadata Anda sendiri dari tipestring, itu harus menyertakan categorical atribut atau textual atribut (hanya skema Item yang mendukung bidang dengan atribut tekstual). Jika tidak, Amazon Personalize tidak akan menggunakan bidang saat melatih model.

Kata kunci terpesan

Kata kunci yang dicadangkan adalah opsional, bidang non-metadata. Bidang ini dianggap dicadangkan karena Anda harus menentukan bidang sebagai tipe data yang diperlukan saat Anda menggunakannya, dan kata kunci tidak dapat digunakan sebagai nilai dalam data Anda. Bidang string kategoris yang dicadangkan harus categorical disetel ketrue, sementara bidang string yang dicadangkan tidak dapat dikategorikan. Berikut ini adalah kata kunci yang dicadangkan:

  • EVENT_TYPE: Untuk kumpulan data interaksi Item dengan satu atau beberapa jenis acara, seperti klik dan unduh, gunakan bidang. EVENT_TYPE Anda harus mendefinisikan TYPE bidang EVENT _ sebagai a string dan tidak dapat ditetapkan sebagai kategoris.

  • EVENT_VALUE: Untuk kumpulan data interaksi Item yang menyertakan data nilai untuk peristiwa, seperti persentase video yang ditonton pengguna, gunakan EVENT_VALUE bidang dengan tipe float dan opsional. null

  • CREATION_TIMESTAMP: Untuk kumpulan data Item atau Tindakan dengan stempel waktu untuk tanggal pembuatan setiap item, gunakan CREATION_TIMESTAMP bidang dengan tipe. long Amazon Personalize menggunakan CREATION_TIMESTAMP data untuk menghitung usia item dan menyesuaikan rekomendasi yang sesuai. Lihat Data stempel waktu pembuatan.

  • IMPRESSION: Untuk kumpulan data interaksi Item dengan data tayangan eksplisit, gunakan IMPRESSION bidang dengan tipe String dan tipe opsional. null Tayangan adalah daftar item yang terlihat oleh pengguna saat berinteraksi dengan (misalnya, diklik atau ditonton) item tertentu. Untuk informasi selengkapnya, lihat Data tayangan.

  • RECOMMENDATION_ID: Untuk kumpulan data interaksi Item yang menggunakan rekomendasi sebelumnya sebagai data tayangan implisit, secara opsional gunakan RECOMMENDATION_ID bidang dengan tipe dan tipe opsional. String null

    Anda tidak perlu menambahkan RECOMMENDATION_ID bidang untuk Amazon Personalize untuk menggunakan tayangan implisit saat membuat rekomendasi. Anda dapat lulus recommendationId dalam PutEvents operasi tanpa itu. Untuk informasi selengkapnya, lihat Data tayangan.

  • VALUE: Untuk kumpulan data Tindakan, jika Anda memiliki nilai data untuk beberapa atau semua tindakan Anda, tambahkan VALUE bidang ke skema Anda. Untuk jenisnya, gunakan long dan ketik null opsional. Untuk informasi selengkapnya tentang tindakan dan nilainya, lihatData nilai.

  • ACTION_ EXPIRATION _TIMESTAMP: Untuk kumpulan data Tindakan, jika Anda memiliki stempel waktu kedaluwarsa untuk beberapa atau semua tindakan Anda, tambahkan bidang ke skema Anda. ACTION_EXPIRATION_TIMESTAMP Untuk jenisnya, gunakan long dan ketik null opsional. Untuk informasi selengkapnya tentang cap waktu kedaluwarsa, lihat. Data stempel waktu kedaluwarsa tindakan

  • REPEAT_FREQUENCY: Untuk kumpulan data Tindakan, jika Anda memiliki data frekuensi berulang untuk beberapa atau semua tindakan Anda, tambahkan REPEAT_FREQUENCY bidang ke skema Anda. Untuk jenisnya, gunakan long dan ketik null opsional. Untuk informasi selengkapnya tentang data frekuensi berulang, lihatUlangi data frekuensi.