Mengkonfigurasi kolom yang digunakan saat pelatihan - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengkonfigurasi kolom yang digunakan saat pelatihan

penting

Secara default, semua solusi baru menggunakan pelatihan otomatis. Dengan pelatihan otomatis, Anda dikenakan biaya pelatihan saat solusi Anda aktif. Untuk menghindari biaya yang tidak perlu, ketika Anda selesai Anda dapat memperbarui solusi untuk mematikan pelatihan otomatis. Untuk informasi tentang biaya pelatihan, lihat harga Amazon Personalisasi.

Jika resep Anda menghasilkan rekomendasi item atau segmen pengguna, Anda dapat memodifikasi kolom yang dipertimbangkan Amazon Personalize saat membuat versi solusi (melatih model).

Anda dapat mengubah kolom yang digunakan saat pelatihan untuk mengontrol data yang digunakan Amazon Personalize saat melatih model (membuat versi solusi). Anda dapat melakukan ini untuk bereksperimen dengan kombinasi data pelatihan yang berbeda. Atau Anda mungkin mengecualikan kolom tanpa data yang berarti. Misalnya, mungkin memiliki kolom yang ingin Anda gunakan hanya untuk memfilter rekomendasi. Anda dapat mengecualikan kolom ini dari pelatihan dan Amazon Personalize mempertimbangkannya hanya saat memfilter.

Anda tidak dapat mengecualikan EVENT _ TYPE kolom. Secara default, Amazon Personalize menggunakan semua kolom yang dapat digunakan saat pelatihan. Data berikut selalu dikecualikan dari pelatihan:

  • Kolom dengan tipe data boolean

  • Data tayangan

  • Bidang string kustom yang tidak kategoris atau tekstual

Anda tidak dapat menyertakan data tayangan dalam pelatihan, tetapi jika kasus penggunaan atau resep Anda menggunakannya, Amazon Personalize menggunakan data tayangan untuk memandu eksplorasi saat Anda mendapatkan rekomendasi.

Jika Anda telah membuat solusi dan Anda ingin memodifikasi kolom yang digunakannya saat pelatihan, Anda dapat mengkloning solusinya. Saat Anda mengkloning solusi, Anda dapat menggunakan konfigurasi solusi yang ada sebagai titik awal, seperti resep dan hiperparameter, dan membuat perubahan apa pun seperlunya. Untuk informasi selengkapnya, lihat Kloning solusi (konsol).

Anda dapat mengonfigurasi kolom yang digunakan Amazon Personalize saat berlatih dengan konsol Amazon Personalize, AWS Command Line Interface (AWS CLI), atau AWS SDK. Untuk informasi tentang memilih kolom dengan konsol Amazon Personalize, lihat langkah-langkah konfigurasi lanjutan di. Membuat solusi (konsol) Setelah membuat solusi, Anda dapat melihat kolom yang digunakan solusi di halaman detail solusi di konsol Amazon Personalize, atau dengan operasi. DescribeSolution

Mengkonfigurasi kolom yang digunakan saat pelatihan (AWS CLI)

Untuk mengecualikan kolom dari pelatihan, berikan excludedDatasetColumns objek di trainingDataConfig sebagai bagian dari konfigurasi solusi. Untuk setiap kunci, berikan jenis dataset. Untuk setiap nilai, berikan daftar kolom untuk dikecualikan. Kode berikut menunjukkan cara mengecualikan kolom dari pelatihan saat Anda membuat solusi dengan AWS CLI.

aws personalize create-solution \ --name solution name \ --dataset-group-arn dataset group ARN \ --recipe-arn recipe ARN \ --solution-config "{\"trainingDataConfig\": {\"excludedDatasetColumns\": { \"datasetType\" : [ \"column1Name\", \"column2Name\"]}}}"

Mengkonfigurasi kolom yang digunakan saat pelatihan (AWS SDKs)

Untuk mengecualikan kolom dari pelatihan, berikan excludedDatasetColumns objek di trainingDataConfig sebagai bagian dari konfigurasi solusi. Untuk setiap kunci, berikan jenis dataset. Untuk setiap nilai, berikan daftar kolom untuk dikecualikan. Kode berikut menunjukkan cara mengecualikan kolom dari pelatihan saat Anda membuat solusi dengan SDK untuk Python (Boto3).

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', recipeArn = 'recipe ARN', datasetGroupArn = 'dataset group ARN', solutionConfig = { "trainingDataConfig": { "excludedDatasetColumns": { "datasetType": ["COLUMN_A", "COLUMN_B"] } } } ) solution_arn = create_solution_response['solutionArn'] print('solution_arn: ', solution_arn)