Memulai grup dataset Domain (SDKuntuk Python (Boto3)) - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memulai grup dataset Domain (SDKuntuk Python (Boto3))

Tutorial ini menunjukkan cara menggunakan SDK for Python (Boto3) untuk membuat grup dataset Domain untuk domain _ON_. VIDEO DEMAND Dalam tutorial ini, Anda membuat rekomendasi untuk pilihan Top untuk kasus penggunaan Anda.

Saat Anda menyelesaikan latihan memulai, untuk menghindari biaya yang tidak perlu, hapus sumber daya yang Anda buat. Untuk informasi selengkapnya, lihat Persyaratan untuk menghapus sumber daya Amazon Personalize.

Prasyarat

Berikut ini adalah langkah-langkah prasyarat untuk menggunakan contoh Python dalam panduan ini:

  • Selesaikan Memulai prasyarat untuk mengatur izin yang diperlukan dan membuat data pelatihan. Jika Anda menggunakan data sumber Anda sendiri, pastikan bahwa data Anda diformat seperti dalam prasyarat.

  • Siapkan AWS SDK for Python (Boto3) lingkungan Anda seperti yang ditentukan dalamMenyiapkan AWS SDKs.

Tutorial

Dalam langkah-langkah berikut, Anda memverifikasi lingkungan Anda dan membuat klien Python (Boto3) SDK untuk Amazon Personalisasi. Kemudian Anda mengimpor data, membuat pemberi rekomendasi untuk pilihan Teratas untuk kasus penggunaan Anda, dan mendapatkan rekomendasi.

Setelah Anda menyelesaikan prasyarat, jalankan contoh Python berikut untuk mengonfirmasi bahwa lingkungan Anda dikonfigurasi dengan benar. Kode ini juga menciptakan Amazon Personalize boto3 klien yang Anda gunakan dalam tutorial ini. Jika lingkungan Anda dikonfigurasi dengan benar, daftar resep yang tersedia ditampilkan dan Anda dapat menjalankan contoh lain dalam tutorial ini.

import boto3 personalizeRt = boto3.client('personalize-runtime') personalize = boto3.client('personalize') response = personalize.list_recipes() for recipe in response['recipes']: print (recipe)

Setelah Anda membuat Amazon Personalisasi klien boto3 dan memverifikasi lingkungan Anda, impor data historis yang Anda buat saat Anda menyelesaikan. Memulai prasyarat Untuk mengimpor data historis ke Amazon Personalize, lakukan hal berikut:

  1. Gunakan kode berikut untuk membuat skema di Amazon Personalize. Ganti gs-domain-interactions-schema dengan nama untuk skema.

    import json schema = { "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" } create_interactions_schema_response = personalize.create_schema( name='gs-domain-interactions-schema', schema=json.dumps(schema), domain='VIDEO_ON_DEMAND' ) interactions_schema_arn = create_interactions_schema_response['schemaArn'] print(json.dumps(create_interactions_schema_response, indent=2))
  2. Buat grup kumpulan data dengan kode berikut. Ganti dataset group name dengan nama untuk grup dataset.

    response = personalize.create_dataset_group( name = 'dataset group name', domain = 'VIDEO_ON_DEMAND' ) dsg_arn = response['datasetGroupArn'] description = personalize.describe_dataset_group(datasetGroupArn = dsg_arn)['datasetGroup'] print('Name: ' + description['name']) print('ARN: ' + description['datasetGroupArn']) print('Status: ' + description['status'])
  3. Buat kumpulan data interaksi Item di grup kumpulan data baru Anda dengan kode berikut. Beri nama kumpulan data dan berikan schema_arn dan dataset_group_arn dari langkah sebelumnya.

    response = personalize.create_dataset( name = 'interactions-dataset-name', schemaArn = interactions_schema_arn, datasetGroupArn = dsg_arn, datasetType = 'INTERACTIONS' ) dataset_arn = response['datasetArn']
  4. Impor data Anda dengan pekerjaan impor dataset dengan kode berikut. Kode menggunakan metode describe_dataset_import_job untuk melacak status pekerjaan.

    Teruskan parameter berikut sebagai parameter: nama untuk pekerjaan, dataset_arn dari langkah sebelumnya, jalur bucket Amazon S3 (s3://bucket name/folder name/ratings.csv) tempat Anda menyimpan data pelatihan, dan peran IAM layanan Anda. ARN Anda menciptakan peran ini sebagai bagian dariMemulai prasyarat. Amazon Personalize memerlukan izin untuk mengakses bucket. Untuk informasi tentang pemberian akses, lihatMemberikan Amazon Personalisasi akses ke sumber daya Amazon S3.

    import time response = personalize.create_dataset_import_job( jobName = 'JobName', datasetArn = 'dataset_arn', dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/filename.csv'}, roleArn = 'role_arn' ) dataset_interactions_import_job_arn = response['datasetImportJobArn'] description = personalize.describe_dataset_import_job( datasetImportJobArn = dataset_interactions_import_job_arn)['datasetImportJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['datasetImportJobArn']) print('Status: ' + description['status']) max_time = time.time() + 3*60*60 # 3 hours while time.time() < max_time: describe_dataset_import_job_response = personalize.describe_dataset_import_job( datasetImportJobArn = dataset_interactions_import_job_arn ) status = describe_dataset_import_job_response["datasetImportJob"]['status'] print("Interactions DatasetImportJob: {}".format(status)) if status == "ACTIVE" or status == "CREATE FAILED": break time.sleep(60)

Setelah pekerjaan impor dataset Anda selesai, Anda siap membuat pemberi rekomendasi. Gunakan kode berikut untuk membuat pemberi rekomendasi. Teruskan yang berikut ini sebagai parameter: nama untuk pemberi rekomendasi, Amazon Resource Name (ARN) grup dataset Anda, dan arn:aws:personalize:::recipe/aws-vod-top-picks untuk resepnya. ARN Kode menggunakan metode describe_recommended untuk melacak status pemberi rekomendasi.

import time create_recommender_response = personalize.create_recommender( name = 'gs-python-top-picks', recipeArn = 'arn:aws:personalize:::recipe/aws-vod-top-picks', datasetGroupArn = dsg_arn ) recommender_arn = create_recommender_response['recommenderArn'] print('Recommender ARN:' + recommender_arn) max_time = time.time() + 3*60*60 # 3 hours while time.time() < max_time: version_response = personalize.describe_recommender( recommenderArn = recommender_arn ) status = version_response["recommender"]["status"] if status == "ACTIVE": print("Creation succeeded for {}".format(recommender_arn)) elif status == "CREATE FAILED": print("Creation failed for {}".format(recommender_arn)) if status == "ACTIVE": break else: print("Recommender creation is still in progress") time.sleep(60)

Setelah Anda membuat pemberi rekomendasi, Anda menggunakannya untuk mendapatkan rekomendasi dengan kode berikut. Teruskan sebagai parameter Nama Sumber Daya Amazon (ARN) dari pemberi rekomendasi yang Anda buat pada langkah sebelumnya, dan ID pengguna (misalnya,123). Metode ini mencetak daftar item yang direkomendasikan.

response = personalizeRt.get_recommendations( recommenderArn = "arn:aws:personalize:us-west-2:014025156336:recommender/gs-python-top-picks-89", userId = '123' ) print("Recommended items") for item in response['itemList']: print (item['itemId'])

Memulai menggunakan Amazon Personalize APIs dengan notebook Jupyter () iPython

Untuk mulai membuat grup kumpulan data Domain dengan notebook Jupyter, kloning atau unduh serangkaian buku catatan yang ditemukan di folder notebooks_managed_domains dari repositori Amazon Personalize samples. Notebook memandu Anda mengimpor data pelatihan, membuat pemberi rekomendasi, dan mendapatkan rekomendasi dengan Amazon Personalize.