Prérequis Didacticiel Commencer à utiliser les blocs-notes Amazon Personalize APIs avec Jupyter () iPython

Commencer (SDKpour Python (Boto3))

Ce didacticiel explique comment effectuer le flux de travail Amazon Personalize du début à la SDK fin avec Python (Boto3).

Lorsque vous avez terminé l'exercice de mise en route, pour éviter d'encourir des frais inutiles, supprimez les ressources que vous avez créées. Pour de plus amples informations, veuillez consulter Conditions requises pour supprimer des ressources Amazon Personalize.

Rubriques

Prérequis
Didacticiel
Commencer à utiliser les blocs-notes Amazon Personalize APIs avec Jupyter () iPython

Prérequis

Les étapes suivantes sont prérequises pour l'utilisation des exemples Python de ce guide :

Complétez le Conditions préalables à la mise en route pour configurer les autorisations requises et créer les données d'entraînement. Si vous utilisez vos propres données sources, assurez-vous qu'elles sont formatées conformément aux prérequis.
Configurez votre AWS SDK for Python (Boto3) environnement comme indiqué dansConfiguration du AWS SDKs.

Didacticiel

Dans les étapes suivantes, vous allez vérifier votre environnement et créer des clients SDK pour Python (Boto3) pour Amazon Personalize. Ensuite, vous importez des données, vous créez et déployez une version de solution avec une campagne et vous obtenez des recommandations.

Une fois que vous avez effectué les prérequis, exécutez l'exemple Python suivant pour vérifier que votre environnement a été configuré correctement. Ce code crée également les clients Amazon Personalize boto3 que vous utilisez dans ce didacticiel. Si votre environnement est correctement configuré, la liste des recettes disponibles s'affiche et vous pouvez exécuter les autres exemples de ce didacticiel.


import boto3

personalizeRt = boto3.client('personalize-runtime')
personalize = boto3.client('personalize')

response = personalize.list_recipes()

for recipe in response['recipes']:
    print (recipe)

Après avoir créé les clients Amazon Personalize boto3 et vérifié votre environnement, importez les données historiques que vous avez créées lorsque vous avez terminé le. Conditions préalables à la mise en route Pour importer des données historiques dans Amazon Personalize, procédez comme suit :

Utilisez le code suivant pour créer un schéma dans Amazon Personalize. Remplacez getting-started-schema par un nom pour le schéma.


import json
schema = {
  "type": "record",
  "name": "Interactions",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
      {
          "name": "USER_ID",
          "type": "string"
      },
      {
          "name": "ITEM_ID",
          "type": "string"
      },
      {
          "name": "TIMESTAMP",
          "type": "long"
      }
  ],
  "version": "1.0"
}

create_interactions_schema_response = personalize.create_schema(
    name='getting-started-schema',
    schema=json.dumps(schema)
)

interactions_schema_arn = create_interactions_schema_response['schemaArn']
print(json.dumps(create_interactions_schema_response, indent=2))

Créez un fichier groupe d'ensembles de données avec le code suivant. Remplacez dataset group name par un nom pour le groupe de jeux de données.


response = personalize.create_dataset_group(name = 'dataset group name')
dataset_group_arn = response['datasetGroupArn']

description = personalize.describe_dataset_group(datasetGroupArn = dataset_group_arn)['datasetGroup']

print('Name: ' + description['name'])
print('ARN: ' + description['datasetGroupArn'])
print('Status: ' + description['status'])

Créez un jeu de données d'interactions entre articles dans votre nouveau groupe de jeux de données à l'aide du code suivant. Donnez un nom à l'ensemble de données schema_arn et indiquez le et dataset_group_arn des étapes précédentes.
```
response = personalize.create_dataset(
    name = 'datase_name',
    schemaArn = 'schema_arn',
    datasetGroupArn = 'dataset_group_arn',
    datasetType = 'Interactions'
)

dataset_arn = response['datasetArn']
```

Importez vos données à l'aide d'une tâche d'importation de jeux de données avec le code suivant. Le code utilise la méthode describe_dataset_import_job pour suivre l'état de la tâche.

Transmettez les paramètres suivants : le nom de la tâche, celui dataset_arn de l'étape précédente, le chemin du compartiment Amazon S3 (s3://bucket name/folder name/ratings.csv) dans lequel vous avez stocké les données d'entraînement et celui de votre rôle de IAM serviceARN. Vous avez créé ce rôle dans le cadre duConditions préalables à la mise en route. Amazon Personalize a besoin d'une autorisation pour accéder au compartiment. Consultez Permettre à Amazon Personalize d'accéder aux ressources Amazon S3.


import time
response = personalize.create_dataset_import_job(
    jobName = 'JobName',
    datasetArn = 'dataset_arn',
    dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/filename.csv'},
    roleArn = 'role_arn',
    importMode = 'FULL'
)

dataset_interactions_import_job_arn = response['datasetImportJobArn']

description = personalize.describe_dataset_import_job(
    datasetImportJobArn = dataset_interactions_import_job_arn)['datasetImportJob']

print('Name: ' + description['jobName'])
print('ARN: ' + description['datasetImportJobArn'])
print('Status: ' + description['status'])

max_time = time.time() + 3*60*60 # 3 hours
while time.time() < max_time:
    describe_dataset_import_job_response = personalize.describe_dataset_import_job(
        datasetImportJobArn = dataset_interactions_import_job_arn
    )
    status = describe_dataset_import_job_response["datasetImportJob"]['status']
    print("Interactions DatasetImportJob: {}".format(status))
    
    if status == "ACTIVE" or status == "CREATE FAILED":
        break
        
    time.sleep(60)

Après avoir importé vos données, vous créez une solution et une version de solution comme suit. La solution contient les configurations permettant d'entraîner un modèle et une version de solution est un modèle entraîné.

Créez une nouvelle solution avec le code suivant. Passez les paramètres suivants : le précédent, le nom dataset_group_arn de la solution et le nom de la recette User-Personalization-V2 (). ARN arn:aws:personalize:::recipe/aws-user-personalization-v2 Conservez le ARN fichier de votre nouvelle solution pour une utilisation ultérieure.
```
create_solution_response = personalize.create_solution(
  name='solution name', 
  recipeArn= 'arn:aws:personalize:::recipe/aws-user-personalization-v2', 
  datasetGroupArn = 'dataset group arn'
)
solution_arn = create_solution_response['solutionArn']
print('solution_arn: ', solution_arn)
```

Créez une version de solution avec le code suivant. Passez en paramètre le résultat solution_arn de l'étape précédente. Le code suivant crée une version de solution. Pendant l'entraînement, le code utilise l'DescribeSolutionVersionopération pour récupérer l'état de la version de la solution. Lorsque la formation est terminée, la méthode renvoie la version ARN de votre nouvelle solution. Conservez-le en vue d'une utilisation ultérieure.


import time
import json

create_solution_version_response = personalize.create_solution_version(
    solutionArn = solution_arn
)

solution_version_arn = create_solution_version_response['solutionVersionArn']
print(json.dumps(create_solution_version_response, indent=2))

max_time = time.time() + 3*60*60 # 3 hours
while time.time() < max_time:
    describe_solution_version_response = personalize.describe_solution_version(
        solutionVersionArn = solution_version_arn
    )
    status = describe_solution_version_response["solutionVersion"]["status"]
    print("SolutionVersion: {}".format(status))
    
    if status == "ACTIVE" or status == "CREATE FAILED":
        break
        
    time.sleep(60)

Après avoir créé la version de votre solution, déployez-la dans le cadre d'une campagne Amazon Personalize. Utilisez le code suivant pour créer une campagne qui déploie la version de votre solution. Passez les paramètres suivants : lesolution_version_arn, et le nom de la campagne. La méthode renvoie le nom de ressource Amazon (ARN) de votre nouvelle campagne. Conservez-le en vue d'une utilisation ultérieure.


response = personalize.create_campaign(
    name = 'campaign name',
    solutionVersionArn = 'solution version arn'
)

arn = response['campaignArn']

description = personalize.describe_campaign(campaignArn = arn)['campaign']
print('Name: ' + description['name'])
print('ARN: ' + description['campaignArn'])
print('Status: ' + description['status'])

Une fois que vous avez créé une campagne, vous pouvez l'utiliser pour obtenir des recommandations. Le code suivant montre comment obtenir des recommandations à partir d'une campagne et imprimer l'identifiant de chaque article recommandé. Transmettez ARN la campagne que vous avez créée à l'étape précédente. Pour l'ID utilisateur, vous transmettez l'ID d'un utilisateur issu des données d'entraînement, telles que123.


response = personalizeRt.get_recommendations(
    campaignArn = 'Campaign ARN',
    userId = '123',
    numResults = 10
)

print("Recommended items")
for item in response['itemList']:
    print (item['itemId'])

Commencer à utiliser les blocs-notes Amazon Personalize APIs avec Jupyter () iPython

Pour commencer à utiliser Amazon Personalize à l'aide des blocs-notes Jupyter, clonez ou téléchargez une série de carnets situés dans le dossier getting_started du référentiel d'échantillons Amazon Personalize. Les carnets de notes vous aident à importer des données de formation, à créer une solution, à créer une campagne et à obtenir des recommandations à l'aide d'Amazon Personalize.

Note

Avant de commencer à utiliser les blocs-notes, assurez-vous de créer votre environnement en suivant les étapes indiquées dans le fichier .md README

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Démarrer (AWS CLI)

Mise en route (SDKpour Java 2.x)