Requisitos previos para los ejercicios de introducción - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos previos para los ejercicios de introducción

Los siguientes pasos son requisitos previos para los ejercicios de introducción.

  1. Configure permisos para que Amazon Personalize pueda acceder a sus recursos en su nombre. Esto implica crear un rol de servicio para Amazon Personalize y concederle acceso a los recursos de Amazon Personalize con una IAM política. Para obtener más información, consulte Concesión de permiso a Amazon Personalize para que acceda a sus recursos.

  2. Prepare los datos de entrenamiento y súbalos en su bucket de Amazon S3:

  3. Conceda permiso a su rol de servicio de Amazon Personalize para acceder a sus recursos de Amazon S3, tal y como se especifica en Concesión de acceso a Amazon Personalize para los recursos de Amazon S3.

Creación de los datos de entrenamiento (grupo de conjuntos de datos de dominio)

Para crear datos de entrenamiento, debe descargar, modificar y guardar los datos de valoraciones de películas en un bucket de Amazon Simple Storage Service (Amazon S3). A continuación, debe conceder a permiso a Amazon Personalize para leer datos del bucket.

Para crear los datos de entrenamiento
  1. Descarga y descomprime el archivo zip de clasificación de películas, ml-latest-small.zip, de las categorías MovieLensmenos recomendadas para la educación y el desarrollo (F. Maxwell Harper y Joseph A. Konstan. 2015). Los MovieLens conjuntos de datos: historia y contexto. ACMTransacciones en sistemas inteligentes interactivos (TII) 5, 4:19:1 — 19:19. https://doi.org/10.1145/2827872).

  2. Abra el archivo ratings.csv. Este archivo contiene los datos de interacciones para este tutorial.

    1. Elimine la columna calificación.

    2. Cambie el nombre de las columnas userId y movieId a USER_ID y ITEM_ID respectivamente.

    3. Agregue una TYPE columna EVENT _ y establezca el valor de cada registro en. watch Si utiliza Microsoft Excel, puede establecer el EVENT _ TYPE para cada registro escribiendo watch en la primera celda de la columna y, a continuación, haciendo doble clic en la esquina inferior derecha de la celda. El encabezado debe ser el siguiente:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE

      Estas columnas deben ser exactamente como se muestran para que Amazon Personalize reconozca los datos. Las primeras filas de los datos deberían tener el siguiente aspecto:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....

    Guarde el archivo ratings.csv.

  3. Suba ratings.csv a su bucket de Amazon S3. Para obtener más información, consulte Subida de archivos y carpetas con la función arrastrar y soltar en la Guía del usuario de Amazon Simple Storage Service.

  4. Concede permiso a Amazon Personalize para leer los datos del bucket. Para obtener más información, consulte Concesión de acceso a Amazon Personalize para los recursos de Amazon S3.

Creación de los datos de entrenamiento (grupo de conjuntos de datos personalizado)

Para crear datos de entrenamiento, debe descargar, modificar y guardar los datos de valoraciones de películas en un bucket de Amazon Simple Storage Service (Amazon S3). A continuación, debe conceder a permiso a Amazon Personalize para leer datos del bucket.

  1. Descarga y descomprime el archivo zip de clasificación de películas, ml-latest-small.zip, de las categorías MovieLensmenos recomendadas para la educación y el desarrollo (F. Maxwell Harper y Joseph A. Konstan. 2015). Los MovieLens conjuntos de datos: historia y contexto. ACMTransacciones en sistemas inteligentes interactivos (TII) 5, 4:19:1 — 19:19. https://doi.org/10.1145/2827872).

  2. Abra el archivo ratings.csv. Este archivo contiene los datos de interacciones para este tutorial.

    1. Elimine la columna calificación.

    2. Reemplace la fila de encabezados por la siguiente:

      USER_ID,ITEM_ID,TIMESTAMP

      Para que Amazon Personalize reconozca los datos, estos encabezados deben coincidir exactamente con los que se muestran.

    Guarde el archivo ratings.csv.

  3. Suba ratings.csv a su bucket de Amazon S3. Para obtener más información, consulte Subida de archivos y carpetas con la función arrastrar y soltar en la Guía del usuario de Amazon Simple Storage Service.

  4. Concede permiso a Amazon Personalize para leer los datos del bucket. Para obtener más información, consulte Concesión de acceso a Amazon Personalize para los recursos de Amazon S3.