Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Eliminar usuarios y sus datos con un trabajo de eliminación de datos
Tras importar los datos, puede eliminar los usuarios y sus datos, incluidos sus metadatos y datos de interacciones, de un grupo de conjuntos de datos. Puedes eliminar los datos de los usuarios como parte de un programa de cumplimiento, o para atender las solicitudes de eliminación de usuarios, o para mantener tus datos actualizados a medida que cambia tu base de usuarios.
Tras eliminar los usuarios, Amazon Personalize ya no utiliza sus datos y deja de tener en cuenta a los usuarios al generar segmentos de usuarios.
Para eliminar las referencias a los usuarios en los conjuntos de datos y modelos de Amazon Personalize de un grupo de conjuntos de datos, haga lo siguiente:
-
Prepare un CSV archivo que enumere userIds los usuarios que desea eliminar en una columna USER _ID.
-
Sube el CSV archivo a un bucket de Amazon S3. Su función de servicio Amazon Personalize debe tener permiso para acceder a este depósito.
-
Cree un trabajo de eliminación de datos. Un trabajo de eliminación de datos es un trabajo por lotes que elimina los usuarios y sus datos de los modelos y conjuntos de datos de un grupo de conjuntos de datos.
Temas
Directrices y requisitos
A continuación se indican las directrices y los requisitos para eliminar usuarios:
-
Antes de crear un trabajo de eliminación de datos, asegúrese de que no haya ningún trabajo en curso que utilice sus conjuntos de datos, como trabajos de formación, trabajos por lotes u operaciones de importación masiva o individual. Y evite crear dichos trabajos mientras haya un trabajo de eliminación de datos en curso. Si se produce algún proceso de formación o importación, no podemos garantizar que los datos de los usuarios se eliminen de los modelos, por lo que recomendamos crear un trabajo de eliminación de datos adicional.
-
Un trabajo de eliminación de datos no elimina las referencias a usuarios ajenos a Amazon Personalize. Por ejemplo, no los elimina de las recomendaciones userId de lotes de tu bucket de Amazon S3. Debes eliminar estos registros manualmente.
-
Puede tener hasta 5 tareas de eliminación para un grupo de conjuntos de datos con un estado dePENDING.
-
El tamaño total máximo de los archivos de entrada para la eliminación de datos es de 50 MB. Puede volver a utilizar el mismo archivo de entrada al crear trabajos de eliminación.
-
Cada trabajo de eliminación de datos elimina los usuarios y sus datos de interacción en un grupo de conjuntos de datos. Para eliminar sus datos en todos los grupos de conjuntos de datos, debe crear un trabajo de eliminación de datos para cada grupo de conjuntos de datos.
-
Después de crear un trabajo, eliminar los datos de los usuarios de los conjuntos de datos y modelos puede tardar hasta un día.
-
Una vez finalizado un trabajo, asegúrate de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.
-
Su rol de servicio Amazon Personalize debe tener permiso para acceder a su bucket de Amazon S3 con la lista de usuarios que desea eliminar. Necesita
GetObject
ListBucket
permisos para el bucket y su contenido. Estos permisos son los mismos que los de importación de datos. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3. -
No puede usar su propia AWS Key Management Service clave en el bucket de Amazon S3 que almacena la lista userIds de usuarios que desea eliminar.
-
Si un elemento aparece solo en el conjunto de datos de tu conjunto de datos de interacciones entre elementos y solo los usuarios que vas a eliminar interactuaron con él, este elemento dejará de aparecer en las recomendaciones.
Preparar una lista de usuarios para eliminarlos
Antes de eliminar usuarios de Amazon Personalize, debe preparar una lista de usuarios para eliminarlos en un CSV archivo y subirla a Amazon S3.
Para preparar la lista de usuarios que desea eliminar y cargar
-
Cree un CSV archivo en el que userIds figuren los usuarios que desee eliminar. A continuación se muestra el formato que debe tener el CSV archivo.
USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
-
Sube CSV el archivo a un bucket de Amazon Simple Storage Service (Amazon S3). Para obtener más información sobre la carga de archivos a Amazon S3, consulte Carga de archivos y carpetas mediante la función de arrastrar y soltar en la Guía del usuario de Amazon Simple Storage Service.
-
Concede a Amazon Personalize acceso a tu depósito y a tu CSV archivo. Amazon Personalize debe tener permiso para realizar las
ListBucket
accionesGetObject
y en tu bucket y su contenido. Estos permisos son los mismos que los de importación de datos. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3.
Crear un trabajo de eliminación de datos
Una vez completadoPreparar una lista de usuarios para eliminarlos, estará listo para eliminar los usuarios con un trabajo de eliminación de datos.
Un trabajo de eliminación de datos es un trabajo por lotes que elimina los usuarios y sus datos de los modelos y conjuntos de datos de un grupo de conjuntos de datos. Tras eliminar los usuarios, Amazon Personalize ya no utiliza sus datos y deja de tener en cuenta a los usuarios al generar segmentos de usuarios.
Al crear un trabajo de eliminación de datos, debe especificar la ubicación en Amazon S3 de la lista de usuarios que desea eliminar.
-
Si los datos están en un solo archivo, utilice la siguiente sintaxis para la ubicación de Amazon S3:
s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv
-
Si sus CSV archivos se encuentran en una carpeta de su bucket de Amazon S3, puede especificar la ruta a la carpeta. Cuando se trata de una tarea de eliminación de datos, Amazon Personalize utiliza todos los archivos con la extensión de
.csv
archivo de la carpeta y de cualquier subcarpeta. Ignora los archivos de cualquier otro tipo. Use la siguiente sintaxis con una/
después del nombre de la carpeta:s3://amzn-s3-demo-bucket/<folder path>/
El rol que utilices debe tener permiso para realizar las ListBucket
acciones GetObject
y en tu bucket de Amazon S3 y su contenido. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3.
Puede crear un trabajo de eliminación de datos con la consola Amazon Personalize, el AWS Command Line Interface (AWS CLI) o AWS SDKs.
Para eliminar usuarios con la consola Amazon Personalize, cree un trabajo de eliminación de datos con un nombre, la función de IAM servicio y la ubicación de sus datos en Amazon S3.
Para eliminar registros (consola)
-
Abre la consola Amazon Personalize en https://console.aws.amazon.com/personalize/casa
e inicia sesión en tu cuenta. -
En la página Grupos de conjuntos de datos, elija su grupo de conjuntos de datos. Aparece la Información general del grupo de conjuntos de datos.
-
En el panel de navegación de la izquierda, elija Conjuntos de datos.
-
En Trabajos de eliminación de datos, selecciona Crear trabajo.
-
En Detalles del trabajo, asigne un nombre al trabajo.
-
En S3 Input source, para S3 Location, especifique la ubicación en Amazon S3 del CSV archivo que almacena la lista userIds de usuarios que se van a eliminar. Preparó este archivo enPreparar una lista de usuarios para eliminarlos.
-
En IAMel rol, elija crear un nuevo rol o usar uno existente. Si ha completado los requisitos previos para crear un rol para Amazon Personalize y ha concedido a este rol acceso a su bucket de Amazon S3, elija Usar un rol de servicio existente y especifique el rol en Creación de un IAM rol para Amazon Personalize el que lo creó.
El rol que utilices debe tener permiso para realizar las
ListBucket
accionesGetObject
y en tu bucket de Amazon S3 y su contenido. Estos permisos son los mismos que los de importación de datos. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3. -
Para Etiquetas, si lo desea, añada cualquier etiqueta. Para obtener más información acerca del etiquetado de recursos de Amazon Personalize, consulte Etiquetado de recursos de Amazon Personalize.
-
Seleccione Crear trabajo. El trabajo se inicia y aparece la página de detalles.
Después de crear un trabajo, puede transcurrir aproximadamente un día para eliminar los datos de los usuarios de los conjuntos de datos y modelos. Hasta que se complete el trabajo, Amazon Personalize seguirá utilizando los datos durante el entrenamiento. Además, los usuarios pueden aparecer en segmentos de usuarios.
La eliminación de datos se completa cuando el estado se muestra comoCOMPLETED. Si el trabajo falla por algún motivo, recomendamos crear otro trabajo de eliminación de datos. Cuando se complete un trabajo, asegúrese de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.
Para eliminar usuarios con el AWS CLI, utilice el create-data-deletion-job
comando. Este comando usa la CreateDataDeletion API operación. El código siguiente muestra cómo crear un trabajo de eliminación de datos. Para usar el código, actualícelo para especificar el nombre del trabajo, el IAM rol en Creación de un IAM rol para Amazon Personalize el que creó y la ubicación de sus datos en Amazon S3. Preparó este archivo enPreparar una lista de usuarios para eliminarlos.
aws personalize create-data-deletion-job \ --job-name
deletion job name
\ --dataset-group-arndataset group ARN
\ --data-source dataLocation=s3://amzn-s3-demo-bucket
/filename
.csv \ --role-arnroleArn
Después de crear un trabajo, puede tardar aproximadamente un día en eliminar los datos de los usuarios de los conjuntos de datos y modelos. Hasta que se complete el trabajo, Amazon Personalize seguirá utilizando los datos durante el entrenamiento. Además, los usuarios pueden aparecer en segmentos de usuarios.
El trabajo está completo cuando el estado esCOMPLETED. Compruebe el estado mediante el describe-data-deletion-job
comando y especifique el trabajo de eliminación de datosARN. Para obtener más información sobre la API operación, consulteDescribeDataDeletionJob. Para ver un historial de los trabajos de eliminación de datos ordenados por hora de creación, utilice la ListDataDeletionJobs API operación.
Si el trabajo falla por algún motivo, se recomienda crear otro trabajo de eliminación de datos. Cuando se complete un trabajo, asegúrese de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.
Para eliminar usuarios con la AWS SDKs, utilice la CreateDataDeletionJob API operación. El código siguiente muestra cómo crear un trabajo de eliminación de datos. Para usar el código, actualícelo para especificar el nombre del trabajo, el IAM rol en Creación de un IAM rol para Amazon Personalize el que creó y la ubicación de sus datos en Amazon S3. Preparó este archivo enPreparar una lista de usuarios para eliminarlos.
import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = '
Deletion job name
', datasetGroupArn = 'Dataset Group ARN
', dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv
'}, roleArn = 'role_arn
' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])
Después de crear un trabajo, puede tardar aproximadamente un día en eliminar los datos de los usuarios de los conjuntos de datos y modelos. Hasta que se complete el trabajo, Amazon Personalize seguirá utilizando los datos durante el entrenamiento. Además, los usuarios pueden aparecer en segmentos de usuarios.
El trabajo está completo cuando el estado esCOMPLETED. Compruebe el estado mediante la DescribeDataDeletionJob operación y especifique el trabajo de eliminación de datosARN. Para ver un historial de los trabajos de eliminación de datos ordenados por hora de creación, utilice la ListDataDeletionJobs API operación.
Si el trabajo falla por algún motivo, se recomienda crear otro trabajo de eliminación de datos. Cuando se complete un trabajo, asegúrese de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.