AWS Clean Rooms ML - AWS Clean Rooms

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AWS Clean Rooms ML

AWS Clean Rooms ML

AWS Clean Rooms ML proporciona un método que preserva la privacidad para que dos partes identifiquen a usuarios similares en sus datos sin necesidad de compartir sus datos entre sí. La primera parte aporta los datos de entrenamiento para AWS Clean Rooms poder crear y configurar un modelo similar y asociarlo a una colaboración. A continuación, los datos iniciales se incorporan a la colaboración para crear un segmento similar que se parezca a los datos de entrenamiento.

Para obtener una explicación más detallada de cómo funciona esto, consulte Trabajos entre cuentas

  • Proveedor de datos de entrenamiento: la parte que aporta los datos de entrenamiento, crea y configura un modelo similar y, a continuación, lo asocia a una colaboración.

  • Proveedor de datos iniciales: la parte que aporta los datos iniciales, genera un segmento similar y exporta su segmento similar.

  • Datos de entrenamiento: los datos del proveedor de datos de entrenamiento, que se utilizan para generar un modelo similar. Los datos de entrenamiento se utilizan para medir la similitud en los comportamientos de los usuarios.

    Los datos de entrenamiento deben contener un ID de usuario, un ID de elemento y una columna de marca de tiempo. De forma opcional, los datos de entrenamiento pueden contener otras interacciones, como características numéricas o categóricas. Algunos ejemplos de interacciones son una lista de los vídeos visualizados, los artículos comprados o los artículos leídos.

  • Datos iniciales: los datos del proveedor de datos iniciales, que se utilizan para crear un segmento similar. Los datos iniciales se pueden proporcionar directamente o pueden provenir de los resultados de una AWS Clean Rooms consulta. El resultado del segmento similar es un conjunto de usuarios a partir de los datos de entrenamiento que se parece más a los usuarios iniciales.

  • Modelo similar: un modelo de machine learning de los datos de entrenamiento que se utiliza para encontrar usuarios similares en otros conjuntos de datos.

    Cuando se usa elAPI, el término modelo de audiencia se usa de manera equivalente al modelo similar. Por ejemplo, se utiliza CreateAudienceModelAPIpara crear un modelo similar.

  • Segmento similar: un subconjunto de los datos de entrenamiento que más se parece a los datos iniciales.

    Al usar elAPI, se crea un segmento similar con. StartAudienceGenerationJobAPI

Los datos del proveedor de datos de entrenamiento nunca se comparten con el proveedor de datos iniciales, y viceversa. La salida del segmento similar se comparte con el proveedor de datos de entrenamiento, pero nunca con el proveedor de datos iniciales.

Para obtener más información acerca de los modelos similares, consulte los temas siguientes.

Cómo funciona AWS Clean Rooms ML

Una descripción general de cómo funciona el aprendizaje AWS Clean Rooms automático.

El aprendizaje automático de Clean Rooms requiere que dos partes, un proveedor de datos de formación y un proveedor de datos iniciales, trabajen secuencialmente AWS Clean Rooms para integrar sus datos en una colaboración. Este es el flujo de trabajo que el proveedor de datos de entrenamiento debe completar primero:

  1. Los datos del proveedor de datos de formación deben almacenarse en una tabla de catálogo de AWS Glue datos con las interacciones entre usuarios y elementos. Como mínimo, los datos de entrenamiento deben contener una columna de ID de usuario, una columna de ID de interacción y una columna de fecha y hora.

  2. El proveedor de datos de entrenamiento registra los datos de entrenamiento con. AWS Clean Rooms

  3. El proveedor de datos de entrenamiento crea un modelo similar que se puede compartir con varios proveedores de datos iniciales. El modelo similar es una red neuronal profunda que puede tardar hasta 24 horas en entrenarse. No se reentrena automáticamente y te recomendamos que vuelvas a entrenar el modelo una vez por semana.

  4. El proveedor de datos de entrenamiento configura el modelo similar, que incluye si desea compartir las métricas de relevancia y la ubicación en Amazon S3 de los segmentos de salida. El proveedor de datos de entrenamiento puede crear varios modelos similares configurados a partir de un único modelo similar.

  5. El proveedor de datos de entrenamiento asocia el modelo de audiencia configurado a una colaboración que se comparte con un proveedor de datos iniciales.

Este es el flujo de trabajo que el proveedor de datos iniciales debe completar a continuación:

  1. Los datos del proveedor de datos iniciales se pueden almacenar en un bucket de Amazon S3 y pueden provenir de los resultados de la consulta.

  2. El proveedor de datos iniciales comienza la colaboración que comparte con el proveedor de datos de entrenamiento.

  3. El proveedor de datos iniciales crea un segmento similar en la pestaña Clean Rooms ML de la página de colaboración.

  4. El proveedor de datos iniciales puede evaluar las métricas de relevancia, en caso de que se hayan compartido, y exportar el segmento similar para su uso fuera de AWS Clean Rooms.