AWS Clean Rooms ML - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWS Clean Rooms ML

AWS Clean Rooms Il machine learning fornisce a due parti un metodo di tutela della privacy che consente a due parti di identificare utenti simili nei propri dati senza la necessità di condividerli tra loro. La prima parte fornisce i dati di formazione a AWS Clean Rooms in modo che possano creare e configurare un modello simile e associarlo a una collaborazione. Quindi, i dati iniziali vengono trasferiti alla collaborazione per creare un segmento simile ai dati di addestramento.

Per una spiegazione più dettagliata di come funziona, vedi. Lavori su più account

  • Fornitore di dati di formazione: la parte che fornisce i dati di formazione, crea e configura un modello simile e quindi associa tale modello a una collaborazione.

  • Fornitore di dati iniziali: la parte che fornisce i dati iniziali, genera un segmento simile ed esporta il segmento simile.

  • Dati di formazione: i dati del fornitore dei dati di formazione, utilizzati per generare un modello simile. I dati di addestramento vengono utilizzati per misurare la somiglianza nei comportamenti degli utenti.

    I dati di addestramento devono contenere un ID utente, un ID articolo e una colonna con timestamp. Facoltativamente, i dati di allenamento possono contenere altre interazioni come caratteristiche numeriche o categoriali. Esempi di interazioni sono un elenco di video guardati, articoli acquistati o articoli letti.

  • Dati di avviamento: i dati del fornitore di dati iniziali, utilizzati per creare un segmento simile. I dati di avviamento possono essere forniti direttamente o possono provenire dai risultati di un AWS Clean Rooms interrogazione. L'output del segmento lookalike è un insieme di utenti tratto dai dati di addestramento che assomiglia di più agli utenti seed.

  • Modello Lookalike: un modello di apprendimento automatico dei dati di addestramento utilizzato per trovare utenti simili in altri set di dati.

    Quando si utilizza ilAPI, il termine modello di audience viene utilizzato in modo equivalente al modello sosia. Ad esempio, si utilizza il CreateAudienceModelAPIper creare un modello simile.

  • Segmento simile: un sottoinsieme dei dati di addestramento che più assomiglia ai dati iniziali.

    Quando si utilizza ilAPI, si crea un segmento simile con. StartAudienceGenerationJobAPI

I dati del fornitore di dati di addestramento non vengono mai condivisi con il fornitore di dati di avviamento e i dati del fornitore di dati di avviamento non vengono mai condivisi con il fornitore di dati di formazione. L'output del segmento simile viene condiviso con il fornitore dei dati di addestramento, ma mai con il fornitore di dati iniziali.

Per ulteriori informazioni sui modelli simili, consultate i seguenti argomenti.

In che modo AWS Clean Rooms ML funziona

Una panoramica di come AWS Clean Rooms ML funziona.

Clean Rooms ML richiede che due parti, un fornitore di dati di formazione e un fornitore di dati iniziali, lavorino in sequenza in AWS Clean Rooms per portare i propri dati in una collaborazione. Questo è il flusso di lavoro che il fornitore di dati di formazione deve completare per primo:

  1. I dati del fornitore dei dati di formazione devono essere archiviati in un AWS Glue tabella del catalogo dati delle interazioni utente-articolo. Come minimo, i dati di addestramento devono contenere una colonna ID utente, una colonna ID interazione e una colonna timestamp.

  2. Il fornitore di dati di formazione registra i dati di allenamento con AWS Clean Rooms.

  3. Il fornitore di dati di formazione crea un modello simile che può essere condiviso con più fornitori di dati iniziali. Il modello Lookalike è una rete neurale profonda che può impiegare fino a 24 ore per addestrarsi. Non viene riaddestrato automaticamente e ti consigliamo di riaddestrare il modello settimanalmente.

  4. Il fornitore di dati di formazione configura il modello lookalike, incluso se condividere i parametri di pertinenza e la posizione in Amazon S3 dei segmenti di output. Il fornitore di dati di formazione può creare più modelli simili configurati a partire da un unico modello simile.

  5. Il fornitore di dati di formazione associa il modello di audience configurato a una collaborazione condivisa con un fornitore di dati iniziali.

Questo è il flusso di lavoro che il fornitore di dati iniziali deve completare successivamente:

  1. I dati del fornitore di dati iniziali possono essere archiviati in un bucket Amazon S3 e possono provenire dai risultati di una query.

  2. Il fornitore di dati iniziali avvia la collaborazione che condivide con il fornitore di dati di formazione.

  3. Il fornitore di dati iniziali crea un segmento simile dalla scheda Clean Rooms ML della pagina di collaborazione.

  4. Il fornitore di dati iniziali può valutare le metriche di pertinenza, se sono state condivise, ed esportare il segmento simile per utilizzarlo all'esterno AWS Clean Rooms.