

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Preparare tabelle di dati di input
<a name="prepare-data-tables"></a>

Nel AWS Entity Resolution, ciascuna delle tue *tabelle di dati di input* contiene record di origine. Questi record contengono identificatori dei consumatori come nome, cognome, indirizzo e-mail o numero di telefono. Questi record di origine possono essere abbinati ad altri record di origine forniti all'interno della stessa o di altre tabelle di dati di input. Ogni record deve avere un Record ID univoco ([ID univoco](glossary.md#unique-id-defn)) ed è necessario definirlo come chiave primaria durante la creazione di una mappatura dello schema all'interno. AWS Entity Resolution

Ogni tabella di dati di input è disponibile come AWS Glue tabella supportata da Amazon S3. Puoi utilizzare i tuoi dati proprietari già all'interno di Amazon S3 o importare tabelle di dati da altri provider SaaS di terze parti in Amazon S3. Dopo aver caricato i dati su Amazon S3, puoi utilizzare un AWS Glue crawler per creare una tabella di dati in. AWS Glue Data Catalog Puoi quindi utilizzare la tabella dati come input per. AWS Entity Resolution

Le sezioni seguenti descrivono come preparare dati proprietari e dati di terze parti.

**Topics**
+ [Preparazione dei dati di input di prime parti](prepare-input-data.md)
+ [Preparazione di dati di input di terze parti](prepare-third-party-input-data.md)

# Preparazione dei dati di input di prime parti
<a name="prepare-input-data"></a>

[I passaggi seguenti descrivono come preparare i dati di prime parti da utilizzare in un flusso di lavoro di abbinamento basato su [regole, in un flusso di lavoro di abbinamento basato sull'apprendimento automatico o in un flusso](creating-matching-workflow-rule-based.md)[di lavoro di mappatura](create-matching-workflow-ml.md) degli ID.](create-id-mapping-workflow.md) 

## Fase 1: Preparare tabelle di dati di prime parti
<a name="prepare-first-party-tables"></a>

Ogni tipo di flusso di lavoro corrispondente presenta una serie diversa di consigli e linee guida per garantire il successo.

Per preparare tabelle di dati di prime parti, consulta la seguente tabella: 


**Linee guida per le tabelle di dati di prime parti**  

| Tipo di flusso di lavoro | Richiesto | 
| --- | --- | 
| Flusso di lavoro di abbinamento basato su regole con tipo di regola avanzato |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 
| flusso di lavoro di abbinamento basato su regole con tipo di regola semplice |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 
| flusso di lavoro di abbinamento basato sull'apprendimento automatico |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 
| Workflow di mappatura degli ID  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 

## Fase 2: Salvate la tabella dei dati di input in un formato di dati supportato
<a name="save-input-data"></a>

Se hai già salvato i dati di input di prima parte in un formato di dati supportato, puoi saltare questo passaggio. 

Per essere utilizzati AWS Entity Resolution, i dati di input devono essere in un formato che AWS Entity Resolution supporti. 

AWS Entity Resolution supporta i seguenti formati di dati:
+ valore separato da virgole (CSV)
+ Parquet

## Fase 3: carica la tabella dei dati di input su Amazon S3
<a name="upload-to-s3"></a>

Se disponi già di una tabella di dati di prime parti in Amazon S3, puoi saltare questo passaggio.

**Nota**  
Puoi archiviare i dati di input in Amazon S3Resources in qualsiasi regione della partizione AWS commerciale in cui è supportato S3. È possibile accedere a questi dati da una regione diversa o Account AWS durante l'esecuzione del flusso di lavoro corrispondente.

**Per caricare la tabella dei dati di input su Amazon S3**

1. Accedi a Console di gestione AWS e apri la console Amazon S3 all'indirizzo. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Scegli **Bucket**, quindi scegli un bucket per archiviare la tabella di dati. 

1. Scegli **Carica**, quindi segui le istruzioni.

1. Scegli la scheda **Oggetti** per visualizzare il prefisso in cui sono archiviati i dati. Prendi nota del nome della cartella.

   È possibile selezionare la cartella per visualizzare la tabella dei dati.

## Fase 4: Creare una AWS Glue tabella
<a name="create-glue-table"></a>

**Nota**  
Se hai bisogno di AWS Glue tabelle partizionate, vai a. [Fase 4: Creare una tabella partizionata AWS Glue](#create-partitioned-glue-table)

I dati di input in Amazon S3 devono essere catalogati AWS Glue e rappresentati come tabella. AWS Glue *Per ulteriori informazioni su come creare una AWS Glue tabella con Amazon S3 come input, consulta [Working with crawler on the AWS Glue console](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) nella Developer Guide.AWS Glue *

In questo passaggio, configuri un crawler AWS Glue che esegue la scansione di tutti i file nel bucket S3 e crea una tabella. AWS Glue 

**Nota**  
AWS Entity Resolution attualmente non supporta le sedi Amazon S3 registrate con. AWS Lake Formation

**Per creare una tabella AWS Glue**

1. Accedi a Console di gestione AWS e apri la AWS Glue console all'indirizzo [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Dalla barra di navigazione, seleziona **Crawlers**.

1. **Seleziona il tuo bucket S3 dall'elenco, quindi scegli Crea crawler.**

1. ****Nella pagina **Imposta le proprietà del crawler**, inserisci un **nome** del crawler (descrizione opzionale), quindi scegli Avanti.****

1. Continua nella pagina **Aggiungi crawler**, specificando i dettagli. 

1. **Nella pagina **Scegli un ruolo IAM**, scegli **Scegli un ruolo IAM esistente, quindi scegli Avanti**.**

   Puoi anche scegliere **Crea un ruolo IAM o chiedere** al tuo amministratore di creare il ruolo IAM, se necessario.

1. **Per **Crea una pianificazione per questo crawler**, mantieni la **frequenza** predefinita (**Esegui su richiesta**), quindi scegli Avanti.**

1. **Per **Configura l'output del crawler**, accedi al AWS Glue database e scegli Avanti.**

1. **Controlla tutti i dettagli, quindi scegli Fine.**

1. **Nella pagina **Crawler**, seleziona la casella di controllo accanto al tuo bucket S3, quindi scegli Esegui crawler.**

1. Al termine dell'esecuzione del crawler, nella barra di AWS Glue navigazione, scegli Database, quindi scegli il nome del **database**.

1. Nella pagina **Database**, scegli **Tabelle in \$1nome del tuo database**\$1.

   1. Visualizza le tabelle nel AWS Glue database.

   1. Per visualizzare lo schema di una tabella, seleziona una tabella specifica.

   1. Prendi nota del nome del AWS Glue database e del nome della AWS Glue tabella.

Ora sei pronto per creare una mappatura dello schema. Per ulteriori informazioni, consulta [Creazione di una mappatura dello schema](create-schema-mapping.md).

## Fase 4: Creare una tabella partizionata AWS Glue
<a name="create-partitioned-glue-table"></a>

**Nota**  
La funzionalità di AWS Glue partizionamento in AWS Entity Resolution è supportata solo nei flussi di lavoro di mappatura degli ID. Questa funzionalità di AWS Glue partizionamento consente di scegliere partizioni specifiche con cui elaborare. AWS Entity Resolution  
Se non hai bisogno di AWS Glue tabelle partizionate, puoi saltare questo passaggio.

Una AWS Glue tabella partizionata riflette automaticamente le nuove partizioni nella AWS Glue tabella quando aggiungi nuove cartelle alla struttura dei dati (ad esempio una nuova cartella giornaliera in meno di un mese). 

Quando crei una AWS Glue tabella partizionata in AWS Entity Resolution, puoi specificare quali partizioni desideri elaborare in un flusso di lavoro di mappatura degli ID. Quindi, ogni volta che si esegue il flusso di lavoro di mappatura degli ID, vengono elaborati solo i dati di tali partizioni, anziché elaborare tutti i dati dell'intera tabella. AWS Glue Questa funzionalità consente un'elaborazione dei dati più precisa, efficiente ed economica AWS Entity Resolution, offrendo maggiore controllo e flessibilità nella gestione delle attività di risoluzione delle entità. 

È possibile creare una AWS Glue tabella partizionata per l'account di origine in un flusso di lavoro di mappatura degli ID. 

Devi prima catalogare i dati di input in Amazon S3 AWS Glue e rappresentarli come AWS Glue tabella. *Per ulteriori informazioni su come creare una AWS Glue tabella con Amazon S3 come input, consulta [Working with crawler on the AWS Glue console](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) nella Developer Guide.AWS Glue *

In questo passaggio, configuri un crawler AWS Glue che esegue la scansione di tutti i file nel bucket S3 e quindi crei una tabella partizionata. AWS Glue 

**Nota**  
AWS Entity Resolution attualmente non supporta le sedi Amazon S3 registrate con. AWS Lake Formation

**Per creare una tabella partizionata AWS Glue**

1. Accedi a Console di gestione AWS e apri la AWS Glue console all'indirizzo. [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/)

1. Dalla barra di navigazione, seleziona **Crawlers**.

1. **Seleziona il tuo bucket S3 dall'elenco, quindi scegli Crea crawler.**

1. ****Nella pagina **Imposta le proprietà del crawler**, inserisci un **nome** per il crawler, una descrizione opzionale, quindi scegli Avanti.****

1. Continua nella pagina **Aggiungi crawler**, specificando i dettagli. 

1. **Nella pagina **Scegli un ruolo IAM**, scegli **Scegli un ruolo IAM esistente, quindi scegli Avanti**.**

   Puoi anche scegliere **Crea un ruolo IAM o chiedere** al tuo amministratore di creare il ruolo IAM, se necessario.

1. **Per **Crea una pianificazione per questo crawler**, mantieni la **frequenza** predefinita (**Esegui su richiesta**), quindi scegli Avanti.**

1. **Per **Configura l'output del crawler**, accedi al AWS Glue database e scegli Avanti.**

1. **Controlla tutti i dettagli, quindi scegli Fine.**

1. **Nella pagina **Crawler**, seleziona la casella di controllo accanto al tuo bucket S3, quindi scegli Esegui crawler.**

1. Al termine dell'esecuzione del crawler, nella barra di AWS Glue navigazione, scegli Database, quindi scegli il nome del **database**.

1. Nella pagina **Database**, in **Tabelle**, scegliete la tabella da partizionare.

1. **Nella panoramica della tabella****, seleziona il menu a discesa **Azioni**, quindi scegli Modifica tabella.**

   1. In **Proprietà della tabella**, scegli **Aggiungi**.

   1. Per la nuova **chiave**, immettete**aerPushDownPredicateString**.

   1. Per il nuovo **valore**, immettete**'<PartitionKey>=<PartitionValue'**.

   1. Prendi nota del nome del AWS Glue database e del nome della AWS Glue tabella.

Ora sei pronto per: 
+ [Creare una mappatura dello schema](create-schema-mapping.md) e quindi [creare un flusso di lavoro di mappatura degli ID per](creating-id-mapping-workflow-same-account.md) una di esse. Account AWS
+ [Crea un'origine per lo spazio dei nomi ID](create-id-namespace-source.md), [crea una destinazione per lo spazio dei nomi ID e quindi [crea un](creating-id-mapping-workflow-two-accounts.md)](create-id-namespace-target.md) flusso di lavoro di mappatura degli ID tra due. Account AWS

# Preparazione di dati di input di terze parti
<a name="prepare-third-party-input-data"></a>

I servizi dati di terze parti forniscono identificatori che possono essere abbinati agli identificatori noti. 

AWS Entity Resolution attualmente supporta i seguenti servizi di fornitori di dati di terze parti:


**Servizi per fornitori di dati**  

| Nome dell'azienda | Disponibile Regioni AWS | Identificatore | 
| --- | --- | --- | 
| LiveRamp | Stati Uniti orientali (Virginia settentrionale) (us-east-1), Stati Uniti orientali (Ohio) (us-east-2) e Stati Uniti occidentali (Oregon) (us-west-2) | ID della rampa | 
| TransUnion | Stati Uniti orientali (Virginia settentrionale) (us-east-1), Stati Uniti orientali (Ohio) (us-east-2) e Stati Uniti occidentali (Oregon) (us-west-2) | TransUnion Individuo e famiglia IDs | 
| ID unificato 2.0 | Stati Uniti orientali (Virginia settentrionale) (us-east-1), Stati Uniti orientali (Ohio) (us-east-2) e Stati Uniti occidentali (Oregon) (us-west-2) | Disegna UID 2 | 

I passaggi seguenti descrivono come preparare i dati di terze parti per utilizzare un flusso di lavoro di [abbinamento basato sui servizi del provider o un flusso](glossary.md#provider-service-matching) di lavoro di mappatura degli ID [basato sui servizi del provider](create-IDMW-provider-services-one-acct.md). 

**Topics**
+ [Fase 1: Abbonarsi a un servizio fornito da un provider su AWS Data Exchange](#subscribe-provider-service)
+ [Fase 2: Preparare tabelle di dati di terze parti](#prepare-third-party-data-tables)
+ [Fase 3: Salvate la tabella dei dati di input in un formato di dati supportato](#save-third-party-data-tables)
+ [Fase 4: caricare la tabella dei dati di input su Amazon S3](#upload-third-party-data-tables)
+ [Fase 5: Creare una AWS Glue tabella](#create-glue-table-third-party-data-tables)

## Fase 1: Abbonarsi a un servizio fornito da un provider su AWS Data Exchange
<a name="subscribe-provider-service"></a>

Se hai un abbonamento a un provider di servizi tramite AWS Data Exchange, puoi eseguire un flusso di lavoro di abbinamento con uno dei seguenti servizi del provider per abbinare i tuoi identificatori noti al tuo provider preferito. I tuoi dati verranno abbinati a una serie di input definiti dal tuo provider preferito.

Per abbonarsi a un servizio offerto da un provider su AWS Data Exchange

1. Visualizza l'elenco dei fornitori su AWS Data Exchange. Sono disponibili i seguenti elenchi di fornitori:
   + LiveRamp
     + [LiveRampRisoluzione dell'identità](https://aws.amazon.com/marketplace/pp/prodview-v4557zxjo6ykq)
     + [LiveRampTranscodifica](https://aws.amazon.com/marketplace/pp/prodview-bpp2fvfcxk2kg)
   + TransUnion
     + TruAudience Risoluzione e arricchimento delle identità
   + ID unificato 2.0
     + [Risoluzione delle identità con Unified ID 2.0](https://aws.amazon.com/marketplace/pp/prodview-66zqls7iqsm6o?sr=0-4&ref_=beagle&applicationId=AWSMPContessa#offers)

1. Completa uno dei seguenti passaggi, a seconda del tipo di offerta.
   + **Offerta privata**: se hai già una relazione con un fornitore, segui la procedura relativa [ai prodotti e alle offerte privati](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribe-to-private-offer.html) nella *Guida per l'AWS Data Exchange utente* per accettare un'offerta privata su AWS Data Exchange.
   + **Porta il tuo abbonamento**: se disponi già di un abbonamento dati con un provider, segui la procedura relativa alle [offerte Bring Your Own Subscription (BYOS)](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribe-to-byos-offer.html) nella *Guida per l'AWS Data Exchange utente* per accettare un'offerta BYOS. AWS Data Exchange

1. Dopo esserti abbonato a un servizio fornito da un provider AWS Data Exchange, puoi creare un flusso di lavoro corrispondente o un flusso di lavoro di mappatura degli ID con quel servizio del provider. 

Per ulteriori informazioni su come accedere a un prodotto del provider che lo contiene APIs, consulta [Accedere a un prodotto API](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribing-to-product.html#use-API-product) nella Guida per l'*AWS Data Exchange utente*.

## Fase 2: Preparare tabelle di dati di terze parti
<a name="prepare-third-party-data-tables"></a>

Ogni servizio di terze parti dispone di una serie diversa di consigli e linee guida per garantire un flusso di lavoro adeguato. 

Per preparare tabelle di dati di terze parti, consulta la seguente tabella:


**Linee guida sui servizi dei fornitori di dati**  

| Servizio del fornitore | È necessario un ID univoco? | Azioni | 
| --- | --- | --- | 
| LiveRamp | Sì |  Assicurati quanto segue: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-third-party-input-data.html)  | 
| TransUnion | Sì |  Assicurati che nella vista di input sia presente un `string` tipo di colonna:  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-third-party-input-data.html)  | 
| ID unificato 2.0 | Sì |  Assicurati quanto segue: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-third-party-input-data.html)  Un indirizzo email o un numero di telefono specifico, in un momento specifico, restituisce lo stesso UID2 valore grezzo, indipendentemente da chi ha effettuato la richiesta.  UID2s Le materie crude si ottengono aggiungendo i sali contenuti nei secchi di sale, che vengono fatti ruotare all'incirca una volta all'anno, facendo UID2 ruotare anche il prodotto crudo. I diversi secchi di sale ruotano in momenti diversi durante l'anno. AWS Entity Resolution attualmente non tiene traccia dei secchi di sale rotanti e di quelli crudi UID2s, quindi si consiglia di rigenerare il crudo ogni giorno. UID2s Per ulteriori informazioni, vedi Con che [frequenza deve UID2s essere aggiornato per gli aggiornamenti incrementali](https://unifiedid.com/docs/getting-started/gs-faqs#how-often-should-uid2s-be-refreshed-for-incremental-updates)? nella documentazione UID 2.0.   | 

## Fase 3: Salvate la tabella dei dati di input in un formato di dati supportato
<a name="save-third-party-data-tables"></a>

Se hai già salvato i dati di input di terze parti in un formato di dati supportato, puoi saltare questo passaggio. 

Per essere utilizzati AWS Entity Resolution, i dati di input devono essere in un formato che AWS Entity Resolution supporti. 

AWS Entity Resolution supporta i seguenti formati di dati:
+ valore separato da virgole (CSV)
**Nota**  
LiveRamp supporta solo file CSV.
+ Parquet

## Fase 4: caricare la tabella dei dati di input su Amazon S3
<a name="upload-third-party-data-tables"></a>

Se hai già una tabella di dati di terze parti in Amazon S3, puoi saltare questo passaggio.

**Nota**  
Puoi archiviare i dati di input nelle risorse Amazon S3 in qualsiasi regione della partizione AWS commerciale in cui è supportato S3. È possibile accedere a questi dati da una regione diversa o Account AWS durante l'esecuzione del flusso di lavoro corrispondente.

**Per caricare la tabella dei dati di input su Amazon S3**

1. Accedi a Console di gestione AWS e apri la console Amazon S3 all'indirizzo. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Scegli **Bucket**, quindi scegli un bucket per archiviare la tabella di dati. 

1. Scegli **Carica**, quindi segui le istruzioni.

1. Scegli la scheda **Oggetti** per visualizzare il prefisso in cui sono archiviati i dati. Prendi nota del nome della cartella.

   È possibile selezionare la cartella per visualizzare la tabella dei dati.

## Fase 5: Creare una AWS Glue tabella
<a name="create-glue-table-third-party-data-tables"></a>

I dati di input in Amazon S3 devono essere catalogati AWS Glue e rappresentati come tabella. AWS Glue *Per ulteriori informazioni su come creare una AWS Glue tabella con Amazon S3 come input, consulta [Working with crawler on the AWS Glue console](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) nella Developer Guide.AWS Glue *

**Nota**  
AWS Entity Resolution non supporta tabelle partizionate.

In questo passaggio, configuri un crawler AWS Glue che esegue la scansione di tutti i file nel tuo bucket S3 e crea una tabella. AWS Glue 

**Nota**  
AWS Entity Resolution attualmente non supporta le sedi Amazon S3 registrate con. AWS Lake Formation

**Per creare una tabella AWS Glue**

1. Accedi a Console di gestione AWS e apri la AWS Glue console all'indirizzo [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Dalla barra di navigazione, seleziona **Crawlers**.

1. **Seleziona il tuo bucket S3 dall'elenco, quindi scegli Aggiungi crawler.**

1. ****Nella pagina **Aggiungi crawler, inserisci un nome per il crawler**, quindi scegli Avanti.****

1. Continua nella pagina **Aggiungi crawler**, specificando i dettagli. 

1. **Nella pagina **Scegli un ruolo IAM**, scegli **Scegli un ruolo IAM esistente, quindi scegli Avanti**.**

   Puoi anche scegliere **Crea un ruolo IAM o chiedere** al tuo amministratore di creare il ruolo IAM, se necessario.

1. **Per **Crea una pianificazione per questo crawler**, mantieni la **frequenza** predefinita (**Esegui su richiesta**), quindi scegli Avanti.**

1. **Per **Configura l'output del crawler**, accedi al AWS Glue database e scegli Avanti.**

1. **Esamina tutti i dettagli, quindi scegli Fine.**

1. **Nella pagina **Crawler**, seleziona la casella di controllo accanto al tuo bucket S3, quindi scegli Esegui crawler.**

1. Al termine dell'esecuzione del crawler, nella barra di AWS Glue navigazione, scegli Database, quindi scegli il nome del **database**.

1. Nella pagina **Database**, scegli **Tabelle in \$1nome del tuo database**\$1.

   1. Visualizza le tabelle nel AWS Glue database.

   1. Per visualizzare lo schema di una tabella, seleziona una tabella specifica.

   1. Prendi nota del nome del AWS Glue database e del nome della AWS Glue tabella.

Ora sei pronto per creare una mappatura dello schema. Per ulteriori informazioni, consulta [Creazione di una mappatura dello schema](create-schema-mapping.md).