

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Preparazione dei dati di input di prime parti
<a name="prepare-input-data"></a>

[I passaggi seguenti descrivono come preparare i dati di prime parti da utilizzare in un flusso di lavoro di abbinamento basato su [regole, in un flusso di lavoro di abbinamento basato sull'apprendimento automatico o in un flusso](creating-matching-workflow-rule-based.md)[di lavoro di mappatura](create-matching-workflow-ml.md) degli ID.](create-id-mapping-workflow.md) 

## Fase 1: Preparare tabelle di dati di prime parti
<a name="prepare-first-party-tables"></a>

Ogni tipo di flusso di lavoro corrispondente presenta una serie diversa di consigli e linee guida per garantire il successo.

Per preparare tabelle di dati di prime parti, consulta la seguente tabella: 


**Linee guida per le tabelle di dati di prime parti**  

| Tipo di flusso di lavoro | Richiesto | 
| --- | --- | 
| Flusso di lavoro di abbinamento basato su regole con tipo di regola avanzato |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 
| flusso di lavoro di abbinamento basato su regole con tipo di regola semplice |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 
| flusso di lavoro di abbinamento basato sull'apprendimento automatico |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 
| Workflow di mappatura degli ID  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/entityresolution/latest/userguide/prepare-input-data.html)  | 

## Fase 2: Salvate la tabella dei dati di input in un formato di dati supportato
<a name="save-input-data"></a>

Se hai già salvato i dati di input di prima parte in un formato di dati supportato, puoi saltare questo passaggio. 

Per essere utilizzati AWS Entity Resolution, i dati di input devono essere in un formato che AWS Entity Resolution supporti. 

AWS Entity Resolution supporta i seguenti formati di dati:
+ valore separato da virgole (CSV)
+ Parquet

## Fase 3: carica la tabella dei dati di input su Amazon S3
<a name="upload-to-s3"></a>

Se disponi già di una tabella di dati di prime parti in Amazon S3, puoi saltare questo passaggio.

**Nota**  
Puoi archiviare i dati di input in Amazon S3Resources in qualsiasi regione della partizione AWS commerciale in cui è supportato S3. È possibile accedere a questi dati da una regione diversa o Account AWS durante l'esecuzione del flusso di lavoro corrispondente.

**Per caricare la tabella dei dati di input su Amazon S3**

1. Accedi a Console di gestione AWS e apri la console Amazon S3 all'indirizzo. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Scegli **Bucket**, quindi scegli un bucket per archiviare la tabella di dati. 

1. Scegli **Carica**, quindi segui le istruzioni.

1. Scegli la scheda **Oggetti** per visualizzare il prefisso in cui sono archiviati i dati. Prendi nota del nome della cartella.

   È possibile selezionare la cartella per visualizzare la tabella dei dati.

## Fase 4: Creare una AWS Glue tabella
<a name="create-glue-table"></a>

**Nota**  
Se hai bisogno di AWS Glue tabelle partizionate, vai a. [Fase 4: Creare una tabella partizionata AWS Glue](#create-partitioned-glue-table)

I dati di input in Amazon S3 devono essere catalogati AWS Glue e rappresentati come tabella. AWS Glue *Per ulteriori informazioni su come creare una AWS Glue tabella con Amazon S3 come input, consulta [Working with crawler on the AWS Glue console](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) nella Developer Guide.AWS Glue *

In questo passaggio, configuri un crawler AWS Glue che esegue la scansione di tutti i file nel bucket S3 e crea una tabella. AWS Glue 

**Nota**  
AWS Entity Resolution attualmente non supporta le sedi Amazon S3 registrate con. AWS Lake Formation

**Per creare una tabella AWS Glue**

1. Accedi a Console di gestione AWS e apri la AWS Glue console all'indirizzo [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Dalla barra di navigazione, seleziona **Crawlers**.

1. **Seleziona il tuo bucket S3 dall'elenco, quindi scegli Crea crawler.**

1. ****Nella pagina **Imposta le proprietà del crawler**, inserisci un **nome** del crawler (descrizione opzionale), quindi scegli Avanti.****

1. Continua nella pagina **Aggiungi crawler**, specificando i dettagli. 

1. **Nella pagina **Scegli un ruolo IAM**, scegli **Scegli un ruolo IAM esistente, quindi scegli Avanti**.**

   Puoi anche scegliere **Crea un ruolo IAM o chiedere** al tuo amministratore di creare il ruolo IAM, se necessario.

1. **Per **Crea una pianificazione per questo crawler**, mantieni la **frequenza** predefinita (**Esegui su richiesta**), quindi scegli Avanti.**

1. **Per **Configura l'output del crawler**, accedi al AWS Glue database e scegli Avanti.**

1. **Controlla tutti i dettagli, quindi scegli Fine.**

1. **Nella pagina **Crawler**, seleziona la casella di controllo accanto al tuo bucket S3, quindi scegli Esegui crawler.**

1. Al termine dell'esecuzione del crawler, nella barra di AWS Glue navigazione, scegli Database, quindi scegli il nome del **database**.

1. Nella pagina **Database**, scegli **Tabelle in \$1nome del tuo database**\$1.

   1. Visualizza le tabelle nel AWS Glue database.

   1. Per visualizzare lo schema di una tabella, seleziona una tabella specifica.

   1. Prendi nota del nome del AWS Glue database e del nome della AWS Glue tabella.

Ora sei pronto per creare una mappatura dello schema. Per ulteriori informazioni, consulta [Creazione di una mappatura dello schema](create-schema-mapping.md).

## Fase 4: Creare una tabella partizionata AWS Glue
<a name="create-partitioned-glue-table"></a>

**Nota**  
La funzionalità di AWS Glue partizionamento in AWS Entity Resolution è supportata solo nei flussi di lavoro di mappatura degli ID. Questa funzionalità di AWS Glue partizionamento consente di scegliere partizioni specifiche con cui elaborare. AWS Entity Resolution  
Se non hai bisogno di AWS Glue tabelle partizionate, puoi saltare questo passaggio.

Una AWS Glue tabella partizionata riflette automaticamente le nuove partizioni nella AWS Glue tabella quando aggiungi nuove cartelle alla struttura dei dati (ad esempio una nuova cartella giornaliera in meno di un mese). 

Quando crei una AWS Glue tabella partizionata in AWS Entity Resolution, puoi specificare quali partizioni desideri elaborare in un flusso di lavoro di mappatura degli ID. Quindi, ogni volta che si esegue il flusso di lavoro di mappatura degli ID, vengono elaborati solo i dati di tali partizioni, anziché elaborare tutti i dati dell'intera tabella. AWS Glue Questa funzionalità consente un'elaborazione dei dati più precisa, efficiente ed economica AWS Entity Resolution, offrendo maggiore controllo e flessibilità nella gestione delle attività di risoluzione delle entità. 

È possibile creare una AWS Glue tabella partizionata per l'account di origine in un flusso di lavoro di mappatura degli ID. 

Devi prima catalogare i dati di input in Amazon S3 AWS Glue e rappresentarli come AWS Glue tabella. *Per ulteriori informazioni su come creare una AWS Glue tabella con Amazon S3 come input, consulta [Working with crawler on the AWS Glue console](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) nella Developer Guide.AWS Glue *

In questo passaggio, configuri un crawler AWS Glue che esegue la scansione di tutti i file nel bucket S3 e quindi crei una tabella partizionata. AWS Glue 

**Nota**  
AWS Entity Resolution attualmente non supporta le sedi Amazon S3 registrate con. AWS Lake Formation

**Per creare una tabella partizionata AWS Glue**

1. Accedi a Console di gestione AWS e apri la AWS Glue console all'indirizzo. [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/)

1. Dalla barra di navigazione, seleziona **Crawlers**.

1. **Seleziona il tuo bucket S3 dall'elenco, quindi scegli Crea crawler.**

1. ****Nella pagina **Imposta le proprietà del crawler**, inserisci un **nome** per il crawler, una descrizione opzionale, quindi scegli Avanti.****

1. Continua nella pagina **Aggiungi crawler**, specificando i dettagli. 

1. **Nella pagina **Scegli un ruolo IAM**, scegli **Scegli un ruolo IAM esistente, quindi scegli Avanti**.**

   Puoi anche scegliere **Crea un ruolo IAM o chiedere** al tuo amministratore di creare il ruolo IAM, se necessario.

1. **Per **Crea una pianificazione per questo crawler**, mantieni la **frequenza** predefinita (**Esegui su richiesta**), quindi scegli Avanti.**

1. **Per **Configura l'output del crawler**, accedi al AWS Glue database e scegli Avanti.**

1. **Controlla tutti i dettagli, quindi scegli Fine.**

1. **Nella pagina **Crawler**, seleziona la casella di controllo accanto al tuo bucket S3, quindi scegli Esegui crawler.**

1. Al termine dell'esecuzione del crawler, nella barra di AWS Glue navigazione, scegli Database, quindi scegli il nome del **database**.

1. Nella pagina **Database**, in **Tabelle**, scegliete la tabella da partizionare.

1. **Nella panoramica della tabella****, seleziona il menu a discesa **Azioni**, quindi scegli Modifica tabella.**

   1. In **Proprietà della tabella**, scegli **Aggiungi**.

   1. Per la nuova **chiave**, immettete**aerPushDownPredicateString**.

   1. Per il nuovo **valore**, immettete**'<PartitionKey>=<PartitionValue'**.

   1. Prendi nota del nome del AWS Glue database e del nome della AWS Glue tabella.

Ora sei pronto per: 
+ [Creare una mappatura dello schema](create-schema-mapping.md) e quindi [creare un flusso di lavoro di mappatura degli ID per](creating-id-mapping-workflow-same-account.md) una di esse. Account AWS
+ [Crea un'origine per lo spazio dei nomi ID](create-id-namespace-source.md), [crea una destinazione per lo spazio dei nomi ID e quindi [crea un](creating-id-mapping-workflow-two-accounts.md)](create-id-namespace-target.md) flusso di lavoro di mappatura degli ID tra due. Account AWS