

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Individuazione di entità PII con processi asincroni (API)
<a name="async-pii-api"></a>

Esegui un processo batch asincrono per individuare le PII in una raccolta di documenti. Per eseguire il lavoro, carica i tuoi documenti su Amazon S3 e invia una [StartPiiEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartPiiEntitiesDetectionJob.html)richiesta.

**Topics**
+ [Prima di iniziare](#detect-pii-before)
+ [Parametri di input](#async-pii-api-inputs)
+ [Metodi Async Job](#async-pii-api-lifecycle)
+ [Formato del file di output](#async-pii-api-outputs)
+ [Analisi asincrona utilizzando il AWS Command Line Interface](#async-pii-api-cli)

## Prima di iniziare
<a name="detect-pii-before"></a>

Prima di iniziare, assicurati di avere:
+ **Bucket di input e output**: identifica i bucket Amazon S3 che desideri utilizzare per file di input e file di output. I bucket devono trovarsi nella stessa regione dell'API che stai chiamando.
+ **Ruolo di servizio IAM**: è necessario disporre di un ruolo di servizio IAM con l'autorizzazione ad accedere ai bucket di input e output. Per ulteriori informazioni, consulta [Autorizzazioni basate sui ruoli necessarie per le operazioni asincrone](security_iam_id-based-policy-examples.md#auth-role-permissions).

## Parametri di input
<a name="async-pii-api-inputs"></a>

 Nella richiesta, includi i seguenti parametri obbligatori:
+ `InputDataConfig`— Fornite una [InputDataConfig](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_InputDataConfig.html)definizione per la richiesta, che include le proprietà di input per il lavoro. Per il `S3Uri` parametro, specifica la posizione in Amazon S3 dei documenti di input.
+ `OutputDataConfig`— Fornisci una [OutputDataConfig](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_OutputDataConfig.html)definizione per la tua richiesta, che include le proprietà di output per il lavoro. Per il `S3Uri` parametro, specifica la posizione Amazon S3 in cui Amazon Comprehend scrive i risultati della sua analisi.
+ `DataAccessRoleArn`— Fornisci l'Amazon Resource Name (ARN) di un AWS Identity and Access Management ruolo. Questo ruolo deve concedere ad Amazon Comprehend l'accesso in lettura ai dati di input e scrittura alla posizione di output in Amazon S3. Per ulteriori informazioni, consulta [Autorizzazioni basate sui ruoli necessarie per le operazioni asincrone](security_iam_id-based-policy-examples.md#auth-role-permissions).
+ `Mode`— Imposta questo parametro su. `ONLY_OFFSETS` Con questa impostazione, l'output fornisce gli offset di caratteri che individuano ogni entità PII nel testo di input. L'output include anche punteggi di confidenza e tipi di entità PII.
+ `LanguageCode`— Impostate questo parametro su `en` o`es`. Amazon Comprehend supporta il rilevamento delle informazioni PII in testo in inglese o spagnolo.

## Metodi Async Job
<a name="async-pii-api-lifecycle"></a>

`StartPiiEntitiesDetectionJob`Restituisce un ID del lavoro, in modo da poter monitorare l'avanzamento del lavoro e recuperare lo stato del lavoro una volta completato.

Per monitorare lo stato di avanzamento di un processo di analisi, fornite l'ID del lavoro all'[DescribePiiEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribePiiEntitiesDetectionJob.html)operazione. Il modulo di risposta `DescribePiiEntitiesDetectionJob` contiene il `JobStatus` campo con lo stato corrente del lavoro. Un lavoro di successo passa attraverso i seguenti stati: 

INVIATO -> IN\$1PROGRESS -> COMPLETATO. 

Al termine di un processo di analisi (`JobStatus`completato, non riuscito o interrotto), utilizzatelo `DescribePiiEntitiesDetectionJob` per ottenere la posizione dei risultati. Se lo stato del lavoro è`COMPLETED`, la risposta include un `OutputDataConfig` campo che contiene un campo con la posizione Amazon S3 del file di output.

Per ulteriori dettagli sui passaggi da seguire per l'analisi asincrona di Amazon Comprehend, consulta. [Elaborazione asincrona in batch](concepts-processing-modes.md#how-async)

## Formato del file di output
<a name="async-pii-api-outputs"></a>

 Il file di output utilizza il nome del file di input, con .out aggiunto alla fine. Contiene i risultati dell'analisi.

Di seguito è riportato un esempio di file di output di un processo di analisi che ha rilevato entità PII nei documenti. Il formato dell'input è un documento per riga. 

```
{
  "Entities": [
    {
      "Type": "NAME",
      "BeginOffset": 40,
      "EndOffset": 69,
      "Score": 0.999995
    },
    {
      "Type": "ADDRESS",
      "BeginOffset": 247,
      "EndOffset": 253,
      "Score": 0.998828
    },
    {
      "Type": "BANK_ACCOUNT_NUMBER",
      "BeginOffset": 406,
      "EndOffset": 411,
      "Score": 0.693283
    }
  ],
  "File": "doc.txt",
  "Line": 0
},
{
  "Entities": [
    {
      "Type": "SSN",
      "BeginOffset": 1114,
      "EndOffset": 1124,
      "Score": 0.999999
    },
    {
      "Type": "EMAIL",
      "BeginOffset": 3742,
      "EndOffset": 3775,
      "Score": 0.999993
    },
    {
      "Type": "PIN",
      "BeginOffset": 4098,
      "EndOffset": 4102,
      "Score": 0.999995
    }
  ],
  "File": "doc.txt",
  "Line": 1
 }
```

Di seguito è riportato un esempio di output di un'analisi in cui il formato dell'input è un documento per file.

```
{
  "Entities": [
    {
      "Type": "NAME",
      "BeginOffset": 40,
      "EndOffset": 69,
      "Score": 0.999995
    },
    {
      "Type": "ADDRESS",
      "BeginOffset": 247,
      "EndOffset": 253,
      "Score": 0.998828
    },
    {
      "Type": "BANK_ROUTING",
      "BeginOffset": 279,
      "EndOffset": 289,
      "Score": 0.999999
    }
  ],
  "File": "doc.txt"
}
```

## Analisi asincrona utilizzando il AWS Command Line Interface
<a name="async-pii-api-cli"></a>

L'esempio seguente utilizza l'`StartPiiEntitiesDetectionJob`operazione con. AWS CLI

L'esempio è formattato per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\$1) al termine di ogni riga con un accento circonflesso (^).

```
aws comprehend start-pii-entities-detection-job \
    --region region \
    --job-name job name \
    --cli-input-json file://path to JSON input file
```

Per il `cli-input-json` parametro si fornisce il percorso di un file JSON che contiene i dati della richiesta, come illustrato nell'esempio seguente.

```
{
  "InputDataConfig": {
      "S3Uri": "s3://input bucket/input path",
      "InputFormat": "ONE_DOC_PER_LINE"
  },
  "OutputDataConfig": {
      "S3Uri": "s3://output bucket/output path"
  },
  "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role"
  "LanguageCode": "en",
  "Mode": "ONLY_OFFSETS"     
}
```

Se la richiesta di avvio del processo di rilevamento degli eventi ha avuto esito positivo, riceverai una risposta simile alla seguente:

```
{
  "JobId": "5d2fbe6e...e2c"
  "JobArn":  "arn:aws:comprehend:us-west-2:123456789012:pii-entities-detection-job/5d2fbe6e...e2c" 
  "JobStatus": "SUBMITTED",   
}
```

È possibile utilizzare l'[DescribeEventsDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeEventsDetectionJob.html)operazione per ottenere lo stato di un lavoro esistente. Se la richiesta di avvio del processo di rilevamento degli eventi ha avuto esito positivo, riceverai una risposta simile alla seguente:

```
aws comprehend describe-pii-entities-detection-job \
    --region region \
    --job-id job ID
```

Quando il processo viene completato correttamente, riceverai una risposta simile alla seguente:

```
{
    "PiiEntitiesDetectionJobProperties": {
  "JobId": "5d2fbe6e...e2c"
  "JobArn":  "arn:aws:comprehend:us-west-2:123456789012:pii-entities-detection-job/5d2fbe6e...e2c" 
  "JobName": "piiCLItest3",
  "JobStatus": "COMPLETED",
  "SubmitTime": "2022-05-05T14:54:06.169000-07:00",
  "EndTime": "2022-05-05T15:00:17.007000-07:00",
  "InputDataConfig": {
       (identical to the input data that you provided with the request)
    }
}
```