Analisi asincrona per la modellazione degli argomenti - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Analisi asincrona per la modellazione degli argomenti

Per determinare gli argomenti in un set di documenti, utilizzate StartTopicsDetectionJobper avviare un processo asincrono. È possibile monitorare gli argomenti nei documenti scritti in inglese o spagnolo.

Prima di iniziare

Prima di iniziare, assicurati di avere:

  • Bucket di input e output: identifica i bucket Amazon S3 che desideri utilizzare per input e output. I bucket devono trovarsi nella stessa regione dell'API che stai chiamando.

  • Ruolo di servizio IAM: è necessario disporre di un ruolo di servizio IAM con l'autorizzazione ad accedere ai bucket di input e output. Per ulteriori informazioni, consulta Autorizzazioni basate sui ruoli necessarie per le operazioni asincrone.

Utilizzo di AWS Command Line Interface

L'esempio seguente dimostra l'utilizzo dell'StartTopicsDetectionJoboperazione con AWS CLI

L'esempio è formattato per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

Per il cli-input-json parametro fornite il percorso di un file JSON che contiene i dati della richiesta, come illustrato nell'esempio seguente.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

Se la richiesta di avvio del processo di rilevamento degli argomenti ha avuto esito positivo, riceverai la seguente risposta:

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

Utilizza l'ListTopicsDetectionJobsoperazione per visualizzare un elenco dei lavori di rilevamento degli argomenti che hai inviato. L'elenco include informazioni sulle posizioni di input e output utilizzate e sullo stato di ciascun processo di rilevamento. L'esempio è formattato per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).

aws comprehend list-topics-detection-jobs \-- region

In risposta otterrete un codice JSON simile al seguente:

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

È possibile utilizzare l'DescribeTopicsDetectionJoboperazione per ottenere lo stato di un lavoro esistente. L'esempio è formattato per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).

aws comprehend describe-topics-detection-job --job-id job ID

In risposta riceverai il seguente codice JSON:

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

Usare l'SDK per Python o AWS SDK for .NET

Per esempi SDK su come avviare un lavoro di modellazione di argomenti, consulta. Utilizzare StartTopicsDetectionJob con un AWS SDKo CLI