Análise assíncrona para modelagem de tópicos - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Análise assíncrona para modelagem de tópicos

Para determinar os tópicos em um conjunto de documentos, use o StartTopicsDetectionJobpara iniciar um trabalho assíncrono. Você pode monitorar tópicos em documentos escritos em inglês ou espanhol.

Antes de começar

Antes de começar, certifique-se de ter:

  • Buckets de entrada e saída— Identifique os buckets do Amazon S3 que você deseja usar para entrada e saída. Os buckets devem estar na mesma Região que a API que você está chamando.

  • Perfil de serviço do IAM: você deve ter um perfil de serviço do IAM com permissão para acessar seus buckets de entrada e saída. Para ter mais informações, consulte Permissões baseadas em perfis necessárias para operações assíncronas.

Usar a AWS Command Line Interface

O exemplo a seguir demonstra como usar a operação de StartTopicsDetectionJob com o AWS CLI

O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

Para o parâmetro cli-input-json, você fornece um caminho para um arquivo JSON que contém os dados da solicitação, conforme exibido no exemplo a seguir.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

Se a solicitação para iniciar o trabalho de detecção de tópicos for bem-sucedida, você receberá a seguinte resposta:

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

Use a ListTopicsDetectionJobsoperação para ver uma lista dos trabalhos de detecção de tópicos que você enviou. A lista inclui informações sobre os locais de entrada e saída que você usou, além do status de cada um dos trabalhos de detecção. O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

aws comprehend list-topics-detection-jobs \-- region

Em resposta, você verá um JSON semelhante a:

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

Você pode usar a DescribeTopicsDetectionJoboperação para obter o status de um trabalho existente. O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).

aws comprehend describe-topics-detection-job --job-id job ID

Em resposta, você verá o seguinte JSON:

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

Usar o SDK para Python ou AWS SDK for .NET

Para exemplos de SDK de como iniciar um trabalho de modelagem de tópicos, consulte Use StartTopicsDetectionJob com um AWS SDKou CLI.