As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Análise assíncrona para modelagem de tópicos
Para determinar os tópicos em um conjunto de documentos, use o StartTopicsDetectionJobpara iniciar um trabalho assíncrono. Você pode monitorar tópicos em documentos escritos em inglês ou espanhol.
Antes de começar
Antes de começar, certifique-se de ter:
-
Buckets de entrada e saída— Identifique os buckets do Amazon S3 que você deseja usar para entrada e saída. Os buckets devem estar na mesma Região que a API que você está chamando.
-
Perfil de serviço do IAM: você deve ter um perfil de serviço do IAM com permissão para acessar seus buckets de entrada e saída. Para ter mais informações, consulte Permissões baseadas em perfis necessárias para operações assíncronas.
Usar a AWS Command Line Interface
O exemplo a seguir demonstra como usar a operação de StartTopicsDetectionJob
com o AWS CLI
O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
aws comprehend start-topics-detection-job \ --number-of-topics
topics to return
\ --job-name "job name
" \ --regionregion
\ --cli-input-json file://path to JSON input file
Para o parâmetro cli-input-json
, você fornece um caminho para um arquivo JSON que contém os dados da solicitação, conforme exibido no exemplo a seguir.
{ "InputDataConfig": { "S3Uri": "s3://
input bucket
/input path
", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket
/output path
" }, "DataAccessRoleArn": "arn:aws:iam::account ID
:role/data access role
" }
Se a solicitação para iniciar o trabalho de detecção de tópicos for bem-sucedida, você receberá a seguinte resposta:
{
"JobStatus": "SUBMITTED",
"JobId": "job ID
"
}
Use a ListTopicsDetectionJobsoperação para ver uma lista dos trabalhos de detecção de tópicos que você enviou. A lista inclui informações sobre os locais de entrada e saída que você usou, além do status de cada um dos trabalhos de detecção. O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
aws comprehend list-topics-detection-jobs \--
region
Em resposta, você verá um JSON semelhante a:
{
"TopicsDetectionJobPropertiesList": [
{
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "COMPLETED",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/output path
"
},
"EndTime": timestamp
},
{
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "RUNNING",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/output path
"
}
}
]
}
Você pode usar a DescribeTopicsDetectionJoboperação para obter o status de um trabalho existente. O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
aws comprehend describe-topics-detection-job --job-id
job ID
Em resposta, você verá o seguinte JSON:
{
"TopicsDetectionJobProperties": {
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "COMPLETED",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/ouput path
"
},
"EndTime": timestamp
}
}
Usar o SDK para Python ou AWS SDK for .NET
Para exemplos de SDK de como iniciar um trabalho de modelagem de tópicos, consulte Use StartTopicsDetectionJob com um AWS SDKou CLI.