Analyse asynchrone pour la modélisation de sujets - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Analyse asynchrone pour la modélisation de sujets

Pour déterminer les sujets d'un ensemble de documents, utilisez le StartTopicsDetectionJobpour démarrer une tâche asynchrone. Vous pouvez suivre des sujets dans des documents rédigés en anglais ou en espagnol.

Avant de commencer

Avant de commencer, assurez-vous que vous disposez des éléments suivants :

  • Compartiments d'entrée et de sortie : identifiez les compartiments Amazon S3 que vous souhaitez utiliser pour les entrées et les sorties. Les buckets doivent se trouver dans la même région que l'API que vous appelez.

  • Rôle de service IAM : vous devez disposer d'un rôle de service IAM autorisé à accéder à vos compartiments d'entrée et de sortie. Pour plus d’informations, consultez Autorisations basées sur les rôles requises pour les opérations asynchrones.

Utilisation de l AWS Command Line Interface

L'exemple suivant illustre l'utilisation de l'StartTopicsDetectionJobopération avec AWS CLI

L'exemple est mis en forme pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

Pour le cli-input-json paramètre, vous fournissez le chemin d'accès à un fichier JSON contenant les données de demande, comme illustré dans l'exemple suivant.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

Si la demande de démarrage de la tâche de détection de sujets aboutit, vous recevrez la réponse suivante :

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

Utilisez cette ListTopicsDetectionJobsopération pour afficher la liste des tâches de détection de sujets que vous avez soumises. La liste inclut des informations sur les emplacements d'entrée et de sortie que vous avez utilisés et sur l'état de chacune des tâches de détection. L'exemple est mis en forme pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

aws comprehend list-topics-detection-jobs \-- region

Vous obtiendrez un JSON similaire à ce qui suit en réponse :

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

Vous pouvez utiliser cette DescribeTopicsDetectionJobopération pour obtenir le statut d'une tâche existante. L'exemple est mis en forme pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

aws comprehend describe-topics-detection-job --job-id job ID

Vous obtiendrez le JSON suivant en réponse :

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

À l'aide du SDK pour Python ou AWS SDK for .NET

Pour obtenir des exemples de SDK expliquant comment démarrer une tâche de modélisation de rubriques, consultezÀ utiliser StartTopicsDetectionJob avec un AWS SDK ou CLI.