Ontologie liant l'analyse par lots - Amazon Comprehend Medical

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ontologie liant l'analyse par lots

Utilisez Amazon Comprehend Medical pour détecter des entités dans un texte clinique stocké dans un bucket Amazon Simple Storage Service (Amazon S3) et pour relier ces entités à des ontologies standardisées. Vous pouvez utiliser une ontologie liant l'analyse par lots pour analyser une collection de documents ou un seul document contenant jusqu'à 20 000 caractères. À l'aide de la console ou de l'ontologie liant les opérations d'API par lots, vous pouvez effectuer des opérations pour démarrer, arrêter, répertorier et décrire les tâches d'analyse par lots en cours.

Pour obtenir des informations sur les tarifs relatifs à l'analyse des lots et aux autres opérations d'Amazon Comprehend Medical, consultez Amazon Comprehend Medical Pricing.

Réalisation d'une analyse par lots

Vous pouvez exécuter une tâche d'analyse par lots à l'aide de la console Amazon Comprehend Medical ou des opérations de l'API par lots Amazon Comprehend Medical.

Exécution d'une analyse par lots à l'aide des opérations de l'API

Prérequis

Lorsque vous utilisez l'API Amazon Comprehend Medical, créez une politique AWS Identity Access and Management (IAM) et associez-la à un rôle IAM. Pour en savoir plus sur les rôles IAM et les politiques de confiance, consultez Politiques et autorisations IAM.

  1. Téléchargez vos données dans un compartiment S3.

  2. Pour démarrer une nouvelle tâche d'analyse, utilisez le StarticD10cm, le InferenceJobStartsNoMedCT InferenceJob ou les opérations. StartRxNormInferenceJob Indiquez le nom du compartiment Amazon S3 qui contient les fichiers d'entrée et le nom du compartiment Amazon S3 dans lequel vous souhaitez envoyer les fichiers de sortie.

  3. Surveillez la progression de la tâche à l'aide de DescribeICD10cmInferenceJob, DescribesNoMedCT ou des opérations. InferenceJob DescribeRxNormInferenceJob En outre, vous pouvez utiliser ListicD10cm InferenceJobs, ListsNoMedCT et ListRxNormInferenceJobspour voir l'état de toutes les InferenceJobs ontologies liant les tâches d'analyse par lots.

  4. Si vous devez arrêter une tâche en cours, utilisez StopicD10cmInferenceJob, StopsNoMedCT ou pour arrêter InferenceJob l'analyse. StopRxNormInferenceJob

  5. Pour consulter les résultats de votre tâche d'analyse, consultez le compartiment S3 de sortie que vous avez configuré lorsque vous avez démarré la tâche.

Exécution d'une analyse par lots à l'aide de la console

  1. Téléchargez vos données dans un compartiment S3.

  2. Pour démarrer une nouvelle tâche d'analyse, sélectionnez le type d'analyse que vous allez effectuer. Indiquez ensuite le nom du compartiment S3 contenant les fichiers d'entrée et le nom du compartiment S3 dans lequel vous souhaitez envoyer les fichiers de sortie.

  3. Surveillez le statut de votre travail pendant qu'il est en cours. Depuis la console, vous pouvez consulter toutes les opérations d'analyse par lots et leur statut, y compris les dates de début et de fin de l'analyse.

  4. Pour consulter les résultats de votre tâche d'analyse, consultez le compartiment S3 de sortie que vous avez configuré lorsque vous avez démarré la tâche.

Politiques IAM pour les opérations par lots

Le rôle IAM qui appelle les opérations de l'API par lots Amazon Comprehend Medical doit disposer d'une politique autorisant l'accès aux compartiments S3 contenant les fichiers d'entrée et de sortie. Une relation de confiance doit également être attribuée au rôle IAM afin que le service Amazon Comprehend Medical puisse assumer ce rôle. Pour en savoir plus sur les rôles IAM et les politiques de confiance, consultez la section Rôles IAM.

Le rôle doit respecter la politique suivante :

{ "Version": "2012-10-17", "Statement": [ { "Action": [ "s3:GetObject" ], "Resource": [ "arn:aws:s3:::input-bucket/*" ], "Effect": "Allow" }, { "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::input-bucket", "arn:aws:s3:::output-bucket", ], "Effect": "Allow" }, { "Action": [ "s3:PutObject" ], "Resource": [ " arn:aws:s3:::output-bucket/*" ], "Effect": "Allow" } ] }

Le rôle doit avoir la relation de confiance suivante. Il est recommandé d'utiliser les touches de aws:SourceArn condition aws:SourceAccount et pour éviter tout problème de sécurité secondaire confus. Pour en savoir plus sur le problème des députés confus et sur la manière de protéger votre AWS compte, consultez la section Le problème des adjoints confus dans la documentation IAM.

{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Principal":{ "Service":[ "comprehendmedical.amazonaws.com" ] }, "Action":"sts:AssumeRole", "Condition": { "StringEquals": { "aws:SourceAccount": "account_id" }, "ArnLike": { "aws:SourceArn": "arn:aws:comprehendmedical:region:account_id:*" } } } ] }

Fichiers de sortie d'analyse par lots

Amazon Comprehend Medical crée un fichier de sortie pour chaque fichier d'entrée du lot. Le fichier possède l'extension.out. Amazon Comprehend Medical crée d'abord un répertoire dans le compartiment S3 de sortie en utilisant AwsAccountIdle nom JobTypeJobId- -, puis écrit tous les fichiers de sortie du lot dans ce répertoire. Amazon Comprehend Medical crée ce nouveau répertoire afin que le résultat d'une tâche ne remplace pas le résultat d'une autre tâche.

Une opération par lots produit le même résultat qu'une opération synchrone.

Chaque opération par lots produit les trois fichiers manifestes suivants qui contiennent des informations sur la tâche :

  • Manifest— Résume le travail. Fournit des informations sur les paramètres utilisés pour la tâche, la taille totale de la tâche et le nombre de fichiers traités.

  • Success— Fournit des informations sur les fichiers traités avec succès. Inclut le nom du fichier d'entrée et de sortie ainsi que la taille du fichier d'entrée.

  • Unprocessed— Répertorie les fichiers que le traitement par lots n'a pas traités avec les codes d'erreur et les messages d'erreur par fichier.

Amazon Comprehend Medical écrit les fichiers dans le répertoire de sortie que vous avez spécifié pour le traitement par lots. Le fichier manifeste récapitulatif sera écrit dans le dossier de sortie, avec un dossier intituléManifest_AccountId-Operation-JobId. Dans le dossier manifeste se trouvent le success dossier, qui contient le manifeste de réussite, et le failed dossier, qui contient le manifeste du fichier non traité. Les sections suivantes présentent la structure des fichiers manifestes.

Fichier manifeste Batch

Voici la structure JSON du fichier manifeste par lots.

{"Summary" : {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", "JobType" : "ICD10CMInference | RxNormInference | SNOMEDCTInference", "InputDataConfiguration" : { "Bucket" : "input bucket", "Path" : "path to files/account ID-job type-job ID" }, "OutputDataConfiguration" : { "Bucket" : "output bucket", "Path" : "path to files" }, "InputFileCount" : number of files in input bucket, "TotalMeteredCharacters" : total characters processed from all files, "UnprocessedFilesCount" : number of files not processed, "SuccessFilesCount" : total number of files processed, "TotalDurationSeconds" : time required for processing, "SuccessfulFilesListLocation" : "path to file", "UnprocessedFilesListLocation" : "path to file", "FailedJobErrorMessage": "error message or if not applicable, The status of the job is completed" } }

Fichier manifeste de réussite

Voici la structure JSON du fichier qui contient des informations sur les fichiers traités avec succès.

{ "Files": [{ "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }, { "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }] }

Fichier manifeste non traité

Voici la structure JSON du fichier manifeste qui contient des informations sur les fichiers non traités.

{ "Files" : [ { "Input": "file_name_that_failed", "ErrorCode": "error code for exception", "ErrorMessage": "explanation of the error code and suggestions" }, { ...} ] }