Ontologi yang menghubungkan analisis batch - Amazon Comprehend Medical

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Ontologi yang menghubungkan analisis batch

Gunakan Amazon Comprehend Medical untuk mendeteksi entitas dalam teks klinis yang disimpan dalam bucket Amazon Simple Storage Service (Amazon S3) Simple Storage Service (Amazon S3) dan untuk menautkan entitas tersebut ke ontologi standar. Anda dapat menggunakan ontologi yang menghubungkan analisis batch untuk menganalisis koleksi dokumen atau dokumen tunggal dengan hingga 20.000 karakter. Dengan menggunakan konsol atau ontologi yang menautkan operasi API batch, Anda dapat melakukan operasi untuk memulai, menghentikan, membuat daftar, dan menjelaskan pekerjaan analisis batch yang sedang berlangsung.

Untuk informasi harga untuk analisis batch dan operasi Amazon Comprehend Medical lainnya, lihat Amazon Comprehend Medical Pricing.

Melakukan analisis batch

Anda dapat menjalankan pekerjaan analisis batch menggunakan konsol Amazon Comprehend Medical atau operasi API batch Amazon Comprehend Medical.

Melakukan analisis batch menggunakan operasi API

Prasyarat

Saat Anda menggunakan Amazon Comprehend Medical API, buat kebijakan AWS Identity Access and Management (IAM) dan lampirkan ke peran IAM. Untuk mempelajari lebih lanjut tentang peran IAM dan kebijakan kepercayaan, lihat Kebijakan dan Izin IAM.

  1. Unggah data Anda ke dalam bucket S3.

  2. Untuk memulai pekerjaan analisis baru, gunakan StarticD10CM, InferenceJobStartsNomeDCT InferenceJob, atau operasi. StartRxNormInferenceJob Berikan nama bucket Amazon S3 yang berisi file input dan nama bucket Amazon S3 tempat Anda ingin mengirim file output.

  3. Pantau kemajuan pekerjaan dengan menggunakan DescribeICD10CM, DescribesNoMEDCT InferenceJob, atau operasi. InferenceJob DescribeRxNormInferenceJob Selain itu, Anda dapat menggunakan ListicD10cm InferenceJobs, ListsNomeDCT InferenceJobs, dan ListRxNormInferenceJobsuntuk melihat status semua ontologi yang menghubungkan pekerjaan analisis batch.

  4. Jika Anda perlu menghentikan pekerjaan yang sedang berlangsung, gunakan stopicd10cm, InferenceJobstopsnomedCT InferenceJob, atau untuk menghentikan analisis. StopRxNormInferenceJob

  5. Untuk melihat hasil pekerjaan analisis Anda, lihat bucket S3 keluaran yang Anda konfigurasikan saat memulai pekerjaan.

Melakukan analisis batch menggunakan konsol

  1. Unggah data Anda ke dalam bucket S3.

  2. Untuk memulai pekerjaan analisis baru, pilih jenis analisis yang akan Anda lakukan. Kemudian, berikan nama bucket S3 yang berisi file input dan nama bucket S3 tempat Anda ingin mengirim file output.

  3. Pantau status pekerjaan Anda saat sedang berlangsung. Dari konsol, Anda dapat melihat semua operasi analisis batch dan statusnya, termasuk kapan analisis dimulai dan berakhir.

  4. Untuk melihat hasil pekerjaan analisis Anda, lihat bucket keluaran S3 yang Anda konfigurasikan saat memulai pekerjaan.

Kebijakan IAM untuk operasi batch

Peran IAM yang memanggil operasi API batch Amazon Comprehend Medical harus memiliki kebijakan yang memberikan akses ke bucket S3 yang berisi file input dan output. Peran IAM juga harus diberi hubungan kepercayaan sehingga layanan Amazon Comprehend Medical dapat mengambil peran tersebut. Untuk mempelajari lebih lanjut tentang peran IAM dan kebijakan kepercayaan, lihat Peran IAM.

Peran harus memiliki kebijakan berikut:

{ "Version": "2012-10-17", "Statement": [ { "Action": [ "s3:GetObject" ], "Resource": [ "arn:aws:s3:::input-bucket/*" ], "Effect": "Allow" }, { "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::input-bucket", "arn:aws:s3:::output-bucket", ], "Effect": "Allow" }, { "Action": [ "s3:PutObject" ], "Resource": [ " arn:aws:s3:::output-bucket/*" ], "Effect": "Allow" } ] }

Peran tersebut harus memiliki hubungan kepercayaan berikut. Disarankan agar Anda menggunakan kunci aws:SourceAccount dan aws:SourceArn kondisi untuk mencegah masalah keamanan wakil yang membingungkan. Untuk mempelajari lebih lanjut tentang masalah wakil yang bingung dan cara melindungi AWS akun Anda, lihat Masalah wakil yang bingung dalam dokumentasi IAM.

{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Principal":{ "Service":[ "comprehendmedical.amazonaws.com" ] }, "Action":"sts:AssumeRole", "Condition": { "StringEquals": { "aws:SourceAccount": "account_id" }, "ArnLike": { "aws:SourceArn": "arn:aws:comprehendmedical:region:account_id:*" } } } ] }

File keluaran analisis Batch

Amazon Comprehend Medical membuat satu file output untuk setiap file input dalam batch. File memiliki ekstensi.out. Amazon Comprehend Medical pertama-tama membuat direktori di bucket output S3 menggunakan AwsAccountIdJobType- JobId- sebagai namanya, dan kemudian menulis semua file output untuk batch ke direktori ini. Amazon Comprehend Medical membuat direktori baru ini sehingga output dari satu pekerjaan tidak menimpa output dari pekerjaan lain.

Operasi batch menghasilkan output yang sama dengan operasi sinkron.

Setiap operasi batch menghasilkan tiga file manifes berikut yang berisi informasi tentang pekerjaan:

  • Manifest— Meringkas pekerjaan. Memberikan informasi tentang parameter yang digunakan untuk pekerjaan, ukuran total pekerjaan, dan jumlah file yang diproses.

  • Success— Memberikan informasi tentang file yang berhasil diproses. Termasuk nama file input dan output dan ukuran file input.

  • Unprocessed— Daftar file yang pekerjaan batch tidak diproses dengan kode kesalahan dan pesan kesalahan per file.

Amazon Comprehend Medical menulis file ke direktori output yang Anda tentukan untuk pekerjaan batch. File manifes ringkasan akan ditulis ke folder output, bersama dengan folder berjudulManifest_AccountId-Operation-JobId. Di dalam folder manifes adalah success folder, yang berisi manifes sukses, dan failed folder, yang berisi manifes file yang belum diproses. Bagian berikut menunjukkan struktur file manifes.

File manifes Batch

Berikut ini adalah struktur JSON dari file manifes batch.

{"Summary" : {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", "JobType" : "ICD10CMInference | RxNormInference | SNOMEDCTInference", "InputDataConfiguration" : { "Bucket" : "input bucket", "Path" : "path to files/account ID-job type-job ID" }, "OutputDataConfiguration" : { "Bucket" : "output bucket", "Path" : "path to files" }, "InputFileCount" : number of files in input bucket, "TotalMeteredCharacters" : total characters processed from all files, "UnprocessedFilesCount" : number of files not processed, "SuccessFilesCount" : total number of files processed, "TotalDurationSeconds" : time required for processing, "SuccessfulFilesListLocation" : "path to file", "UnprocessedFilesListLocation" : "path to file", "FailedJobErrorMessage": "error message or if not applicable, The status of the job is completed" } }

File manifes sukses

Berikut ini adalah struktur JSON dari file yang berisi informasi tentang file yang berhasil diproses.

{ "Files": [{ "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }, { "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }] }

File manifes yang belum diproses

Berikut ini adalah struktur JSON dari file manifes yang berisi informasi tentang file yang belum diproses.

{ "Files" : [ { "Input": "file_name_that_failed", "ErrorCode": "error code for exception", "ErrorMessage": "explanation of the error code and suggestions" }, { ...} ] }