本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Comprehend Medical 工作原理
Amazon Comprehend Medical 使用预训练的自然语言处理 (NLP) 模型,通过实体检测来分析非结构化临床文本。实体是指对医疗信息的文本引用,例如医学状况、药物或受保护的健康信息 (PHI)。有些操作可以更进一步,检测实体,然后将这些实体与标准化本体关联起来。该模型在大量医学文本上持续训练,因此您无需提供训练数据。所有结果都包括置信度分数,该分数表明 Amazon Comprehend Medical 对检测到的实体的准确性的信心。
实体检测和本体关联既可以作为同步操作执行,也可以作为异步操作执行:
-
同步操作:支持对单个文档进行分析,从而将分析结果直接返回到您的应用程序。当您创建一次处理一个文档的交互式应用程序时,请使用单文档操作。
-
异步操作:支持对存储在 Amazon S3 桶中的文档集合或批次进行分析。分析结果将返回在 S3 桶中。
注意
Amazon Comprehend Medical 只能分析英语 (US-EN) 文本。
同步实体检测
DetectEntitiesV2 和 DetectPHI 操作可检测单个文档中非结构化临床文本中的实体。您向 Amazon Comprehend Medical 服务发送文档,并在回复中收到分析结果。
异步批量分析
StartEntitiesDetectionV2Job 和 StartPHIDetectionJob 操作启动异步作业,检测对医疗信息(例如,医学状况、治疗、检查和结果)或存储在 Amazon S3 桶中的受保护健康信息的引用。检测作业的输出将写入单独的 Amazon S3 桶,用于进一步处理或下游分析。
StartICD10CMInferenceJob 和 StartRxNormInferenceJob 操作启动本体关联批量操作,这将检测实体并将这些实体关联到 RxNorm 和 ICD-10-CM 知识库中的标准化代码。
本体关联
InferICD10CM、InferSNOMEDCT 和 InferRxNorm 操作可检测潜在的医学状况和药物,并将它们分别与 ICD-10-CM、SNOMED CT 或 rxNorm 知识库中的代码关联起来。您可以使用本体关联批量分析来分析一组文档或单个大型文档。通过使用控制台或本体关联批处理 API,您可以执行操作,以启动、停止、列出和描述正在进行的批量分析作业。
关联到 ICD-10-CM 医学状况知识库中的概念
InferICD10CM 操作可检测潜在的医学状况,并将其与 2019 年版的《国际疾病分类 – 第 10 次修订 – 临床修订版 (ICD-10-CM)》中的代码关联起来。对于检测到的每种潜在医学状况,Amazon Comprehend Medical 都会列出匹配的 ICD-10-CM 代码和描述。结果中列出的医学状况包括置信度分数,该分数表明 Amazon Comprehend Medical 对实体与结果中的概念匹配准确性的信心程度。
关联到 RxNorm 药物知识库中的概念
InferRxNorm 操作将病历中列出的药物识别为实体。它将实体与美国国家医学图书馆 RxNorm 数据库中的概念标识符 (rxCUI) 关联起来。每个 RxCUI 都是独一无二的,具有不同的强度和剂量形式。结果中列出的药物包括置信度分数,该分数表明 Amazon Comprehend Medical 对实体与 RxNorm 知识库中的概念匹配准确性的信心程度。Amazon Comprehend Medical 根据置信度分数按降序列出可能与其检测到的每种药物相匹配的排名靠前的 RxCUI。
关联到 SNOMED CT 医学概念知识库中的概念
InferSNOMEDCT 操作将可能的医学概念识别为实体,并将其与 2021 年 3 月版本的《医学系统术语表 (SNOMED CT)》中的代码关联起来。SNOMED CT 提供了全面的医学概念词汇,包括医学状况和解剖学,以及医学检查、治疗和手术。对于每个匹配的概念 ID,Amazon Comprehend Medical 会返回排名前五的医学概念,每个概念都有置信度分数和情境信息,例如相关特征和属性。然后,可以将 SNOMED CT 概念 ID 与 SNOMED CT 多层次结构结合使用,用来构造患者临床数据,从而用于医学编码、报告或临床分析。