说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221082319 2.0 (22)申请日 2022.07.12 (71)申请人 南京云创大 数据科技股份有限公司 地址 210000 江苏省南京市秦淮区永智路6 号南京白下高新技术产业园区四号楼 A栋9层 (72)发明人 刘鹏 张真 高中强 左成婷  张堃  (74)专利代理 机构 南京中盟科创知识产权代理 事务所 (特殊普通合伙) 32279 专利代理师 孙丽君 (51)Int.Cl. G16H 50/20(2018.01) G16H 70/00(2018.01)G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/242(2020.01) G06F 40/295(2020.01) (54)发明名称 一种基于知识图谱的病状初步诊断及治疗 方法 (57)摘要 本发明公开了一种基于知识图谱的病状初 步诊断及治疗方法, 该方法包括以下步骤: S1、 采 集电子病历构建病历数据集, 进行分词处理, 并 分析判断疾病或病状的别名; S2、 分别基于命名 实体识别模型及实体关系抽取模型对处理后的 电子病历数据集中的数据进行实体及实体关系 标注; S3、 构建RDF格式的实体与关系标注数据 集, 并利用实体与关系标注数据集构建基于疾病 诊断的知识图谱; S4、 基于疾病症状的纯度及疾 病信息熵对疾病病状进行初步诊断, 并利用基于 疾病诊断的知识 图谱结合协同推荐算法得到推 荐初步治疗 方案。 不仅可以实现疾病病状的初步 诊断, 而且还可以为患者推荐初步治疗方案, 同 时可以有效地 提高推荐 治疗方案的准确率。 权利要求书3页 说明书7页 附图1页 CN 115083599 A 2022.09.20 CN 115083599 A 1.一种基于知识图谱的病状初步诊断及治疗方法, 其特 征在于, 该 方法包括以下步骤: S1、 采集电子病历构建病历数据集, 基于词典的分词算法对病历数据集中的字段进行 分词处理, 并分析判断疾病或病状的别名; S2、 分别基于命名实体识别模型及实体关系抽取模型对处理后的电子病历数据集中的 数据进行实体及实体关系标注; S3、 构建RDF格式的实体与关系标注数据集, 并利用实体与关系标注数据集构 建基于疾 病诊断的知识图谱; S4、 基于疾病症状的纯度及疾病信息熵对疾病病状进行初步诊断, 并利用基于疾病诊 断的知识图谱结合协同推荐算法得到推荐初步治疗方案 。 2.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述S1中采集电子病历构建病历数据集, 基于词典的分词算法对病历数据集中的字段进 行 分词处理之前还 包括以下步骤: 利用数据处理模块对病历数据集中的病历数据进行清洗与预处理, 进行病历分词、 剔 除空数据、 无效数据、 剔除无情感意 义的文字和重复数据。 3.根据权利要求2所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述基于词典的分词算法对病历数据集中的字段进行分词处 理包括以下步骤: 按照预定的策略将预先建立的分词词典中所有词语与病历数据集中的字段逐一进行 匹配, 识别出字段中包 含的属于分词 词典的词语, 并将识别到的词语作为有用信息返回。 4.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述S2中分别基于命名实体识别模型及实体关系抽取模型对处理后的电子病历数据集中 的数据进行实体及实体关系标注包括以下步骤: S21、 将分词 处理后的病历数据集按照预设比例分为人工病历标注数据集和自动病历 标注数据集; S22、 医学专家利用专业知识对人工病历标注数据集中的数据进行实体及实体关系标 注; S23、 将标注后的人工病历标注数据集中的病历数据输入预先构建的命名实体识别模 型及实体关系抽取模型进行训练; S24、 将自动病历标注数据逐个输入训练好的命名实体识别模型及实体关系抽取模型 进行实体识别及实体与实体关系的自动标注。 5.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述实体包括症状、 疾病、 部位、 药品、 科室及人群基本实体信息, 所述 实体关系包括部位症 状关系、 部位疾病关系、 症状疾病关系、 疾病科室关系、 药品疾病关系、 药品症状关系及药品 人群关系。 6.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述基于疾病诊断的知识图谱由6个实体及7个实体关系构成, 采用有向图G表示, 其中G= (V, E), 式中, V={v1,v2,…,vn}表示一组指向不同实体的顶点, E为一组边, 表示实体之间不 同类型的关系。 7.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述S4中基于疾病症状的纯度及 疾病信息熵对疾病病状进 行初步诊断, 并利用基于疾病诊权 利 要 求 书 1/3 页 2 CN 115083599 A 2断的知识图谱结合协同推荐算法得到推荐初步治疗方案包括以下步骤: S41、 计算知识图谱中每个症状的纯度P及该症状相关疾病的疾病信息熵S, 并基于该纯 度P及疾病信息熵S分析 得到病状; S42、 利用基于疾病诊断的知识图谱结合协同推荐算法得到推荐初步治疗方案 。 8.根据权利要求7所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述S41中计算知识图谱中每个症状的纯度P及该症状相关疾病的疾病信息熵S, 并基于该 纯度P及疾病信息熵S分析 得到病状包括以下步骤: S411、 计算知识图谱中每个症状的纯度P, 并选取纯度最大的症状计算该症状相关疾病 的疾病信息熵S, 其中, 所述纯度P的公式计算如下: 所述疾病信息熵S的计算公式如下: 式中, N表示疾病的个数, Vi表示与症状或症状组合相关联疾病量化关系的数值, N2表示 与症状或症状组合相关联的疾病个数的平方, Vi’表示症状或症状组合与某个疾病的量化 关系数值, Vi”表示所有与该疾病相关联症状的量 化关系数值; S412、 判断疾病信息熵S是否大于预设阈值或者为最后一个症状, 若是则选择疾病信息 熵S最大的疾病保存, 并在原有所有疾病列表删除该疾病, 重复上述步骤, 迭代N次结束, 获 得N个疾病, 最后通过疾病对于输入的所有症状计算疾病信息熵实现排序, 并依据排序结果 分析得到初步病状。 9.根据权利要求1所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在于, 所述S42中利用基于疾病诊断的知识图谱结合协同推荐算法得到推荐初步治疗方案包括以 下步骤: S421、 获取患者的病状信息, 并利用基于疾病诊断的知识图谱分析得到第一推荐治疗 方案; S422、 利用协同推荐算法为患者推荐与之病状信息相似的治疗方案, 得到第二推荐治 疗方案; S423、 结合第一推荐 治疗方案及第二推荐 治疗方案分析 得到推荐初步治疗方案 。 10.根据权利要求9所述的一种基于知识图谱的病状初步诊断及治疗方法, 其特征在 于, 所述S422中利用协同推荐算法为患者推荐与之病状信息相 似的治疗方案, 得到第二推 荐治疗方案包括以下步骤: S4221、 获取患者的症状信息数据, 并计算病历数据集中与患者症状信息数据的相似 度, 其中, 相似度的计算公式如下: 权 利 要 求 书 2/3 页 3 CN 115083599 A 3

.PDF文档 专利 一种基于知识图谱的病状初步诊断及治疗方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的病状初步诊断及治疗方法 第 1 页 专利 一种基于知识图谱的病状初步诊断及治疗方法 第 2 页 专利 一种基于知识图谱的病状初步诊断及治疗方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。