(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210664662.3
(22)申请日 2022.06.13
(71)申请人 徐泽宽
地址 210000 江苏省南京市广州路3 00号江
苏省人民医院普外科
申请人 南京瀚柏网络科技有限公司
(72)发明人 徐泽宽 骆冰清 夏彬
(74)专利代理 机构 南京瑞华腾知识产权代理事
务所(普通 合伙) 32368
专利代理师 徐冲冲
(51)Int.Cl.
G16H 50/20(2018.01)
G16H 10/60(2018.01)
G06N 3/08(2006.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06F 16/36(2019.01)
(54)发明名称
一种病例异常检测方法及设备
(57)摘要
本发明公开了一种病例异常检测方法及设
备。 该方法包括基于症状提取模 型从病例中提取
症状集合, 并将症状集合中的症状识别成症状实
体及其对应的症 状状态, 对每一症状实体和症状
状态进行文本情感分析获得正异常倾向结果; 对
症状相关的体检报告的各项指标进行异常检测,
以获得每一症状的异常检测结果; 判断正异常倾
向结果与异常检测结果是否一致; 基于判别模型
获得体检报告的各项指标的判别结果, 判断判别
结果与诊断结果是否一致。 若正异常倾向结果与
异常检测结果不一致或判别结果与诊断结果不
一致, 则输出检测结果为病例异常, 否则输出检
测结果为病例正常。 本发明为针对不同病种误诊
情况的异常检测奠定理论和技 术基础。
权利要求书3页 说明书9页 附图8页
CN 115019958 A
2022.09.06
CN 115019958 A
1.一种病例异常检测方法, 其特 征在于, 包括:
基于症状提取模型从病例中提取医生给出的症状集合, 所述症状集合包括若干症状,
并将所述症状识别成症状实体及其对应的症状 状态;
对每一症状实体的症状状态分别进行文本情感分析, 以获得每一症状实体的正异常倾
向结果;
基于异常检测模型对体检报告的各项指标进行异常检测, 以获得每一症状的异常检测
结果;
判断每一症状实体的正异常倾向结果与异常检测结果是否一 致;
基于判别模型对体 检报告的各项指标进行判别, 以获得判别结果;
判断所述判别结果与病例中的诊断结果是否一 致;
若任一症状实体的正异常倾向结果与异常检测结果不一致或所述判别结果与病例中
的诊断结果 不一致, 则输出检测结果 为病例异常, 否则输出检测结果 为病例正常。
2.根据权利要求1所述的病例异常检测方法, 其特征在于, 还基于异常检测模型从每一
症状实体获得支持度最高的可解释性序列;
将所述支持度最高的可解释性序列与利用专家知识预先构建的知识图谱进行对比, 以
判断所述支持度最高的可解释性序列与知识图谱是否一致, 如不一致, 则重构异常检测模
型, 并重新对每一症状实体进行异常检测。
3.根据权利要求2所述的病例异常检测方法, 其特征在于, 若所述支持度最高的可解释
性序列与知识图谱一致, 且经专家证实确认该症状实体的最佳可解释性序列可靠, 对所述
知识图谱进行知识融合。
4.根据权利要求2所述的病例异常检测方法, 其特征在于, 所述支持度最高的可解释性
序列的获取 方式如下:
导入单个病例样本经由随机森林模型预测为异常的决策树路径集合pathsab, 其中,
pathsab=[path0,path1,……pathm], 每条路径pat hx来自随机森林中不同的决策树, 0≤x≤
m, m为大于1的自然数;
对pathsab的特征使用FP ‑Growth算法挖掘频繁项集fre_items, 所述频繁项集fre_
items包括支持度support、 具体项itemsets、 长度length等信息, 得到可解释性序列的雏
形;
将fre_items按指定优先级排序, 使用sh ap对该样本进行预测, 获得各特征featurey的
特征重要性, y为特征的序号, 过滤掉fre_items中的不含有最重要特征的子集, 然后根据 异
常路径间强弱联系更新fre_items中各特征值范围, 再使用频繁模式下的PrefixSpan算法
从该病例样本中抽取频繁子序列fre_subseqs, 并对比fre_subseqs和fre_items中的特征,
若无共同特征, 则fre_items保持原序; 否则, 按照fre_ subseqs中特征的顺序遍历找出两者
间的共同特征放入新建的sort_index列表中, 若sort_index长度为1, 则fre_items保持原
序; 否则, 根据sor t_index调整fre_item s中各特征顺序。
5.根据权利要求4所述的病例异常检测方法, 其特征在于, 根据异常路径间强弱联系更
新fre_item s中各特征值范围具体包括:
对排名靠前的若干fre_item s分别进行初始化;
判断每一fre_items是否在相应的路径中, 若不在, 则直接过滤此路径, 若在, 则判断该权 利 要 求 书 1/3 页
2
CN 115019958 A
2fre_items中的特征是否在相应的路径中出现多次, 若是, 则将此路径中该特征的不同值取
交集作为该特征 的特征范围, 否则, 将初始化后的特征范围与上一次得到的特征范围取并
集, 若该过程产生冲突, 则直接过 滤此路径。
6.根据权利要求1所述的病例异常检测方法, 其特征在于, 对每一症状实体的症状状态
分别进行文本情感分析 具体包括:
根据每一症状实体的症状 状态定义两个态度极性的词列表;
识别每一症状实体的每 个症状状态的态度极性;
计算每一症状实体的所有症状状态两种态度极性出现的次数, 若积极词出现次数大于
消极词出现次数, 则判断该症状实体的正异常倾向结果为正常, 否则, 判断该症状实体的正
异常倾向结果 为异常。
7.一种病例异常检测设备, 其特 征在于, 包括:
提取模块, 用以基于症状提取模型从病例中提取医生给出的症状集合, 所述症状集合
包括若干症状, 并将所述症状识别成症状实体及其对应的症状 状态;
情感分析模块, 用以对每一症状实体的症状状态分别进行文本情感分析, 以获得每一
症状实体的正异常倾向结果;
异常检测模块, 用以基于异常检测模型对体检报告的各项指标进行异常检测, 以获得
每一指标的异常检测结果;
第一比对 模块, 用以判断每一症状实体的正异常倾向结果与异常检测结果是否一 致;
判别模块, 用以基于判别模型对体 检报告的各项指标进行判别, 以获得判别结果;
第二比对 模块, 用以判断所述判别结果与病例中的诊断结果是否一 致;
输出模块, 用以在任一症状实体的正异常倾向结果与异常检测结果不一致或所述判别
结果与病例中的诊断结果不一致时, 输出检测结果为病例异常, 否则输出检测结果为病例
正常。
8.根据权利要求7所述的病例异常检测设备, 其特征在于, 所述异常检测模块还用以基
于异常检测模型从每一症状实体获得支持度最高的可解释性序列;
还包括第三比对模块, 用以将所述支持度最高的可解释性序列与利用专家知识预先构
建的知识图谱进行对比, 以判断所述支持度最高的可解释性序列与知识图谱是否一致, 如
不一致, 则触发重构异常检测模型, 并重新对每一症状实体进行异常检测。
9.根据权利要求8所述的病例异常检测设备, 其特征在于, 若所述支持度最高的可解释
性序列与知识图谱一致, 且经专家证实确认该症状实体的最佳可解释性序列可靠, 则触发
对所述知识图谱进行知识融合。
10.根据权利要求8所述的病例异常检测设备, 其特征在于, 所述支持度最高的可解释
性序列的获取 方式如下:
导入单个病例样本经由随机森林模型预测为异常的决策树路径集合pathsab, 其中,
pathsab=[path0,path1,……pathm], 每条路径pat hx来自随机森林中不同的决策树, 0≤x≤
m, m为大于1的自然数;
对pathsab的特征使用FP ‑Growth算法挖掘频繁项集fre_items, 所述频繁项集fre_
items包括支持度support、 具体项itemsets、 长度length等信息, 得到可解释性序列的雏
形;权 利 要 求 书 2/3 页
3
CN 115019958 A
3
专利 一种病例异常检测方法及设备
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:55:44上传分享