(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210553972.8
(22)申请日 2022.05.20
(71)申请人 武汉众智数字技 术有限公司
地址 430074 湖北省武汉市东湖新 技术开
发区珞喻路546号
(72)发明人 杨玲 贺珊 张龙涛 杨光
(74)专利代理 机构 北京汇泽知识产权代理有限
公司 11228
专利代理师 吴静
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06F 40/295(2020.01)
G06K 9/62(2022.01)G06N 5/02(2006.01)
(54)发明名称
一种基于知识图谱的案件处 理方法和系统
(57)摘要
本发明提供了一种基于知识图谱的案件处
理方法, 通过简要案情数据, 案件时间和空间范
围内的多源数据, 构建案件知识图谱, 过滤案件
知识图谱中孤立案件相关的节 点和关系, 根据案
件间路径的条数, 标识不同案件的串并关系, 挖
掘案件的直接和间接目标人员, 实现案件线索的
有效汇总, 进一步地提高了案件的解决效率。 本
发明还公开了一种基于知识 图谱的案件处理系
统。
权利要求书2页 说明书6页 附图2页
CN 114925167 A
2022.08.19
CN 114925167 A
1.一种基于知识图谱的案件处 理方法, 其特 征在于, 包括:
S100.获取待分析的案件数据, 在案件时间和空间范围内采集多源数据;
S200.对案件数据中简要案情采用命名实体方法进行识别, 抽取案件中直接相关的实
体和关系, 对多源数据预处 理, 对重要案件特 征进行离 散化处理;
S300.自顶向下构 建案件图谱的模式层, 导入案件和多源数据, 构建加权有向的案件知
识图谱;
S400.对案件知识图谱进行独立群体检测, 计算所有的连通体id及其节点, 去除连通体
id中案件节点个数小于2的所有节点和关系集 合, 过滤图谱中孤立案件相关的节点和关系;
S500.计算任意两个不同案件顶点的双向路径, 判断相同的案件起点和 终点的路径个
数, 根据路径个数对案件进行分析。
2.如权利要求1所述的一种基于知识图谱的案件处理方法, 其特征在于, S100中, 在案
件时间和空间范围内采集的多源数据, 至少 包括: 车辆卡口数据, wifi终端虚拟身份数据,
人脸数据, 通讯数据, 转账记录数据, 人员数据。
3.如权利要求1所述的一种基于知识图谱的案件处理方法, 其特征在于, S200中, 对案
件数据中简要案情采用命名实体方法进行识别, 抽取案件中直接相关的实体和关系具体包
括: 对于案件 数据中没有案件人员身份证号, 案件工具, 案件 金额, 案件时间信息, 通过预训
练的命名实体识别模型, 对案件的简要案情进行实体识别, 抽取案件相关的案件关联人身
份证号, 案件工具, 案件金额, 案件发生时间, 补充案件数据, 确保案件存在直接相关的人员
信息。
4.如权利要求1所述的一种基于知识图谱的案件处理方法, 其特征在于, S200中, 对多
源数据预 处理, 对重要案件 特征进行离散化处理, 具体包括: 根据案件关联人身份号分组统
计车辆经过次数、 mac终端采集次数、 人脸采集次数、 通话次数、 转账次数, 对分组统计后的
多源数据归一化处理, 将数据映射到[0,1]之间, 标记为图谱关系的权重值, 避免由于量纲
不同引起的误差 。
5.如权利要求1所述的一种基于知识图谱的案件处理方法, 其特征在于, S300中, 构建
加权有向的案件知识图谱的方法包括: 将案件数据和多源数据组成的图数据作为案件知识
图谱的数据层, 用数据加载工具将预处理后的结构化数据加载到案件图谱对应的实体、 关
系和属性数据, 其中多源数据归一化后的数据值作为图谱关系的权重值, 构成加权有向的
案件知识图谱。
6.如权利要求1所述的一种基于知识图谱的案件处理方法, 其特征在于, S400中, 对案
件知识图谱进行独立群体检测, 使用ConnectedComponent算法求解图中的连通体, 求解连
通体id中案件节点个数小于2的所有节点和关系集合, 在图谱中去除该节点、 关系集合, 过
滤图谱中孤立案件相关的节点和关系。
7.如权利要求1所述的一种基于知识图谱的案件处理方法, 其特征在于, S500中, 判断
相同的案件起点和终点的路径个数, 根据路径个数对案件进 行分析, 具体包括: 遍历计算任
意两个不同案件顶点的双向路径, 若路径条数为0, 表明案件间不存在关联关系; 若路径条
数为1, 表明案件存在 串并关系, 具有共同嫌 疑人, 可标识 为串并案; 若路径条数大于1, 表明
案件是团伙作案, 利用堆优化的Dijkstra算法求解最短路径, 最短路径上的人员节点是案
件的直接涉案人员, 作为案件的直接目标对 象, 除去最短路径外其他的人员节点为间接的权 利 要 求 书 1/2 页
2
CN 114925167 A
2目标对象。
8.一种基于知识图谱的案件处理系统, 其特征在于, 包括: 数据采集模块、 数据预处理
模块、 案件图谱构造模块、 图谱顶点和关系过 滤模块和图谱分析模块; 其中:
数据采集模块, 用于获取案件原 始数据、 案件发生的时间、 空间范围内的多源数据;
数据预处 理模块, 用于抽取案件相关的实体、 关系, 作为案件图谱的数据来源;
案件图谱构造模块, 用于构造 案件图谱的模式层和数据层;
图谱顶点、 关系过滤模块, 用于过滤图谱中与待分析案件无关的顶点、 关系数据; 图谱
分析模块, 用于根据不同案件的路径分析案件的串并关系, 确定不同案件的共同涉嫌涉案
人员。
9.如权利要求8所述的一种基于知识图谱的案件处理系统, 其特征在于, 数据 预处理模
块, 包括: 案件名实体识别单 元和多源数据处 理单元; 其中:
案件名实体识别单元, 对于案件数据中没有案件人员身份证号, 案件工具, 案件金额,
案件时间信息, 用预训练的命名实体识别模型抽取案件中直接相关的实体信息、 关系信息,
用于补充案件直接相关的数据;
多源数据处理单元, 用于对多源数据进行分组统计, 由于采集的数据来源不同, 对出现
的频次的关系需要进行归一化, 将数据映射到[0,1], 标记为图谱关系的权重值, 避免由于
量纲不同引起的误差 。
10.如权利要求8所述的一种基于知识图谱的案件处理系统, 其特征在于, 案件图谱构
造模块, 包括:
图谱模式层构建单元, 用于根据案件的性质特征, 对案件的不同知识要素进行归纳组
织, 其中, 图谱 模式数据来源自顶向下抽象出来;
图谱数据层构建单元, 用于按照模式层的定义, 将数据预处理模块后的数据, 导入案件
图谱, 构建图谱数据层; 其中, 数据层是模式层所定义关系的实例, 可 具体化表示模式层。权 利 要 求 书 2/2 页
3
CN 114925167 A
3
专利 一种基于知识图谱的案件处理方法和系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:54:02上传分享