(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111492115.3
(22)申请日 2021.12.08
(71)申请人 河南大学
地址 475001 河南省开封市顺河区明伦街
85号
(72)发明人 郭小丁 张磊 皂菲菲
(74)专利代理 机构 郑州大通专利商标代理有限
公司 41111
代理人 高为宝
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/36(2019.01)
G06Q 10/04(2012.01)
G06Q 50/18(2012.01)
(54)发明名称
一种基于形式概念分析的罪名预测方法和
系统
(57)摘要
本发明提供一种基于形式概念分析的罪名
预测方法和系统。 该方法包括: 步骤1: 基于自然
语言处理技术对既有案件裁判文书及相关法律
法规进行处理, 得到既有案件裁判文书及相关法
律法规中的犯罪行为及罪名; 步骤2: 将既有案件
裁判文书及相关法律法规中的犯罪行为及罪名
处理为形式背景, 并采用形式概念分析方法对所
述形式背景进行处理, 生 成一系列含有犯罪行为
与罪名相对应的值依赖蕴含式; 步骤3: 基于自然
语言处理技术对待预测案件进行处理, 得到所述
待预测案件中所包含的犯罪行为, 将所述待预测
案件中犯罪行为与一系列所述值依赖蕴含式进
行匹配, 得到所述待预测案件中犯罪行为所对应
的罪名。
权利要求书3页 说明书7页 附图1页
CN 114138939 A
2022.03.04
CN 114138939 A
1.一种基于形式概念分析的罪名预测方法, 其特 征在于, 包括:
步骤1: 基于自然语言处理技术对既有案件裁判 文书及相关法律法规进行处理, 得到既
有案件裁判文 书及相关法律法规中的犯罪行为及罪名;
步骤2: 将既有案件裁判 文书及相关法律法规中的犯罪行为及罪名处理为形式背景, 并
采用形式概念分析方法对所述形式背 景进行处理, 生成一系列含有犯罪行为与罪名相对应
的值依赖蕴含式;
步骤3: 基于自然语言处理技术对待预测案件进行处理, 得到所述待预测案件中所包含
的犯罪行为, 将所述待预测案件中犯罪行为与一系列所述值依赖蕴含式进行匹配, 得到所
述待预测案件中犯罪行为所对应的罪名。
2.根据权利要求1所述的一种基于形式概念分析的罪名预测方法, 其特征在于, 步骤2
中, 所述将既有案件裁判文书及相关法律法规中的犯罪行为及罪名处理为形式背景, 具体
包括:
步骤A1: 将犯罪行为及罪名 作为形式背景中的属性, 将每个 既有案件判决文书或相关
法律法规作为形式背景中的一个对象;
步骤A2: 对于每个对象, 若该对象含有对应的属性, 则将该对象和该属性的交叉单元格
标记为1, 否则标记为0, 直至标记完所有对象, 得到一个只包含0、 1、 对象、 属性的表格, 该表
格即为形式背景。
3.根据权利要求1所述的一种基于形式概念分析的罪名预测方法, 其特征在于, 步骤2
中, 所述采用形式概念分析方法对所述形式背景进行处理, 生成一系列含有犯罪行为与罪
名相对应的值依赖蕴含式, 具体包括:
步骤B1: 提取 形式背景中的所有属性, 并按照字典序的顺序对所有属性进行排序;
步骤B2: 针对字典序中的每个属性集合, 按照字典序从小到大的顺序依次验证B →f (g
(B) ) -B是否成立, 其中B为字典序中的属性集合; 若B →f (g (B) ) -B成立, 则继续判断B是否
等于f (g (B) ) , 若B等于f (g (B) ) , 则将B加入到概念内涵集合中; 若B不等于f (g (B) ) , 则将B →
f (g (B) ) -B加入到值依赖蕴含式集 合中;
步骤B3: 在按照步骤B2处理完字典序中所有的属性集合之后, 对所述值依赖蕴含式集
合中的所有值依赖蕴含式进行筛选, 所述筛选条件为: 将值依赖前键包含有 决策属性或者
值依赖后键包 含有条件属性的值依赖蕴含式进行删除;
步骤B4: 针对筛选后的所有值依赖蕴含式, 将值依赖蕴含式中的属性与罪名和/或犯罪
行为进行对应, 即得到一系列犯罪行为与罪名相对应的值依赖蕴含式。
4.根据权利要求3所述的一种基于形式概念分析的罪名预测方法, 其特征在于, 步骤B1
中, 所述按照字典序的顺序对所有属性进行排序, 具体包括:
步骤B11: 定义属性之间的大小顺序, 具体为: 若将所有犯罪行为分别采用a1、 a2、
a3...an1表示, 将所有罪名分别采用b1、 b2、 b3...bn2表示, 则定义所有属性的大小顺序为: a1
<a2<a3<...<an1<b1<b2<b3<...<bn2;
步骤B12: 定义属性集合之间的大小顺序, 具体为: 设定所有属性的集合G={a1,a2,
a3...an1, b1,b2,b3...bn2}, 存在属性集合A ⊆G和属性集合B ⊆G, 属性集合A和B中的元素均
按照步骤B11的定义进行排序, 若A与B中从左开始的第一个不等元素中A的较大, B的较小,
则定义A<B;权 利 要 求 书 1/3 页
2
CN 114138939 A
2步骤B13: 将所有属性集合按照步骤B12中的定义进行排序, 得到的从小到大的顺序即
为字典序; 其中, 每个属性集合均不相同, 且满足在各自的属性集合中顺序为从小到大的顺
序。
5.一种基于形式概念分析的罪名预测系统, 其特 征在于, 包括:
文本处理模块, 用于基于自然语言处理技术对既有案件裁判 文书及相关法律法规进行
处理, 得到既有案件裁判文 书及相关法律法规中的犯罪行为及罪名;
数据分析模块, 用于将既有案件裁判 文书及相关法律法规中的犯罪行为及罪名处理为
形式背景, 并采用形式概念分析方法对所述形式背景进行处理, 生成一系列含有犯罪行为
与罪名相对应的值依赖蕴含式;
罪名预测模块, 用于基于自然语言处理技术对待预测案件进行处理, 得到所述待预测
案件中所包含的犯罪行为, 将所述待 预测案件中犯罪行为与一系列所述值依赖蕴含式进 行
匹配, 得到所述待预测案件中犯罪行为所对应的罪名。
6.根据权利要求5所述的一种基于形式概念分析的罪名预测系统, 其特征在于, 所述数
据分析模块, 包括属性和对象提取 单元和形式背景生成单 元;
所述属性和对象提取单元, 用于将犯罪行为及罪名作为形式背景中的属性, 将每个既
有案件判决文 书或相关法律法规作为形式背景中的一个对象;
所述形式背景生成单元, 用于对于每个对象, 在该对象含有对应的属性 时, 将该对象和
该属性的交叉单元格标记为1, 否则标记为0, 直至标记完所有对象, 得到一个只包含0、 1、 对
象、 属性的表格, 将该表格作为形式背景。
7.根据权利要求5所述的一种基于形式概念分析的罪名预测系统, 其特征在于, 所述数
据分析模块, 包括属性 排序单元、 属性验证单 元、 筛选单元和值依赖蕴含式生成单 元;
属性排序单元, 用于提取形式背景中的所有属性, 并按照字典序的顺序对所有属性进
行排序;
属性验证单元, 用于针对字典序中的每个属性集合, 按照字典序从小到大的顺序依次
验证B→f (g (B) ) -B是否成立, 其中B为字典序中的属性集合; 若B →f (g (B) ) -B 成立, 则继
续判断B是否等于f (g (B) ) , 若B等于 f (g (B) ) , 则将B加入到概念内涵集合中; 若B不等于 f (g
(B) ) , 则将B →f (g (B) ) -B加入到值依赖蕴含式集 合中;
筛选单元, 用于在属性验证单元处理完字典序中所有的属性集合之后, 对其得到的所
述值依赖蕴含式集合中的所有值依赖蕴含式进行筛选, 所述筛选条件为: 将值依赖前键包
含有决策属性或者 值依赖后键包 含有条件属性的值依赖蕴含式进行删除;
值依赖蕴含式生成单元, 用于针对筛选后的所有值依赖蕴含式, 将值依赖蕴含式中的
属性与罪名和/或犯罪行为进行对应, 得到一系列犯罪行为与罪名相对应的值依赖蕴含式。
8.根据权利要求7所述的一种基于形式概念分析的罪名预测系统, 其特征在于, 所述属
性排序单元, 具体用于:
定义属性之 间的大小顺序, 具体为: 若将所有犯罪行为分别采用a1、 a2、 a3...an1表示, 将
所有罪名分别采用b1、 b2、 b3...bn2表示, 则定义所有属性的大小顺序为: a1<a2<a3<...<
an1<b1<b2<b3<...<bn2;
定义属性集合之间的大小顺序, 具体为: 设定所有属性的集合G={a1,a2,a3...an1, b1,
b2,b3...bn2}, 存在属性集合A ⊆G和属性集合B ⊆G, 属性集合A和B中的元素均按照步骤B11权 利 要 求 书 2/3 页
3
CN 114138939 A
3
专利 一种基于形式概念分析的罪名预测方法和系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:41:35上传分享