(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210589668.9
(22)申请日 2022.05.26
(71)申请人 浙江工业大 学
地址 310014 浙江省杭州市拱 墅区潮王路
18号
(72)发明人 李永强 林栋 仇翔 冯远静
李文伟 赵永智 范陈强 吴毕亮
(74)专利代理 机构 浙江千克知识产权代理有限
公司 33246
专利代理师 赵芳
(51)Int.Cl.
G06F 16/36(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于重复历史事实的时序知识图谱案
件推理方法
(57)摘要
一种基于重复历史事实的时序知识图谱案
件推理方法, 包括以下步骤: 1)获取数据集中的
头实体, 关系, 尾实体, 时间戳; 2)随机初始化实
体、 关系和时间戳的嵌入, LSTM和神经网络的参
数; 3)利用头实体, 关系, 尾实体, 时间戳的嵌入,
更新LSTM中的参数和神经网络, 并通过历史词表
惩罚历史中未出现的事实, 具体过程如下所述。
4)根据得到的LS TM网络和神经网络, 该时间戳下
已知头实体和关系预测尾实体或已知尾实体和
关系预测头实体。 与现有技术相比, 本发明通过
二维卷积聚合嵌入特征, LSTM和神经网络训练带
有时间信息的特征, 利用历史词表 惩罚历史中未
出现的事实, 据此得到的时序知识图谱案件推理
比现有的方法效果更好。
权利要求书1页 说明书4页 附图1页
CN 115455190 A
2022.12.09
CN 115455190 A
1.一种基于历史事实的时序知识图谱案件推理方法, 其特征在于, 所述方法包括以下
步骤:
1)获取数据集中的头实体, 关系, 尾实体, 时间戳;
2)随机初始化实体、 关系和时间戳的嵌入, LSTM和 神经网络的参数;
3)利用头实体, 关系, 尾实体, 时间戳的嵌入, 更新LSTM中的参数和神经网络, 并通过历
史词表惩罚历史中未 出现的事实, 过程如下:
3.1)根据时序知识图谱中事实对应的时间戳的顺序, 将时序知识图谱已知事实中的头
实体, 关系, 尾实体, 时间戳的嵌入输入二维卷积, 公式如下:
Mτ=Conv2d(h,r, τ );
Mτ是τ 时间戳下 嵌入经过二维卷积提取特征后的特征向量, h,r, τ是实体、 关系和时间戳
的嵌入;
3.2)用二维卷积提取 特征后的特 征矩阵Mτ训练LSTM, 公式如下:
Eτ=LSTM(Mτ);
Eτ是τ 时间戳下 经过LSTM训练后的特 征向量;
3.3)用一层神经网络预测头实体或者尾实体, 公式如下:
Sτ=MLP(Eτ);
Sτ是神经网络预测的概 率;
3.4)使用 τ时间戳之前的历史事实生成历史词表, 将实体和关系查询历史词表中是否
存在过, 若未存在过, 做出惩罚;
Pτ=Sτ‑α *Hτ(h,r)*|Sτ|
Pτ是经过历史词表惩罚过的 的概率, Pτ是一个超参数, Hτ(h,r)是历史词表,
3.5)使用交叉熵计算损失函数, 公式如下:
Lτ(P,Q)是计算得 出的交叉熵损失函数, Qτ是真实的结果;
3.6)重复更新神经网络直到更新次数到 达最大迭代次数N或者5回合内MR R不在提升;
4)根据得到的LSTM网络和神经网络, 该时间戳下已知头实体和关系预测尾实体或已知
尾实体和关系预测头实体, 则执行3.1),3.2),3.3),得到Pτ, 并在Pτ中获取最大概率的pτ, 公
式如下:
pτ=argmax(Pτ)。权 利 要 求 书 1/1 页
2
CN 115455190 A
2一种基于重复历史事实的时序知识图谱案件推 理方法
技术领域
[0001]本发明属于人工智能领域, 具体是涉及一种基于重复历史事 实的时序知识图谱案
件推理方法。
背景技术
[0002]随着社会的不断发展,案件也变得越来越复杂, 但随着大数据对个人信息更全面
的搜集, 为了能够得到更完整的案件流程, 如身份证、 地点、 时间、 交通工具等, 这为时序知
识图谱案件推理提供充足的数据集。 目前主流的链接预测并不能很好的把重复历史事实信
息结合到预测中, 而案件往往呈现在重复地点使用同一交通工具犯罪, 利用好这些信息可
以大大提高知识图谱推理的准确 性。 本发明基于人工智能的发展, 提出 的一种基于重复历
史事实的时序知识图谱案件推理方法可以帮助推理案件, 从而减轻压力。
发明内容
[0003]为了克服现有技术的不足, 为了减轻压力, 本发明提出一种利用过去的四元组(头
实体, 关系, 尾实体, 时间戳)来训练LSTM和 神经网络帮助推理案件的方法。
[0004]本发明解决其 技术问题所采用的技 术方案是:
[0005]一种基于 重复历史事实的时序知识图谱案件推理方法, 包括以下步骤:
[0006]1)获取数据集中的头实体, 关系, 尾实体, 时间戳;
[0007]2)随机初始化实体、 关系和时间戳的嵌入, LSTM和 神经网络的参数;
[0008]3)利用头 实体, 关系, 尾实体, 时间戳的嵌入, 更新LSTM中的参数和神经 网络, 并通
过历史词表惩罚历史中未 出现的事实, 过程如下:
[0009]3.1)根据时序知识图谱中事实对应的时间戳的顺序, 将时序知识图谱已知事实中
的头实体, 关系, 尾实体, 时间戳的嵌入输入二维卷积, 公式如下:
[0010]Mτ=Conv2d(h,r, τ );
[0011]Mτ是τ时间戳下嵌入经过二维卷积提取特征后的特征向量, h,r, τ是实体、 关系和
时间戳的嵌入;
[0012]3.2)用二维卷积提取 特征后的特 征矩阵Mτ训练LSTM, 公式如下:
[0013]Eτ=LSTM(Mτ);
[0014]Eτ是τ 时间戳下 经过LSTM训练后的特 征向量;
[0015]3.3)用一层神经网络预测头实体或者尾实体, 公式如下:
[0016]Sτ=MLP(Eτ);
[0017]Sτ是神经网络预测的概 率;
[0018]3.4)使用 τ时间戳之前的历史事实生成历史词表, 将实体和关系查询历史词表中
是否存在过, 若未存在过, 做出惩罚;
[0019]Pτ=Sτ‑α *Hτ(h,r)*|Sτ|
[0020]Pτ是经过历史词表惩罚过的概 率, Pτ是一个超参数, Hτ(h,r)是历史词表。说 明 书 1/4 页
3
CN 115455190 A
3
专利 一种基于重复历史事实的时序知识图谱案件推理方法
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:54:37上传分享