说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210589668.9 (22)申请日 2022.05.26 (71)申请人 浙江工业大 学 地址 310014 浙江省杭州市拱 墅区潮王路 18号 (72)发明人 李永强 林栋 仇翔 冯远静  李文伟 赵永智 范陈强 吴毕亮  (74)专利代理 机构 浙江千克知识产权代理有限 公司 33246 专利代理师 赵芳 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于重复历史事实的时序知识图谱案 件推理方法 (57)摘要 一种基于重复历史事实的时序知识图谱案 件推理方法, 包括以下步骤: 1)获取数据集中的 头实体, 关系, 尾实体, 时间戳; 2)随机初始化实 体、 关系和时间戳的嵌入, LSTM和神经网络的参 数; 3)利用头实体, 关系, 尾实体, 时间戳的嵌入, 更新LSTM中的参数和神经网络, 并通过历史词表 惩罚历史中未出现的事实, 具体过程如下所述。 4)根据得到的LS TM网络和神经网络, 该时间戳下 已知头实体和关系预测尾实体或已知尾实体和 关系预测头实体。 与现有技术相比, 本发明通过 二维卷积聚合嵌入特征, LSTM和神经网络训练带 有时间信息的特征, 利用历史词表 惩罚历史中未 出现的事实, 据此得到的时序知识图谱案件推理 比现有的方法效果更好。 权利要求书1页 说明书4页 附图1页 CN 115455190 A 2022.12.09 CN 115455190 A 1.一种基于历史事实的时序知识图谱案件推理方法, 其特征在于, 所述方法包括以下 步骤: 1)获取数据集中的头实体, 关系, 尾实体, 时间戳; 2)随机初始化实体、 关系和时间戳的嵌入, LSTM和 神经网络的参数; 3)利用头实体, 关系, 尾实体, 时间戳的嵌入, 更新LSTM中的参数和神经网络, 并通过历 史词表惩罚历史中未 出现的事实, 过程如下: 3.1)根据时序知识图谱中事实对应的时间戳的顺序, 将时序知识图谱已知事实中的头 实体, 关系, 尾实体, 时间戳的嵌入输入二维卷积, 公式如下: Mτ=Conv2d(h,r, τ ); Mτ是τ 时间戳下 嵌入经过二维卷积提取特征后的特征向量, h,r, τ是实体、 关系和时间戳 的嵌入; 3.2)用二维卷积提取 特征后的特 征矩阵Mτ训练LSTM, 公式如下: Eτ=LSTM(Mτ); Eτ是τ 时间戳下 经过LSTM训练后的特 征向量; 3.3)用一层神经网络预测头实体或者尾实体, 公式如下: Sτ=MLP(Eτ); Sτ是神经网络预测的概 率; 3.4)使用 τ时间戳之前的历史事实生成历史词表, 将实体和关系查询历史词表中是否 存在过, 若未存在过, 做出惩罚; Pτ=Sτ‑α *Hτ(h,r)*|Sτ| Pτ是经过历史词表惩罚过的 的概率, Pτ是一个超参数, Hτ(h,r)是历史词表, 3.5)使用交叉熵计算损失函数, 公式如下: Lτ(P,Q)是计算得 出的交叉熵损失函数, Qτ是真实的结果; 3.6)重复更新神经网络直到更新次数到 达最大迭代次数N或者5回合内MR R不在提升; 4)根据得到的LSTM网络和神经网络, 该时间戳下已知头实体和关系预测尾实体或已知 尾实体和关系预测头实体, 则执行3.1),3.2),3.3),得到Pτ, 并在Pτ中获取最大概率的pτ, 公 式如下: pτ=argmax(Pτ)。权 利 要 求 书 1/1 页 2 CN 115455190 A 2一种基于重复历史事实的时序知识图谱案件推 理方法 技术领域 [0001]本发明属于人工智能领域, 具体是涉及一种基于重复历史事 实的时序知识图谱案 件推理方法。 背景技术 [0002]随着社会的不断发展,案件也变得越来越复杂, 但随着大数据对个人信息更全面 的搜集, 为了能够得到更完整的案件流程, 如身份证、 地点、 时间、 交通工具等, 这为时序知 识图谱案件推理提供充足的数据集。 目前主流的链接预测并不能很好的把重复历史事实信 息结合到预测中, 而案件往往呈现在重复地点使用同一交通工具犯罪, 利用好这些信息可 以大大提高知识图谱推理的准确 性。 本发明基于人工智能的发展, 提出 的一种基于重复历 史事实的时序知识图谱案件推理方法可以帮助推理案件, 从而减轻压力。 发明内容 [0003]为了克服现有技术的不足, 为了减轻压力, 本发明提出一种利用过去的四元组(头 实体, 关系, 尾实体, 时间戳)来训练LSTM和 神经网络帮助推理案件的方法。 [0004]本发明解决其 技术问题所采用的技 术方案是: [0005]一种基于 重复历史事实的时序知识图谱案件推理方法, 包括以下步骤: [0006]1)获取数据集中的头实体, 关系, 尾实体, 时间戳; [0007]2)随机初始化实体、 关系和时间戳的嵌入, LSTM和 神经网络的参数; [0008]3)利用头 实体, 关系, 尾实体, 时间戳的嵌入, 更新LSTM中的参数和神经 网络, 并通 过历史词表惩罚历史中未 出现的事实, 过程如下: [0009]3.1)根据时序知识图谱中事实对应的时间戳的顺序, 将时序知识图谱已知事实中 的头实体, 关系, 尾实体, 时间戳的嵌入输入二维卷积, 公式如下: [0010]Mτ=Conv2d(h,r, τ ); [0011]Mτ是τ时间戳下嵌入经过二维卷积提取特征后的特征向量, h,r, τ是实体、 关系和 时间戳的嵌入; [0012]3.2)用二维卷积提取 特征后的特 征矩阵Mτ训练LSTM, 公式如下: [0013]Eτ=LSTM(Mτ); [0014]Eτ是τ 时间戳下 经过LSTM训练后的特 征向量; [0015]3.3)用一层神经网络预测头实体或者尾实体, 公式如下: [0016]Sτ=MLP(Eτ); [0017]Sτ是神经网络预测的概 率; [0018]3.4)使用 τ时间戳之前的历史事实生成历史词表, 将实体和关系查询历史词表中 是否存在过, 若未存在过, 做出惩罚; [0019]Pτ=Sτ‑α *Hτ(h,r)*|Sτ| [0020]Pτ是经过历史词表惩罚过的概 率, Pτ是一个超参数, Hτ(h,r)是历史词表。说 明 书 1/4 页 3 CN 115455190 A 3

.PDF文档 专利 一种基于重复历史事实的时序知识图谱案件推理方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于重复历史事实的时序知识图谱案件推理方法 第 1 页 专利 一种基于重复历史事实的时序知识图谱案件推理方法 第 2 页 专利 一种基于重复历史事实的时序知识图谱案件推理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。