说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210552441.7 (22)申请日 2022.05.20 (71)申请人 东南大学 地址 210096 江苏省南京市玄武区四牌楼 2 号 (72)发明人 谭亦鸣 张欣宇 漆桂林  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 杜静静 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/04(2006.01) (54)发明名称 一种基于跨语言知识图谱的多跳推理问答 方法 (57)摘要 本发明公开了一种基于跨语言知识图谱的 多跳推理问答方法, 主要用于改进现有的智能问 答系统,使之能够在回答用户提出的问题时有效 融合和利用不同语 言的知识图谱中的信息。 本发 明关注传统问答方法在使用跨语言知识图谱时 依赖预先融合图谱导致的错误传递问题, 提出了 一种跨图谱推理方法, 并且进一步建立了一种迭 代框架, 用于联合多跳推理与实体对齐方法。 前 者使用multilingual ‑BERT对文本进行通用表 示, 使推理信息能够在不同语言的图谱间传递. 使用双向LSTM编码问题、 推理路径。 通过注意力 机制更新问题表示, 用于关系预测。 后者将前者 与实体对齐方法 组合,以输入问题为query, 从图 谱上生成多组候选路径,迭代的从中抽取伪对齐 标注增强 实体对齐方法, 从而提升问答 性能。 权利要求书2页 说明书9页 附图3页 CN 114780754 A 2022.07.22 CN 114780754 A 1.一种基于跨语言知识图谱的多跳推理问答方法, 其特 征在于, 该 方法包括以下步骤: 步骤1)多跳推理问答任务初始化; 步骤2)构建跨图谱推理模型; 步骤3)多跳推理 ‑实体对齐问答框架; 步骤4)迭代的伪实体对齐标注挖掘与对齐模型增强训练过程; 步骤5)基于序列相似性的路径排序。 2.根据权利要求1所述的基于跨语言知识图谱的多跳推理问答方法, 其特征在于, 步骤 1)多跳推理问答任务初始化, 具体如下: 首先确定目标问题类型, 针对目标问题收集自然语言 问题及其对应查询标注构 成的样 本集O, 对样本集合进行拆分, 依据标注样本包含的关系数量, 将原始样本拆分为多个一跳 推理子样本, 替换O中的原 始样本L。 3.根据权利要求1所述的基于跨语言知识图谱的多跳推理问答方法, 其特征在于, 步骤 2)构建跨图谱推理模型, 具体如下: 跨图谱推理模型为基于预训练文本编码器的深度学习 模型, 由自然语言问题, 跨语言图谱上的历史推理路径以及主实体为输入, 分为以下三个部 分: 2‑1)基于multilingual  BERT+Bi‑LSTM的问题编码, 输入的自然语言问题首先经过多 语言预训练的语言模型m ‑BERT进行编码, 得到问题中每个token的编码向量, 而后通过Bi ‑ LSTM对问题整句进行编码, 得到带有序列位置信息的问题编码向量; 2‑2)基于跨图谱历史推理信息的问题向量更新, 输入的历史推理路径由multilingual   BERT编码成为历史推理信息向量, 而后通过一个注意力层, 问题编码向量中与历史推理路 径相关的信息被提取, 并用于更新问题编码向量, 得到与当前推理相关的问题向量表示; 2‑3)关系预测, 主 实体由multilingual  BERT编码成为主 实体向量, 与更新的问题向量 组合为目标 “实体‑关系”特征向量, 与知识图谱中的候选 “实体‑关系”向量做余弦相似度计 算, 并获取相似度最高的候选, 得到当前推理预测的关系。 4.根据权利要求1所述的基于跨语言知识图谱的多跳推理问答方法, 其特征在于, 步骤 3)迭代的多跳推理 ‑实体对齐问答框架, 该框架由候选推理路径 生成模块, 多跳推理问答模 块, 实体对齐模块, 伪对齐判别模块四个部分构成, 具体工作过程包括如下: 3‑1)候选推理路径生成模块, 基于实体链接和关系识别的结果, 依据多跳推理路径的 长度, 穷举其在跨语言知识图谱间所有可能的推理路径方向, 3‑2)多跳推理问答模块, 训练 阶段, 利用训练集L训练更新模型参数, 迭代阶段, 将训练 集L视作查询, 依据穷举的推理路径方向从跨语言KG中挖掘潜在的对齐路径或对齐路径片 段, 3‑3)实体对齐模块, 训练阶段, 利用知识图谱提供的seedalignments获取初始实体对齐 模型, 迭代阶段, 首先与推理模型联合挖掘对齐路径, 而后利用多跳推理问答模块挖掘出的 潜在对齐补充到se edalignments中, 训练并更新对齐模型的参数, 3‑4)伪对齐判别模块, 利用seedalignments训练的一个二分类器, 用于判断和筛选潜 在对齐路径中对应节点的伪对齐实体。 5.根据权利要求1所述的基于跨语言知识图谱的多跳推理问答方法, 其特征在于, 步骤 4)迭代的伪实体对齐标注挖掘与对齐模型增强训练过程, 具体如下: 4‑1)多跳推理 ‑实体对齐问答框架初始化, 使用训练集L训练多跳推理问答模型, 使用权 利 要 求 书 1/2 页 2 CN 114780754 A 2跨语言知识图谱提供的seedalignments训练实体对齐模型和伪对齐判别模 型, 得到初始化 框架, 4‑2)伪对齐实体挖掘, 遍历训练集样 本L, 对于L中的每个问题, 通过多跳推理模型+实 体对齐模型从跨语言图谱中挖掘对齐路径或者路径片段, 利用伪对齐判别模块从对齐路径 中筛选伪对齐实体, 4‑3)模型更新, 将伪对齐实体补充如se edalignments, 更新实体对齐模型, 4‑4)迭代终止条件, 当不再有新的伪对齐 被发现, 迭代终止 。 6.根据权利要求1所述的基于跨语言知识图谱的多跳推理问答方法, 其特征在于, 步骤 5)基于序列相似性的路径排序, 具体如下: 5‑1)完成迭代增 强过程后进入测试阶段, 对于输入的测试问题样本, 首先由候选推理 路径生成模块 生成多跳候选推理路径方向, 5‑2)多跳问答模型与实体对齐模型联合完成各方向上路径的推理, 得到多条候选答案 路径, 5‑3)通过multi lingual BERT对候选答案路径编码得到候选路径向量, 5‑4)通过候选路径向量与输入问题向量之间的余弦相似排序, 得到最终的答案路径, 完成问答测试。权 利 要 求 书 2/2 页 3 CN 114780754 A 3

.PDF文档 专利 一种基于跨语言知识图谱的多跳推理问答方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于跨语言知识图谱的多跳推理问答方法 第 1 页 专利 一种基于跨语言知识图谱的多跳推理问答方法 第 2 页 专利 一种基于跨语言知识图谱的多跳推理问答方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。