说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210739427.8 (22)申请日 2022.06.28 (71)申请人 中国电子科技 集团公司第十 研究所 地址 610000 四川省成 都市金牛区茶店子 东街48号 (72)发明人 陈莹 崔莹 代翔 黄刘 刘鑫  李春豹 雋兆波 何健军 杨露  (74)专利代理 机构 成都九鼎天元知识产权代理 有限公司 51214 专利代理师 王会改 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 一种基于知识图谱的多跳问答方法及装置 (57)摘要 本发明公开了一种基于知识图谱的多跳问 答方法及装置, 该方法包括: 泛化问题实体名称; 基于泛化后的问题实体以及知识图谱, 识别问题 关系; 基于泛化后的问题实体和识别出的问题关 系, 得到多跳问答的答案。 本发明通过泛化问题 实体和问题关系提升了知识 图谱问答的泛化能 力, 为知识图谱多跳问答提供了一种新的问答策 略。 权利要求书2页 说明书6页 附图4页 CN 115146042 A 2022.10.04 CN 115146042 A 1.一种基于知识图谱的多跳问答方法, 其特 征在于, 包括: 步骤1: 泛化问题实体名称; 步骤2: 基于泛化后的问题实体以及 知识图谱, 识别问题关系; 步骤3: 基于泛化后的问题实体和识别出的问题关系, 得到多跳问答的答案 。 2.根据权利要求1所述的方法, 其特 征在于, 所述 步骤1包括: 识别问题实体后, 利用问题实体在ES数据库中进行相似检索, 将相似值最高的名称替 换问题实体名称, 从而实现问题实体名称泛化。 3.根据权利要求2所述的方法, 其特征在于, 所述识识别问题实体后, 利用问题实体名 称在ES数据库中进行相似检索, 将相似值最高的名称替换问题实体名称, 从而实现问题实 体名称泛化, 包括: 步骤11: 创建ES数据库和相关字段, 用于存 储知识图谱中节点信息; 步骤12: 从知识图谱数据库中将所有节点的名称和节点 ID导入ES数据库中; 步骤13: 输入问题文本; 步骤14: 利用实体识别模型识别出问题实体; 步骤15: 将问题实体 基于ES数据库进行相似检索; 步骤16: 返回相似节点名称列表、 节点ID列表和相似分数列表, 并基于相似分数按照由 大到小排序; 步骤17: 取最大相似分数对应的图谱节点名称作为问题实体。 4.根据权利要求3所述的方法, 其特征在于, 所述节点的名称包括节点的完整名称、 术 语名称、 简称、 缩写、 别名; 所述节点 ID是每个节点在图谱库中的唯一标识。 5.根据权利要求1所述的方法, 其特 征在于, 所述 步骤2包括; 步骤21: 定义并初始化实体列表、 问题关系边列表; 步骤22: 将问题实体泛化后的结果添加至实体列表中; 步骤23: 基于知识图谱以问题实体为中心点, 查询三元组的尾节点, 并将尾节点添加至 实体列表中; 步骤24: 重复执 行步骤23, 直至问题关系列表不再新增, 最终返回问题关系列表。 6.根据权利要求5所述的方法, 其特 征在于, 所述 步骤23包括: 步骤231: 在知识图谱库中以实体列表中最新添加的节点为中心点, 检索出所有相关三 元组, 存为 三元组列表; 步骤232: 遍历三元组列表中每条关系边; 步骤233: 利用基于BERT的语义相似模型将关系边与问题做相似匹配, 返回关系边与相 似匹配分数; 步骤234: 设定相似阈值, 若相似匹配分数大于相似阈值, 将对应关系边添加至问题关 系列表中; 步骤235: 若相似匹配分数小于相似阈值, 则重复执 行步骤232至步骤234; 步骤236: 在知识图谱中查询相关三元组, 以实体列表中最新添加的实体为三元组头节 点, 以问题关系列表最新添加的关系为三元组关系边, 利用Cypher语句查询三元组的尾节 点, 并将尾节点添加至实体列表中; 步骤237: 重复执行步骤231至步骤236, 直至问题关系列表不再新增, 最终返回问题关权 利 要 求 书 1/2 页 2 CN 115146042 A 2系列表。 7.根据权利要求1所述的方法, 其特 征在于, 所述 步骤3包括: 步骤31: 判断识别出的问题关系的数量; 步骤32: 将问题实体泛化后的节点作为起始节点, 在知识图谱中查询三元组对应的尾 实体; 步骤33: 将每次遍历查询的尾实体作为下一次三元组查询的头实体, 重复执 行步骤32; 步骤34: 关系列表遍历结束后, 返回最终的尾实体名称作为问题答案 。 8.根据权利要求7 所述的方法, 其特 征在于, 所述 步骤31包括: 步骤311: 若问题关系的数量仅为1, 则调用知识图谱单跳问答 服务, 返回问题答案; 步骤312: 若问题关系的数量大于1, 则分别遍历问题关系列表。 9.根据权利要求7 所述的方法, 其特 征在于, 所述 步骤32包括: 将问题实体泛化后的节点作为起始节点, 问题关系作为三元组关系边, 利用Cypher语 句在知识图谱中查询三元组对应的尾实体。 10.一种基于知识图谱多跳问答装置, 其特 征在于, 包括: 泛化模块, 用于泛化问题实体名称; 识别模块, 用于基于泛化后的问题实体以及 知识图谱, 识别问题关系; 答案检索模块, 用于泛化后的问题实体和识别出的问题关系, 得到多跳问答的答案 。权 利 要 求 书 2/2 页 3 CN 115146042 A 3

.PDF文档 专利 一种基于知识图谱的多跳问答方法及装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的多跳问答方法及装置 第 1 页 专利 一种基于知识图谱的多跳问答方法及装置 第 2 页 专利 一种基于知识图谱的多跳问答方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:53:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。