(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210687513.9
(22)申请日 2022.06.17
(71)申请人 厦门渊亭信息科技有限公司
地址 361000 福建省厦门市软件园二期望
海路61号801单 元N8-01
(72)发明人 洪万福 黄勇 苏金钟
(74)专利代理 机构 厦门市精诚新创知识产权代
理有限公司 3 5218
专利代理师 赵薇
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/36(2019.01)
G06F 16/31(2019.01)
G06F 40/186(2020.01)
G06F 40/295(2020.01)G06F 40/211(2020.01)
G06F 16/35(2019.01)
(54)发明名称
一种知识图谱问答方法、 终端设备及 存储介
质
(57)摘要
本发明涉及一种知识图谱问答方法、 终端设
备及存储介质, 该方法中包括: 根据知识图谱中
的实体、 关系和属性的名称构建词库; 基于词库
对问句进行实体、 关系和属性进行识别; 对问句
进行句法分析; 判断问句是否属于单跳类型, 如
果是, 采用模板匹配方式获取问句对应的查询语
句; 否则, 采用子图匹配方式获取问句对应的查
询语句; 基于查询语句从知识图谱中进行查询。
本发明通过对问句类型进行区分, 对简单问句沿
用模板匹配的方式, 而对复杂问句采用子图匹配
的方式来获取查询语句, 在保证简单问题准确回
答的基础上, 又能支持多跳、 推理等复杂类型问
题的答案 检索, 能显著提升知识图谱问答能力。
权利要求书1页 说明书5页 附图1页
CN 115114420 A
2022.09.27
CN 115114420 A
1.一种知识图谱问答方法, 其特 征在于, 包括以下步骤:
S1: 根据知识图谱中的实体、 关系和 属性的名称构建词库;
S2: 基于词库对问句进行实体、 关系和 属性进行识别;
S3: 对问句进行句法分析;
S4: 判断问句是否属于单跳类型, 如果是, 采用模板匹配方式获取问句对应的查询语
句; 否则, 采用子图匹配方式获取问句对应的查询语句;
S5: 基于查询语句从知识图谱中进行查询。
2.根据权利要求1所述的知识图谱问答方法, 其特征在于: 步骤S1中还包括对知识图谱
中的实体、 关系和 属性的名称进行同义词生成操作, 基于原词和同义词共同构建词库。
3.根据权利要求1所述的知识图谱问答方法, 其特征在于: 基于词库对问句进行实体进
行识别的过程包括: 通过命名实体识别模型对问句中的实体进行识别; 通过实体链接从词
库中提取识别到的实体在 知识图谱中对应的实体名称。
4.根据权利要求1所述的知识图谱问答方法, 其特征在于: 基于词库对问句进行关系和
属性进行识别的过程包括: 基于词库中的关系和属性的名称对问句的关系和属性进行查
找。
5.根据权利要求1所述的知识图谱问答方法, 其特征在于: 单跳类型的问句包括单实体
单属性单跳类型和单实体多属性单跳类型。
6.根据权利要求1所述的知识图谱问答方法, 其特征在于: 采用子图匹配方式获取问句
对应的查询语句的过程包括: 基于句法分析结果获取问句的所有查询 子图, 将各查询 子图
分别与知识图谱进行匹配, 根据匹配程度对所有查询 子图进行排序, 将排序最高的查询 子
图作为问句对应的查询语句。
7.根据权利要求6所述的知识图谱问答方法, 其特征在于: 基于句法分析结果获取问句
的所有查询子图的过程包括:
S101: 根据知识图谱以键值对的方式构建关系词典, 关系词典中键为关系, 值为关系对
应的两个实体;
S102: 根据句法分析 结果构建问句的依存关系树;
S103: 基于关系词典, 在依存关系树中查找所有节点名称为关系词典中的关系名称的
节点作为关系节点;
S104: 遍历依存关系树中所有以关系节点为根节点的子树, 如果该子树与关系词典中
的任一键值对完全匹配, 则设定该子树 为关系子树;
S105: 根据依存关系树中边的词性, 获取关系子树中各边的词性;
S106: 基于关系子树中各边的词性, 获取关系子树中关系节点对应的主语节点和宾语
节点并进行 标注, 将标注后的关系子树作为 查询子图。
8.一种知识图谱问答终端设备, 其特征在于: 包括处理器、 存储器以及存储在所述存储
器中并在所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如权利
要求1~7中任一所述方法的步骤。
9.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于: 所述计算机程序被处 理器执行时实现如权利要求1~7中任一所述方法的步骤。权 利 要 求 书 1/1 页
2
CN 115114420 A
2一种知识图谱 问答方法、 终端设 备及存储介质
技术领域
[0001]本发明涉及知识图谱技术领域, 尤其涉及一种知识图谱问答方法、 终端设备及存
储介质。
背景技术
[0002]基于知识图谱的问答(Knowledge Graph Question Answering, KGQA)是自然语言
处理领域的研究方向。 知识图谱 是知识的结构化表示, 由三元 组(主语, 谓词, 宾语)构成, 表
示实体和实体间存在的语义关系, 例如: 厦门市花是三角梅, 可以表 示为: (厦门, 市花, 三角
梅)。 通过把非结构化、 半结构化和结构化的数据抽取出来组成一种基于图的数据格式, 由
点和边组成一个庞大的关系网络图, 这大 大的优化了 搜索性能。
[0003]知识图谱问答可以解决传统搜索的问题。 同时, 结合自然语言处理技术, 通过近似
匹配、 语义理解、 关系判断等, 在数据库中检索出相似度最高的数据。 知识图谱问答主要任
务是给定自然语言问题, 理解问题中包含的实体、 语义关系和逻辑组合, 到知识图谱中检索
并返回答案 。
[0004]现有的知识图谱问答产品通过模板匹配的方式组装查询语句, 对单实体单属性、
单实体多属性、 多实体单属 性、 多实体多属性等简单问句查询的准确率高、 效果较好, 目前
在装备图谱测试准确率90%以上, 但模板生成需要较专业的语言学知识且可扩展性不强,
问句泛化能力弱, 对于复杂问句类型穷举难, 尤其对于条件约束、 时间约束多跳问句或者最
值、 比较、 是否、 并列推理复杂类型问句兼容 不够难以返回准确答案, 难以满足用户的需求。
发明内容
[0005]为了解决上述问题, 本发明提出了一种知识图谱问答方法、 终端设备及存 储介质。
[0006]具体方案如下:
[0007]一种知识图谱问答方法, 包括以下步骤:
[0008]S1: 根据知识图谱中的实体、 关系和 属性的名称构建词库;
[0009]S2: 基于词库对问句进行实体、 关系和 属性进行识别;
[0010]S3: 对问句进行句法分析;
[0011]S4: 判断问句是否属于单跳类型, 如果是, 采用模板匹配方式获取问句对应的查询
语句; 否则, 采用子图匹配方式获取问句对应的查询语句;
[0012]S5: 基于查询语句从知识图谱中进行查询。
[0013]进一步的, 步骤S1中还包括对知识图谱中的实体、 关系和属性的名称进行同义词
生成操作, 基于原词和同义词共同构建词库。
[0014]进一步的, 基于词库对问句进行实体进行识别的过程包括: 通过命名实体识别模
型对问句中的实体进 行识别; 通过实体链接从词库中提取识别到的实体在知识图谱中对应
的实体名称。
[0015]进一步的, 基于词库对问句进行关系和属性进行识别的过程包括: 基于词库 中的说 明 书 1/5 页
3
CN 115114420 A
3
专利 一种知识图谱问答方法、终端设备及存储介质
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:55:54上传分享