说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210687513.9 (22)申请日 2022.06.17 (71)申请人 厦门渊亭信息科技有限公司 地址 361000 福建省厦门市软件园二期望 海路61号801单 元N8-01 (72)发明人 洪万福 黄勇 苏金钟  (74)专利代理 机构 厦门市精诚新创知识产权代 理有限公司 3 5218 专利代理师 赵薇 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 16/31(2019.01) G06F 40/186(2020.01) G06F 40/295(2020.01)G06F 40/211(2020.01) G06F 16/35(2019.01) (54)发明名称 一种知识图谱问答方法、 终端设备及 存储介 质 (57)摘要 本发明涉及一种知识图谱问答方法、 终端设 备及存储介质, 该方法中包括: 根据知识图谱中 的实体、 关系和属性的名称构建词库; 基于词库 对问句进行实体、 关系和属性进行识别; 对问句 进行句法分析; 判断问句是否属于单跳类型, 如 果是, 采用模板匹配方式获取问句对应的查询语 句; 否则, 采用子图匹配方式获取问句对应的查 询语句; 基于查询语句从知识图谱中进行查询。 本发明通过对问句类型进行区分, 对简单问句沿 用模板匹配的方式, 而对复杂问句采用子图匹配 的方式来获取查询语句, 在保证简单问题准确回 答的基础上, 又能支持多跳、 推理等复杂类型问 题的答案 检索, 能显著提升知识图谱问答能力。 权利要求书1页 说明书5页 附图1页 CN 115114420 A 2022.09.27 CN 115114420 A 1.一种知识图谱问答方法, 其特 征在于, 包括以下步骤: S1: 根据知识图谱中的实体、 关系和 属性的名称构建词库; S2: 基于词库对问句进行实体、 关系和 属性进行识别; S3: 对问句进行句法分析; S4: 判断问句是否属于单跳类型, 如果是, 采用模板匹配方式获取问句对应的查询语 句; 否则, 采用子图匹配方式获取问句对应的查询语句; S5: 基于查询语句从知识图谱中进行查询。 2.根据权利要求1所述的知识图谱问答方法, 其特征在于: 步骤S1中还包括对知识图谱 中的实体、 关系和 属性的名称进行同义词生成操作, 基于原词和同义词共同构建词库。 3.根据权利要求1所述的知识图谱问答方法, 其特征在于: 基于词库对问句进行实体进 行识别的过程包括: 通过命名实体识别模型对问句中的实体进行识别; 通过实体链接从词 库中提取识别到的实体在 知识图谱中对应的实体名称。 4.根据权利要求1所述的知识图谱问答方法, 其特征在于: 基于词库对问句进行关系和 属性进行识别的过程包括: 基于词库中的关系和属性的名称对问句的关系和属性进行查 找。 5.根据权利要求1所述的知识图谱问答方法, 其特征在于: 单跳类型的问句包括单实体 单属性单跳类型和单实体多属性单跳类型。 6.根据权利要求1所述的知识图谱问答方法, 其特征在于: 采用子图匹配方式获取问句 对应的查询语句的过程包括: 基于句法分析结果获取问句的所有查询 子图, 将各查询 子图 分别与知识图谱进行匹配, 根据匹配程度对所有查询 子图进行排序, 将排序最高的查询 子 图作为问句对应的查询语句。 7.根据权利要求6所述的知识图谱问答方法, 其特征在于: 基于句法分析结果获取问句 的所有查询子图的过程包括: S101: 根据知识图谱以键值对的方式构建关系词典, 关系词典中键为关系, 值为关系对 应的两个实体; S102: 根据句法分析 结果构建问句的依存关系树; S103: 基于关系词典, 在依存关系树中查找所有节点名称为关系词典中的关系名称的 节点作为关系节点; S104: 遍历依存关系树中所有以关系节点为根节点的子树, 如果该子树与关系词典中 的任一键值对完全匹配, 则设定该子树 为关系子树; S105: 根据依存关系树中边的词性, 获取关系子树中各边的词性; S106: 基于关系子树中各边的词性, 获取关系子树中关系节点对应的主语节点和宾语 节点并进行 标注, 将标注后的关系子树作为 查询子图。 8.一种知识图谱问答终端设备, 其特征在于: 包括处理器、 存储器以及存储在所述存储 器中并在所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如权利 要求1~7中任一所述方法的步骤。 9.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于: 所述计算机程序被处 理器执行时实现如权利要求1~7中任一所述方法的步骤。权 利 要 求 书 1/1 页 2 CN 115114420 A 2一种知识图谱 问答方法、 终端设 备及存储介质 技术领域 [0001]本发明涉及知识图谱技术领域, 尤其涉及一种知识图谱问答方法、 终端设备及存 储介质。 背景技术 [0002]基于知识图谱的问答(Knowledge  Graph Question Answering, KGQA)是自然语言 处理领域的研究方向。 知识图谱 是知识的结构化表示, 由三元 组(主语, 谓词, 宾语)构成, 表 示实体和实体间存在的语义关系, 例如: 厦门市花是三角梅, 可以表 示为: (厦门, 市花, 三角 梅)。 通过把非结构化、 半结构化和结构化的数据抽取出来组成一种基于图的数据格式, 由 点和边组成一个庞大的关系网络图, 这大 大的优化了 搜索性能。 [0003]知识图谱问答可以解决传统搜索的问题。 同时, 结合自然语言处理技术, 通过近似 匹配、 语义理解、 关系判断等, 在数据库中检索出相似度最高的数据。 知识图谱问答主要任 务是给定自然语言问题, 理解问题中包含的实体、 语义关系和逻辑组合, 到知识图谱中检索 并返回答案 。 [0004]现有的知识图谱问答产品通过模板匹配的方式组装查询语句, 对单实体单属性、 单实体多属性、 多实体单属 性、 多实体多属性等简单问句查询的准确率高、 效果较好, 目前 在装备图谱测试准确率90%以上, 但模板生成需要较专业的语言学知识且可扩展性不强, 问句泛化能力弱, 对于复杂问句类型穷举难, 尤其对于条件约束、 时间约束多跳问句或者最 值、 比较、 是否、 并列推理复杂类型问句兼容 不够难以返回准确答案, 难以满足用户的需求。 发明内容 [0005]为了解决上述问题, 本发明提出了一种知识图谱问答方法、 终端设备及存 储介质。 [0006]具体方案如下: [0007]一种知识图谱问答方法, 包括以下步骤: [0008]S1: 根据知识图谱中的实体、 关系和 属性的名称构建词库; [0009]S2: 基于词库对问句进行实体、 关系和 属性进行识别; [0010]S3: 对问句进行句法分析; [0011]S4: 判断问句是否属于单跳类型, 如果是, 采用模板匹配方式获取问句对应的查询 语句; 否则, 采用子图匹配方式获取问句对应的查询语句; [0012]S5: 基于查询语句从知识图谱中进行查询。 [0013]进一步的, 步骤S1中还包括对知识图谱中的实体、 关系和属性的名称进行同义词 生成操作, 基于原词和同义词共同构建词库。 [0014]进一步的, 基于词库对问句进行实体进行识别的过程包括: 通过命名实体识别模 型对问句中的实体进 行识别; 通过实体链接从词库中提取识别到的实体在知识图谱中对应 的实体名称。 [0015]进一步的, 基于词库对问句进行关系和属性进行识别的过程包括: 基于词库 中的说 明 书 1/5 页 3 CN 115114420 A 3

.PDF文档 专利 一种知识图谱问答方法、终端设备及存储介质

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种知识图谱问答方法、终端设备及存储介质 第 1 页 专利 一种知识图谱问答方法、终端设备及存储介质 第 2 页 专利 一种知识图谱问答方法、终端设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。