说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210464241.6 (22)申请日 2022.04.29 (71)申请人 华侨大学 地址 362000 福建省泉州市丰泽区城东城 华北路269号 (72)发明人 王华珍 张恒彰 刘晓聪 汪晓凤  徐婷婷 李弼程 缑锦  (74)专利代理 机构 厦门市首创君 合专利事务所 有限公司 3 5204 专利代理师 李艾华 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 40/211(2020.01)G06F 40/295(2020.01) (54)发明名称 一种基于知识图谱关系预测的问题链生成 方法及系统 (57)摘要 本发明公开了一种基于知识图谱关系预测 的问题链 生成方法及系统, 能够基于问句知 识图 谱自动生成问题链, 包括: 基于问句知识图谱构 建问题链数据集; 对问题链的问句实体进行特征 初始化, 并通过特征融合方法获得问题链的融合 头实体和待测尾实体的初始向量; 将融合头实体 和待测尾实体的初始向量送入QCG ‑KGLP模型的 Graph Attention图表示学习模块中, 从而获得 融合头实体和待测尾实体的表示向量; 将融合头 实体和待测尾实体的表示向量输入到QCG ‑KGLP 模型的convKB模块中进行链接 预测, 从而实现问 题链生成。 本发明能有效生 成适应教学场景的有 关联、 有梯度的问题链, 从而助力教师开展提问 教学与提升学生思维能力。 权利要求书3页 说明书9页 附图2页 CN 114860877 A 2022.08.05 CN 114860877 A 1.一种基于知识图谱关系预测的问题 链生成方法, 其特 征在于, 包括如下步骤: 步骤1、 基于问句知识图谱构建问题 链数据集; 步骤2、 对问题链的问句实体进行特征初始化, 并通过特征融合方法获得问题链的融合 头实体和待测尾实体的初始向量; 步骤3、 将融合头实体和待测尾实体的初始向量送入QCG ‑KGLP模型的Graph  Attention 图表示学习模块中, 从而获得融合头实体和待测尾实体的表示向量; 步骤4、 将融合头实体和待测尾实体 的表示向量输入到QCG ‑KGLP模型的convKB模块中 进行链接预测, 从而实现问题 链生成。 2.根据权利要求1所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述 步骤1具体包括: 步骤1.1、 给定问句知识图谱G, 在问句知识图谱G中包含问句实体集合H={e1, e2, ..., eN}, 其中N为问句知识图谱G的实体个数; 以任意一个问句实体e为起点沿着图拓扑抓取num 条问题链, 获得问句实体e的问题链集合D ′={d1, d2, ..., dnum}, 其中每个问题链d由多跳三 元组组成, 即包含问句实体集合E={e1, e2, ..., el}, l表示每个问题链d的长度; 其中, N>l, l对应的集 合属于N的子集; 步骤1.2、 遍历 问句知识图谱G中所有 的问句实体, 将问句实体集合H中每个问句实体e 所得到的问题链集合D ′添加到问题链数据集D中, 得到问句知识图谱G所对应的问题链数据 集D={d1, d2, ..., dO}, 其中O为问题 链总个数。 3.根据权利要求2所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述 步骤2具体包括: 步骤2.1、 将每个问句实体e进行分词并去除停用词预处理, 得到分词集合C={c1, c2, ..., cn}, 其中n表示预处 理后每个问句实体e包 含的单词个数; 步骤2.2、 将步骤2.1得到 的分词集合C通过GloVe预训练模型进行初始 向量表示, 获得 词向量集合W={w1, w2, ..., wn}, 其中, 词向量 w表示为: w=GloVe(c)         (1) 其中, GloVe为GloVe预训练模型的词向量表达函数; 步骤2.3、 基于步骤2.2 获得的词向量集合W, 通过对问句实体e中的分词集合C的词向量 集合W进行加权平均, 获得每个问题链d的问句实体的初始向量集合Q={q1, q2, ..., ql}, 其 中问句实体e的初始向量q表示 为: 步骤2.4、 针对每个问题链d, 用前l ‑1个问句实体的信息作为该问题链d的融合头实体 S, 其初始向量hS表示为: 其中, i表示问句实体ei在问题链d中从初始 节点开始计算的位置排名; 步骤2.5、 针对每 个问题链d, 将第l个问句实体作为待测尾实体ej, 其向量hj表示为: hj=ql           (4)。 4.根据权利要求3所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述 步骤3具体包括:权 利 要 求 书 1/3 页 2 CN 114860877 A 2步骤3.1、 将 步骤2.4的融合头实体的初始向量hS及步骤2.5的待测尾 实体向量hj送入基 于图Attention的问句知识图谱表示学习模块中, 计算 问题链d中融合头实体S与待测尾实 体ej的注意力系数αSj, 其公式为: bSj=LeakyReLU(W2cSj)     (6) cSj=W1[hS||hj||gr]            (7) 其中, 关系向量gr是融合头实体S和待测尾实体 ej的关系r的嵌入向量, W1、 W2表示线性转 换矩阵, ||表 示连接符号, cSj表示融合头实体S和待测尾实体ej所组成三元 组的加权线性组 合, bSj表示融合头实体S和待测尾实体ej的相对注意力矩阵, NS表示所有与融合头实体S相 邻的实体集 合, en是属于NS的实体, bSn表示融合头实体S和实体en的相对注意力矩阵; 步骤3.2、 基于步骤3.1中得到 的融合头实体S与待测尾实体ej的加权线性组合cSj以及 注意力系数αSj, 计算经过基于图Attention的问句知识图谱表示学习模块后获得的融合头 实体S的表示向量h ’S: 其中, σ 表示任意的非线性 函数, M表示独立注意力层的层数; 步骤3.3、 基于步骤2.4的融合头节点S的初始向量hS与步骤3.2的表示向量h ′S, 计算融 合头实体S的最终表示向量h ”S, 其计算方式为: h”S=WEhS+h′S            (9) 其中, WE是需要训练的线性 转换矩阵。 5.根据权利要求4所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述 步骤4具体包括: 步骤4.1、 将步骤3.3的融合头实体S的最终表示向量h ”S、 步骤2.5的待测 尾实体向量hj 以及关系向量gr送入基于convKB的问题链关系判别器中, 计 算融合头实体S与待测尾实体ej 是否存在链式关系的得分函数 其计算方法如下: 其中, 表示融合头实体S与待测尾实体ej组成的预测问题链, ωm表示第m个卷积过滤 器, Ω表示模型中的过滤器数量 的超参数, *是卷积运算符, W是线性转化矩阵, levelS表示 融合头实体S中最后一个节点eS的问句难度系数, levelj表示待测尾实体ej的问句难度系 数; 步骤4.2、 基于步骤4.1的得分函数 计算QCG‑KGLP模型 下游任务的损失 其中, 表示融合头 实体S与待测尾实体ej组成的预测问题链, 当 时, lSj=‑1; 当 时, lSj=1; J表示 正确的问题 链集合, J’表示错误的问题 链集合; 步骤4.3、 基于步骤3.3的融合头实体S的最终表示向量h ”S、 步骤2.5的待测尾实体向量 hj以及关系向量gr, 计算QCG‑KGLP模型中基于图Attention的问句知识图谱表示 学习模块的权 利 要 求 书 2/3 页 3 CN 114860877 A 3

.PDF文档 专利 一种基于知识图谱关系预测的问题链生成方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱关系预测的问题链生成方法及系统 第 1 页 专利 一种基于知识图谱关系预测的问题链生成方法及系统 第 2 页 专利 一种基于知识图谱关系预测的问题链生成方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:53:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。