(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210464241.6
(22)申请日 2022.04.29
(71)申请人 华侨大学
地址 362000 福建省泉州市丰泽区城东城
华北路269号
(72)发明人 王华珍 张恒彰 刘晓聪 汪晓凤
徐婷婷 李弼程 缑锦
(74)专利代理 机构 厦门市首创君 合专利事务所
有限公司 3 5204
专利代理师 李艾华
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/332(2019.01)
G06F 16/36(2019.01)
G06F 40/211(2020.01)G06F 40/295(2020.01)
(54)发明名称
一种基于知识图谱关系预测的问题链生成
方法及系统
(57)摘要
本发明公开了一种基于知识图谱关系预测
的问题链 生成方法及系统, 能够基于问句知 识图
谱自动生成问题链, 包括: 基于问句知识图谱构
建问题链数据集; 对问题链的问句实体进行特征
初始化, 并通过特征融合方法获得问题链的融合
头实体和待测尾实体的初始向量; 将融合头实体
和待测尾实体的初始向量送入QCG ‑KGLP模型的
Graph Attention图表示学习模块中, 从而获得
融合头实体和待测尾实体的表示向量; 将融合头
实体和待测尾实体的表示向量输入到QCG ‑KGLP
模型的convKB模块中进行链接 预测, 从而实现问
题链生成。 本发明能有效生 成适应教学场景的有
关联、 有梯度的问题链, 从而助力教师开展提问
教学与提升学生思维能力。
权利要求书3页 说明书9页 附图2页
CN 114860877 A
2022.08.05
CN 114860877 A
1.一种基于知识图谱关系预测的问题 链生成方法, 其特 征在于, 包括如下步骤:
步骤1、 基于问句知识图谱构建问题 链数据集;
步骤2、 对问题链的问句实体进行特征初始化, 并通过特征融合方法获得问题链的融合
头实体和待测尾实体的初始向量;
步骤3、 将融合头实体和待测尾实体的初始向量送入QCG ‑KGLP模型的Graph Attention
图表示学习模块中, 从而获得融合头实体和待测尾实体的表示向量;
步骤4、 将融合头实体和待测尾实体 的表示向量输入到QCG ‑KGLP模型的convKB模块中
进行链接预测, 从而实现问题 链生成。
2.根据权利要求1所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述
步骤1具体包括:
步骤1.1、 给定问句知识图谱G, 在问句知识图谱G中包含问句实体集合H={e1, e2, ...,
eN}, 其中N为问句知识图谱G的实体个数; 以任意一个问句实体e为起点沿着图拓扑抓取num
条问题链, 获得问句实体e的问题链集合D ′={d1, d2, ..., dnum}, 其中每个问题链d由多跳三
元组组成, 即包含问句实体集合E={e1, e2, ..., el}, l表示每个问题链d的长度; 其中, N>l,
l对应的集 合属于N的子集;
步骤1.2、 遍历 问句知识图谱G中所有 的问句实体, 将问句实体集合H中每个问句实体e
所得到的问题链集合D ′添加到问题链数据集D中, 得到问句知识图谱G所对应的问题链数据
集D={d1, d2, ..., dO}, 其中O为问题 链总个数。
3.根据权利要求2所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述
步骤2具体包括:
步骤2.1、 将每个问句实体e进行分词并去除停用词预处理, 得到分词集合C={c1,
c2, ..., cn}, 其中n表示预处 理后每个问句实体e包 含的单词个数;
步骤2.2、 将步骤2.1得到 的分词集合C通过GloVe预训练模型进行初始 向量表示, 获得
词向量集合W={w1, w2, ..., wn}, 其中, 词向量 w表示为:
w=GloVe(c) (1)
其中, GloVe为GloVe预训练模型的词向量表达函数;
步骤2.3、 基于步骤2.2 获得的词向量集合W, 通过对问句实体e中的分词集合C的词向量
集合W进行加权平均, 获得每个问题链d的问句实体的初始向量集合Q={q1, q2, ..., ql}, 其
中问句实体e的初始向量q表示 为:
步骤2.4、 针对每个问题链d, 用前l ‑1个问句实体的信息作为该问题链d的融合头实体
S, 其初始向量hS表示为:
其中, i表示问句实体ei在问题链d中从初始 节点开始计算的位置排名;
步骤2.5、 针对每 个问题链d, 将第l个问句实体作为待测尾实体ej, 其向量hj表示为:
hj=ql (4)。
4.根据权利要求3所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述
步骤3具体包括:权 利 要 求 书 1/3 页
2
CN 114860877 A
2步骤3.1、 将 步骤2.4的融合头实体的初始向量hS及步骤2.5的待测尾 实体向量hj送入基
于图Attention的问句知识图谱表示学习模块中, 计算 问题链d中融合头实体S与待测尾实
体ej的注意力系数αSj, 其公式为:
bSj=LeakyReLU(W2cSj) (6)
cSj=W1[hS||hj||gr] (7)
其中, 关系向量gr是融合头实体S和待测尾实体 ej的关系r的嵌入向量, W1、 W2表示线性转
换矩阵, ||表 示连接符号, cSj表示融合头实体S和待测尾实体ej所组成三元 组的加权线性组
合, bSj表示融合头实体S和待测尾实体ej的相对注意力矩阵, NS表示所有与融合头实体S相
邻的实体集 合, en是属于NS的实体, bSn表示融合头实体S和实体en的相对注意力矩阵;
步骤3.2、 基于步骤3.1中得到 的融合头实体S与待测尾实体ej的加权线性组合cSj以及
注意力系数αSj, 计算经过基于图Attention的问句知识图谱表示学习模块后获得的融合头
实体S的表示向量h ’S:
其中, σ 表示任意的非线性 函数, M表示独立注意力层的层数;
步骤3.3、 基于步骤2.4的融合头节点S的初始向量hS与步骤3.2的表示向量h ′S, 计算融
合头实体S的最终表示向量h ”S, 其计算方式为:
h”S=WEhS+h′S (9)
其中, WE是需要训练的线性 转换矩阵。
5.根据权利要求4所述的基于知识图谱关系预测的问题链生成方法, 其特征在于, 所述
步骤4具体包括:
步骤4.1、 将步骤3.3的融合头实体S的最终表示向量h ”S、 步骤2.5的待测 尾实体向量hj
以及关系向量gr送入基于convKB的问题链关系判别器中, 计 算融合头实体S与待测尾实体ej
是否存在链式关系的得分函数
其计算方法如下:
其中,
表示融合头实体S与待测尾实体ej组成的预测问题链, ωm表示第m个卷积过滤
器, Ω表示模型中的过滤器数量 的超参数, *是卷积运算符, W是线性转化矩阵, levelS表示
融合头实体S中最后一个节点eS的问句难度系数, levelj表示待测尾实体ej的问句难度系
数;
步骤4.2、 基于步骤4.1的得分函数
计算QCG‑KGLP模型 下游任务的损失
其中,
表示融合头 实体S与待测尾实体ej组成的预测问题链, 当
时, lSj=‑1; 当
时, lSj=1; J表示 正确的问题 链集合, J’表示错误的问题 链集合;
步骤4.3、 基于步骤3.3的融合头实体S的最终表示向量h ”S、 步骤2.5的待测尾实体向量
hj以及关系向量gr, 计算QCG‑KGLP模型中基于图Attention的问句知识图谱表示 学习模块的权 利 要 求 书 2/3 页
3
CN 114860877 A
3
专利 一种基于知识图谱关系预测的问题链生成方法及系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:53:42上传分享