说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210566962.8 (22)申请日 2022.05.24 (71)申请人 华侨大学 地址 362000 福建省泉州市城华北路269号 (72)发明人 王华珍 张恒彰 刘晓聪 汪晓凤  徐婷婷 李弼程 缑锦  (74)专利代理 机构 厦门智慧呈 睿知识产权代理 事务所(普通 合伙) 35222 专利代理师 王玮婷 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种知识图谱的问句生成方法、 装置、 设备 和存储介质 (57)摘要 本发明实施例提供一种知识图谱的问句生 成方法、 装置、 设备和存储介质, 涉及自然语言处 理技术领域。 其中, 这种问句生成方法包含步骤 S1至步骤S7。 S1、 获取知识图谱。 S2、 根据知识图 谱, 通过图变换网络模型, 获取各个子图的子图 向量。 S3、 获取问句数据集。 S4、 根据知识图谱和 问句数据集, 基于相似度获取各个子图的外部问 句。 S5、 获取五何问题类型参数。 S6、 根据五何问 题类型参数和外部问句, 通过Bi  LSTM神经网络 模型, 获取外部增强向量。 S7、 根据子图向量和外 部增强向量, 通过指针生成 网络模型, 获取问句。 本发明对生成教学场景中所需的类型多样、 语义 知识丰富、 语言表达自然的问句具有重大的指导 和促进作用。 权利要求书4页 说明书12页 附图3页 CN 114925186 A 2022.08.19 CN 114925186 A 1.一种知识图谱的问句生成方法, 其特 征在于, 包 含: 获取知识图谱; 所述知识图谱包括子图集合, 每个子图包括实体集合、 关系集合和三元 组集合; 根据所述知识图谱, 通过图变换网络模型, 获取 各个子图的子图向量; 获取问句数据集; 根据所述知识图谱和所述问句数据集, 基于相似度获取 各个子图的外 部问句; 获取五何问题类型参数; 根据所述五何问题类型参数和所述外部问句, 通过BiLSTM神经网络模型, 获取外部增 强向量; 根据所述子图向量和所述外 部增强向量, 通过指针生成网络模型, 获取问句。 2.根据权利要求1所述的知识图谱的问句生成方法, 其特征在于, 根据所述知识图谱, 通过图变换网络模型, 获取 各个子图的子图向量, 包括: 将子图的实体集 合输入词向量模型, 获取子图的实体向量 集合; 将所述实体向量集合输入图注意力网络模型, 获取各个实体的中间层向量 其中, 所 述中间层向量的计算模型为: 式中, 为实体e的中间层向量、 ve为实体e的实体向量、 ∨表示将图注意力网络模型中 的N个注意力头的信息进行串联、 代表在第n个注意力头的注意力参数 是图注意力网络模型中实体ei与实体ej的注意力参数、 为第n 头注意力头中的特征矩阵、 为实体ej的实体向量、 为实体ei的实体向量、 WQ和WK为计算 注意力参数的特 征矩阵、 为实体ei在知识图谱中的邻居节点 集合; 根据所述各个实体的中间层向量, 通过所述图注意力网络模型的正则化层和前馈神经 网络层, 获取 各个实体的输出向量表示 其中, 所述输出向量表示的计算模型为: FFN(x)=W1×(f(W2×x+b1)+b2) 式中, 为实体e的输出向量表示、 LayerNorm为归一化函数、 v ’e为实体e的中间层向量 经过LayerNorm函数及前馈神经网络层FFN得到的隐层向量、 W1以及W2是前馈神经网络中 的特征矩阵、 x代 表前馈神经网络层的输入信息、 b1以及b2为偏置值; 根据所述各个实体的输出向量表示, 得到子 图的所述子 图向量, 从而获取各个子 图的权 利 要 求 书 1/4 页 2 CN 114925186 A 2子图向量。 3.根据权利要求1所述的知识图谱的问句生成方法, 其特征在于, 根据 所述知识图谱和 所述问句数据集, 基于相似度获取 各个子图的外 部问句, 包括: 将子图的关系集 合输入到Pad dleNLP“解语”模型, 获取关系词类标注信息集 合; 将所述问句数据集输入到Pad dleNLP“解语”模型, 获取问句词类标注信息集 合; 计算所述问句词类标注信息集合中的各个词类标注信息和所述关系词类标注信息集 合的相似度 其中, 相似度计算模型为: 式中, 代表关系词类标注信息 与问句词类标注信息pbq的交集 的词类标注信息个数、 代表关系词类标注信息 与问句词类标注信 息pbq的并集的词类标注信息个数; 根据所述相似度, 获取子图与所述问句数据集的相似度集 合; 将所述相似度集合中最大的相似度 所对应的问句作为子图的外部问句, 从而获取各个 子图的外 部问句。 4.根据权利要求1所述的知识图谱的问句生成方法, 其特征在于, 根据 所述五何问题类 型参数和所述外 部问句, 通过Bi LSTM神经网络模型, 获取外 部增强向量, 包括: 根据所述五何问题类型参数和所述外部问句, 通过词向量模型, 获取五何问题类型向 量和第一分词向量 集合; 将所述第一分词向量集合中的各个词向量和所述五何问题类型向量进行向量纵向拼 接, 获取拼接词向量 集合; 将所述拼接词向量 集合输入Bi LSTM神经网络模型, 获取外 部增强向量 集合。 5.根据权利要求4所述的知识图谱的问句生成方法, 其特征在于, 根据 所述五何问题类 型参数和所述外部问句, 通过词向量模 型, 获取五何问题类型向量和第一分词向量集合, 包 括: 将所述五何问题类型参数输入o neHot词向量模型, 获取五何问题类型向量; 将所述外部问句输入PaddleNLP “解语”模型, 获取外部问句的第一分词集合, 从而获取 各个子图的第一分词集 合; 将所述第一分词集 合输入Gl oVe词向量模型, 获取第一分词向量 集合。 6.根据权利要求5所述的知识图谱的问句生成方法, 其特征在于, 根据 所述子图向量和 所述外部增强向量, 通过指针生成网络模型, 获取问句, 包括: 获取各个子图对应的目标问句, 并将所述目标问句输入jieba分词工具, 获取第二分词 集合; 将所述第二分词集 合输入词向量模型, 获取第二分词向量 集合; 提取所述知识图谱的实体集合和关系集合以及所述第 二分词集合中的所有词语, 获取 词典;权 利 要 求 书 2/4 页 3 CN 114925186 A 3

.PDF文档 专利 一种知识图谱的问句生成方法、装置、设备和存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种知识图谱的问句生成方法、装置、设备和存储介质 第 1 页 专利 一种知识图谱的问句生成方法、装置、设备和存储介质 第 2 页 专利 一种知识图谱的问句生成方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。