说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210566962.8 (22)申请日 2022.05.24 (71)申请人 华侨大学 地址 362000 福建省泉州市城华北路269号 (72)发明人 王华珍 张恒彰 刘晓聪 汪晓凤 徐婷婷 李弼程 缑锦 (74)专利代理 机构 厦门智慧呈 睿知识产权代理 事务所(普通 合伙) 35222 专利代理师 王玮婷 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种知识图谱的问句生成方法、 装置、 设备 和存储介质 (57)摘要 本发明实施例提供一种知识图谱的问句生 成方法、 装置、 设备和存储介质, 涉及自然语言处 理技术领域。 其中, 这种问句生成方法包含步骤 S1至步骤S7。 S1、 获取知识图谱。 S2、 根据知识图 谱, 通过图变换网络模型, 获取各个子图的子图 向量。 S3、 获取问句数据集。 S4、 根据知识图谱和 问句数据集, 基于相似度获取各个子图的外部问 句。 S5、 获取五何问题类型参数。 S6、 根据五何问 题类型参数和外部问句, 通过Bi LSTM神经网络 模型, 获取外部增强向量。 S7、 根据子图向量和外 部增强向量, 通过指针生成 网络模型, 获取问句。 本发明对生成教学场景中所需的类型多样、 语义 知识丰富、 语言表达自然的问句具有重大的指导 和促进作用。 权利要求书4页 说明书12页 附图3页 CN 114925186 A 2022.08.19 CN 114925186 A 1.一种知识图谱的问句生成方法, 其特 征在于, 包 含: 获取知识图谱; 所述知识图谱包括子图集合, 每个子图包括实体集合、 关系集合和三元 组集合; 根据所述知识图谱, 通过图变换网络模型, 获取 各个子图的子图向量; 获取问句数据集; 根据所述知识图谱和所述问句数据集, 基于相似度获取 各个子图的外 部问句; 获取五何问题类型参数; 根据所述五何问题类型参数和所述外部问句, 通过BiLSTM神经网络模型, 获取外部增 强向量; 根据所述子图向量和所述外 部增强向量, 通过指针生成网络模型, 获取问句。 2.根据权利要求1所述的知识图谱的问句生成方法, 其特征在于, 根据所述知识图谱, 通过图变换网络模型, 获取 各个子图的子图向量, 包括: 将子图的实体集 合输入词向量模型, 获取子图的实体向量 集合; 将所述实体向量集合输入图注意力网络模型, 获取各个实体的中间层向量 其中, 所 述中间层向量的计算模型为: 式中, 为实体e的中间层向量、 ve为实体e的实体向量、 ∨表示将图注意力网络模型中 的N个注意力头的信息进行串联、 代表在第n个注意力头的注意力参数 是图注意力网络模型中实体ei与实体ej的注意力参数、 为第n 头注意力头中的特征矩阵、 为实体ej的实体向量、 为实体ei的实体向量、 WQ和WK为计算 注意力参数的特 征矩阵、 为实体ei在知识图谱中的邻居节点 集合; 根据所述各个实体的中间层向量, 通过所述图注意力网络模型的正则化层和前馈神经 网络层, 获取 各个实体的输出向量表示 其中, 所述输出向量表示的计算模型为: FFN(x)=W1×(f(W2×x+b1)+b2) 式中, 为实体e的输出向量表示、 LayerNorm为归一化函数、 v ’e为实体e的中间层向量 经过LayerNorm函数及前馈神经网络层FFN得到的隐层向量、 W1以及W2是前馈神经网络中 的特征矩阵、 x代 表前馈神经网络层的输入信息、 b1以及b2为偏置值; 根据所述各个实体的输出向量表示, 得到子 图的所述子 图向量, 从而获取各个子 图的权 利 要 求 书 1/4 页 2 CN 114925186 A 2子图向量。 3.根据权利要求1所述的知识图谱的问句生成方法, 其特征在于, 根据 所述知识图谱和 所述问句数据集, 基于相似度获取 各个子图的外 部问句, 包括: 将子图的关系集 合输入到Pad dleNLP“解语”模型, 获取关系词类标注信息集 合; 将所述问句数据集输入到Pad dleNLP“解语”模型, 获取问句词类标注信息集 合; 计算所述问句词类标注信息集合中的各个词类标注信息和所述关系词类标注信息集 合的相似度 其中, 相似度计算模型为: 式中, 代表关系词类标注信息 与问句词类标注信息pbq的交集 的词类标注信息个数、 代表关系词类标注信息 与问句词类标注信 息pbq的并集的词类标注信息个数; 根据所述相似度, 获取子图与所述问句数据集的相似度集 合; 将所述相似度集合中最大的相似度 所对应的问句作为子图的外部问句, 从而获取各个 子图的外 部问句。 4.根据权利要求1所述的知识图谱的问句生成方法, 其特征在于, 根据 所述五何问题类 型参数和所述外 部问句, 通过Bi LSTM神经网络模型, 获取外 部增强向量, 包括: 根据所述五何问题类型参数和所述外部问句, 通过词向量模型, 获取五何问题类型向 量和第一分词向量 集合; 将所述第一分词向量集合中的各个词向量和所述五何问题类型向量进行向量纵向拼 接, 获取拼接词向量 集合; 将所述拼接词向量 集合输入Bi LSTM神经网络模型, 获取外 部增强向量 集合。 5.根据权利要求4所述的知识图谱的问句生成方法, 其特征在于, 根据 所述五何问题类 型参数和所述外部问句, 通过词向量模 型, 获取五何问题类型向量和第一分词向量集合, 包 括: 将所述五何问题类型参数输入o neHot词向量模型, 获取五何问题类型向量; 将所述外部问句输入PaddleNLP “解语”模型, 获取外部问句的第一分词集合, 从而获取 各个子图的第一分词集 合; 将所述第一分词集 合输入Gl oVe词向量模型, 获取第一分词向量 集合。 6.根据权利要求5所述的知识图谱的问句生成方法, 其特征在于, 根据 所述子图向量和 所述外部增强向量, 通过指针生成网络模型, 获取问句, 包括: 获取各个子图对应的目标问句, 并将所述目标问句输入jieba分词工具, 获取第二分词 集合; 将所述第二分词集 合输入词向量模型, 获取第二分词向量 集合; 提取所述知识图谱的实体集合和关系集合以及所述第 二分词集合中的所有词语, 获取 词典;权 利 要 求 书 2/4 页 3 CN 114925186 A 3
专利 一种知识图谱的问句生成方法、装置、设备和存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:55:51
上传分享
举报
下载
原文档
(1013.6 KB)
分享
友情链接
GB-T 16277-2021 道路施工与养护机械设备 沥青混凝土摊铺机.pdf
公安部 网络安全等级保护条例 征求意见稿 .pdf
CSA 大数据安全和隐私手册中文版.pdf
专利 一种用于堡垒机的数据库高危指令审核方法和系统.PDF
DB36-T 1584-2022 电子政务外网企事业单位接入技术规范 江西省.pdf
ISO 21511 2018 Work breakdown structures for project and programme management.pdf
GB-T 32146.2-2015 检验检测实验室设计与建设技术要求 第2部分:电气实验室.pdf
CCSP OSG 云安全专业认证 第三版 中文.pdf
GB-T 21062.2-2007 政务信息资源交换体系 第2部分:技术要求.pdf
GB-T 32082-2015 船舶管路用彩色识别标志.pdf
NB-T 31042-2019 海上永磁风力发电机变流器技术规范.pdf
YD-T 交互式应用程序安全测试工具能力要求.pdf
GB-T 11107-2018 金属及其化合物粉末 比表面积和粒度测定 空气透过法.pdf
GB-T 8960-2015 涤纶牵伸丝.pdf
T-CGMA 100.001-2016 闭式冷却塔.pdf
GB-T 41267-2022 网络关键设备安全技术要求 交换机设备.pdf
DB52-T 1401.23-2020 山地旅游 第23部分:漂流服务规范 贵州省.pdf
DB2数据库安全配置基线.doc
GB-T 35437-2017 星载光电跟踪成像系统通用规范.pdf
SY-T 0003-2021 石油天然气工程制图规范.pdf
1
/
3
20
评价文档
赞助2.5元 点击下载(1013.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。