说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210639007.2 (22)申请日 2022.06.08 (71)申请人 昆明理工大 学 地址 650500 云南省昆明市呈贡区景明南 路727号 (72)发明人 余正涛 汤俊飞 宋燃 相艳  (74)专利代理 机构 昆明隆合知识产权代理事务 所(普通合伙) 53220 专利代理师 何娇 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) (54)发明名称 一种基于语义感知的低资源知识图谱实体 对齐方法 (57)摘要 本发明涉及一种基于语义感知的低资源知 识图谱实体对齐方法, 属于自然语 言处理技术领 域。 本发明首先使用预训练模型初始化实体和关 系特征, 采用伪语句使 得预训练模 型可以充分利 用上下文信息。 然后, 建立一个对偶关系子图用 以挖掘知识图谱关系中的语义信息, 该图使用原 始知识图谱中的关系作为节点构建。 最后使用 GAT聚合对偶关系子图并将所得的关系特征与实 体特征融合作为实体聚合中实体特征的初始向 量, 并计算来自两个知识图谱实体间的相似度。 本发明在知识 图谱实体对齐任务上取得了较好 的效果。 权利要求书1页 说明书6页 附图1页 CN 115080761 A 2022.09.20 CN 115080761 A 1.一种基于语义感知的低资源知识图谱实体对齐方法, 其特征在于: 所述方法的具体 步骤如下: Step1、 使用知识图谱中三元组构建伪语句, 之后使用预训练模型得到实体和关系的初 始特征; Step2、 对原 始知识图谱构建对偶关系图; Step3、 使用图注意力网络聚合对偶关系图得到关系的最终表示, 即 关系特征; Step4、 将关系特 征与实体特 征拼接降维得到实体聚合的初始向量; Step5、 通过图卷积网络聚合实体的邻居特征, 并计算源知识图谱中实体与目标知识图 谱间的实体相似度; Step6、 根据相似度排列实体, 得到源知识图谱中实体在目标知识图谱中的对应实体。 2.根据权利要求1所述的基于语义感知的低资源知识图谱实体对齐方法, 其特征在于: 所述Step1中, 首先使用知识图谱中的三元组构建伪语句, 然后将其送入预训练模型中得到 实体的初始特 征矩阵E0和关系的初始特 征矩阵Xinit。 3.根据权利要求1所述的基于语义感知的低资源知识图谱实体对齐方法, 其特征在于: 所述Step2中, 首先使用原始知识图谱中的关系 作为对偶关系图的节 点, 然后根据关系间共 享头实体和尾实体的数量得到关系权 重并将其作为对偶关系图的边。 4.根据权利要求1所述的基于语义感知的低资源知识图谱实体对齐方法, 其特征在于: 所述Step3中, 使用有修改的图注意力网络聚合对偶关系图得到 关系特征, 之后将不同三元 组中的同一关系按列拼接并加权求和得到维度统一的关系表示矩阵X。 5.根据权利要求1所述的基基于语义感知的低资源知识图谱实体对齐方法, 其特征在 于: 所述Step4中, 将关系表示矩阵X和实体的初始特征矩阵E0按行拼接后使用全连接层神 经网络得到最终的实体初始 表示Einit。 6.根据权利要求1所述的基于语义感知的低资源知识图谱实体对齐方法, 其特征在于: 所述Step2中构建对偶关系图的具体步骤如下: Step2.1、 从知识图谱G中把所有关系提出, 作为对偶关系图Gr的节点, 用VT表示对偶关 系图Gr中的关系集 合; Step2.2、 如果两个关系共享同一个头实体或尾 实体, 则将 其相连, 并标记为lij, 其中i, j分别为两个关系; Step2.3、 根据共享头实体的数量与关系所有头实体的数量的比值Hij和共享尾实体的 数量与关系所有尾实体的数量的比值Tij得到lij的权重值wij。权 利 要 求 书 1/1 页 2 CN 115080761 A 2一种基于语 义感知的低资源知识图谱 实体对齐方 法 技术领域 [0001]本发明涉及基于语义感知的低资源知识图谱实体对齐方法, 属于自然语言处理技 术领域。 背景技术 [0002]随着知识图谱的提出, 自然语言处理中的多个任务在其的加入下取得了重大的突 破。 然而, 知识图谱不能涵盖现实世界中的所有事物。 因此人们提出知识图谱补 全来解决这 个问题, 而实体对齐作为知识图谱补全中的一部分, 通常被用于寻找不同来源的知识图谱 中相同的现实事物。 目前的方法主要集中在通过KGs的结构学习实体的嵌入。 大多 数实体对 齐模型都是为资源丰富的语言设计的, 这些语言有大量的资源, 如平行语料库和预训练的 语言模型。 然而, 低 资源语言KGs在目前的模型中表现不佳, 因此受到的关注较少。 最近, 一 些研究考虑将关系信息和属性融合到实体表示中, 以提高实体对齐性能。 然而, 尽管他们在 模型中使用了 关系信息, 但关系语义往往被忽略。 为了解决这些问题, 我们提出了一种新型 的语义感知图神经网络, 即SGNN, 用于实体对齐。 为了充分利用关系的上下文信息, 我们使 用预训练的模型来产生实体和关系的伪句子表示。 我们的方法还通过图神经网络从连接的 关系中探索语义信息 。 发明内容 [0003]本发明提供了一种基于语义感知的低资源知识图谱实体对齐方法, 以用于低资源 语言的知识图谱实体对齐问题, 本发明在 知识图谱实体对齐任务上 取得了较好的效果。 [0004]本发明的技术方案是: 一种基于语义感知的低资源知识图谱实体对齐方法, 所述 方法的具体步骤如下: [0005]Step1、 首先从维基百科中获取实体信息和关系信息, 之后从获取的数据中过滤出 同时拥有汉越、 汉泰、 泰越语言标签的实体和关系, 之后使用广度优 先策略构建三个知识图 谱; [0006]Step2、 使用构建好的知识图谱中的三元组直接拼接得到伪语句, 之后将伪语句送 入预训练语言模型中得到实体和关系的预训练好的初始特 征表示; [0007]Step3、 建立对偶关系图, 并使用图注意力网络对关系图中的节点进行邻居信息的 聚合并最 终输出各个关系的表示; 所述Step3中, 使用有修改 的图注意力网络聚合对偶关系 图得到关系特征, 之后 将不同三元组中的同一关系按列拼接并加权求和得到维度统一的关 系表示矩阵X。 [0008]Step3.1、 从知识图谱G中把所有关系提出, 作为对偶关系图Gr的节点, 用VT表示对 偶关系图Gr中的关系集合。 如 果两个关系共享同一个头实体或尾实体, 则将其相连, 并标记 为lij(其中i, j分别为两个关系)。 根据共享头实体的数量与关系所有头实体的数量的比值 Hij和共享尾实体的数量与关系所有尾实体的数量的比值Tij可以得到lij的权重值wij, 具体 的计算步骤如下:说 明 书 1/6 页 3 CN 115080761 A 3

.PDF文档 专利 一种基于语义感知的低资源知识图谱实体对齐方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于语义感知的低资源知识图谱实体对齐方法 第 1 页 专利 一种基于语义感知的低资源知识图谱实体对齐方法 第 2 页 专利 一种基于语义感知的低资源知识图谱实体对齐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。