说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210531897.5 (22)申请日 2022.05.17 (71)申请人 中国石油大 学 (华东) 地址 266580 山东省青岛市黄岛区长江西 路66号 (72)发明人 徐九韵 张文洁  (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于自适应图卷积的知识图谱文字属 性值补全方法 (57)摘要 本发明属于知识图谱补 全领域, 针对知识图 谱中存在的文字属性值缺失问题, 提出了一种基 于自适应图卷积的知识 图谱文字属性值补全方 法(AGC‑AC)。 主要分为三个步骤: 首先进行数据 预处理, 将数据集处理为图卷积所需要的数据类 型, 即度矩阵D, 邻接矩阵A以及特征矩阵F; 然后 将原有属性知识 图谱中的节点结合自适应图卷 积神经网络生成的特征表示进行划分, 得到最佳 节点簇; 最后利用Jaccard相似 性度量, 找出同一 簇中与目标节 点最为相似的节 点, 目标节点缺失 的属性值即为该节点的该属性 值。 权利要求书2页 说明书4页 附图1页 CN 115329090 A 2022.11.11 CN 115329090 A 1.一种基于自适应图卷积的知识图谱文字属性 值补全方法主 要包括以下三个步骤: A.数据预处理: 将离散数据转化为连续型数据, 并将数据集处理为图卷积所需要的类 型, 即度矩阵D, 邻接矩阵A以及特征矩阵F, 方便后期对节点的聚类划分, 其中特征矩阵F利 用各节点属性取值的映射进行编码, 例如{ ‘男’: 0,‘女’: 1}。 B.图聚类: 将原有属性知识图谱中的节点结合自适应图卷积神经网络生成的特征表示 进行划分, 得到最佳节点簇 。 首先对属性图中的相关内容进行定义如下: 定义1: 将属性知识图谱定义为无向图G=(V,E,Λ,X), 其中, V={v1,v2,L,vn}为节点 集, |V|=n, E为边集可以被表示为邻接矩阵 Λ={a1,a2L,ag}为节点的属性集 合, |Λ|=g, X=[x1,x2,L,xn]T∈?n×d为所有节点的特征矩阵, 为节点vi的一个实值向 量。 则图聚类问题可以定义 为如下形式: 定义2: 对于给定的属性知识图谱G, 图聚类的目的是将G中包含的节点划分成m个簇C= {C1,C2,L,Cm}, 其中Cm是节点集合的第m个划分。 在图聚类的过程中利用谱聚类进一步将聚 类问题转换为图的节点划分问题, 主 要步骤如下: 1、 根据度矩阵D、 邻接矩阵A, 计算对称归一 化的图拉普拉斯矩阵 2、 根据 计算X的k阶图卷积表示。 3、 计算节点之间的成对相似性 4、 计算权 重矩阵 5、 使用k‑means方法进行聚类, 得到C(t)个节点划分, 其 中t的初始值为0, 并随迭代逐次 加1。 6、 自适应 图聚类的主要思想是得到类内距离足够小, 类间距离足够大的节点划分, 故 需计算节点的类间距离 随着划分簇的数量k的 增大, 聚类效果逐渐提升, 但当k超过一定阈值时, 不同簇 之间的节点就会混合在一起, 出现 过平滑的现象, 故利用d_intra(t ‑1)=intra(C(t))‑intra(C(t‑1))限制迭代次数, 当d_ intra (t‑1)>0时停止迭代, 进 而确定最优k 值。 C.属性补全: 对于图聚类过程中得到的聚类划分C={C1,C2,L,Ci}, 当目标节点vi(待预测节点)位于 簇Ci中时, 假设相似的节点具有相同的属性值, 利用Jaccard计算目标节点与簇内具有ai属 性的其他节点的相似度, 则目标节点的待补全属性ai的预测值εi即为与其相似度最高的节 点的属性 值。 本发明对比已有技 术具有以下显著优点: 1、 提出了知识图谱中实体文字属性值的预测问题。 为了简化对问题的描述, 使用 “文字 属性补全 ”来描述问题。 2、 进一步将属性分为两类: 文字属性和数字属性, 并使用图聚类方法处理文字属性值 的补全问题。 3、 提出了一种基于自适应 图聚类的实体属性补全方法, 该方法通过自适应地调整K值权 利 要 求 书 1/2 页 2 CN 115329090 A 2来获得最合适的节点划分, 并且可以同时使用图结构和节点属性信息预测缺 失的文字属性 值。权 利 要 求 书 2/2 页 3 CN 115329090 A 3

.PDF文档 专利 一种基于自适应图卷积的知识图谱文字属性值补全方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自适应图卷积的知识图谱文字属性值补全方法 第 1 页 专利 一种基于自适应图卷积的知识图谱文字属性值补全方法 第 2 页 专利 一种基于自适应图卷积的知识图谱文字属性值补全方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。