(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210856151.1
(22)申请日 2022.07.21
(71)申请人 北斗天下卫星导 航有限公司
地址 100000 北京市丰台区南四环西路186
号四区7号楼7层18室
(72)发明人 何燕贤 张研 张龙平 高志军
陈军 徐仕儒 陈锦
(74)专利代理 机构 北京超凡宏宇专利代理事务
所(特殊普通 合伙) 11463
专利代理师 张萍
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/901(2019.01)
(54)发明名称
一种基于领域知识图谱的通用热点分析方
法和系统
(57)摘要
本发明提供了一种基于领域知识图谱的通
用热点分析方法和系统, 涉及领域知识图谱的技
术领域, 包括: 获取待分析领域的自然语言文本,
并通过领域专家确定出自然语言文本中的历史
目标领域实体和历史目标领域实体之间的关联
关系; 基于历史目标领域实体和历史目标领域实
体之间的关联关系, 构建领域知识图谱, 并将领
域知识图谱存储至图数据库; 基于图数据库, 构
建领域网络向量结构, 并计算出领域网络向量结
构内各个节点的初始热点值; 基于初始热点值、
最终节点问题优化模型和自我指向陷阱问题优
化模型, 计算出领域网络向量结构的第一目标热
点值和第二目标热点值, 解决现有的热点分析方
法的分析效率和分析结果准确性较低的技术问
题。
权利要求书2页 说明书8页 附图2页
CN 114936295 A
2022.08.23
CN 114936295 A
1.一种基于领域知识图谱的通用热点分析 方法, 其特 征在于, 包括:
获取待分析领域的自然语言文本, 并通过领域专家确定出所述自然语言文本中的历史
目标领域实体和所述历史目标 领域实体之间的关联关系;
基于所述历史目标领域实体和所述历史目标领域实体之间的关联关系, 构建领域知识
图谱, 并将所述领域知识图谱 存储至图数据库;
基于所述图数据库, 构建领域网络向量结构, 计算出所述领域网络向量结构内各个节
点的初始热点 值;
基于所述初始热点值和最终节点问题优化模型, 计算出所述领域网络向量结构的第 一
目标热点值, 以及基于所述初始热点值和自我指向陷阱问题优化模型, 计算出所述领域网
络向量结构的第二目标 热点值。
2.根据权利要求1所述的方法, 其特 征在于,
所述最终节点问题优化模型用于解决在所述领域网络向量结构存在没有出链的目标
领域实体时, 所述领域网络向量结构的初始热点 值为0的问题;
所述自我指向陷阱问题优化模型用于解决所述领域网络向量结构的权重偏向最终目
标领域实体的问题, 其中, 所述最终目标领域实体为所述 目标领域实体中关联关系指向自
身且与中间目标领域 实体之间不存在出链的历史目标领域实体, 所述中间目标领域 实体为
所述历史目标 领域实体中出 所述最终目标 领域实体以外的目标 领域实体。
3.根据权利要求2所述的方法, 其特征在于, 通过领域专家确定出所述自然语言文本中
的历史目标 领域实体和所述历史目标 领域实体之间的关联关系, 包括:
通过所述领域专 家, 确定出 所述待分析 领域包含的实体和所述实体之间的关联关系;
利用BERT模型和所述自然语言文本, 确定出所述待分析领域包含的实体 中的历史目标
领域实体, 并确定出 所述实体之间的关联关系中所述历史目标 领域实体之间的关联关系。
4.根据权利要求2所述的方法, 其特征在于, 基于所述图数据库, 构建领域网络向量结
构, 计算出 所述领域网络向量结构内各个节点的初始热点 值, 包括:
获取步骤, 获取利用BERT模型和所述自然语言文本确定出的当前目标领域实体和所述
当前目标领域实体之间的关联关系, 并将所述当前目标领域 实体和所述当前目标领域实体
之间的关联关系存储至所述图数据库, 其中, 所述当前目标领域实体为所述图数据库中不
包含的目标 领域实体;
构建步骤, 基于所述历史目标领域实体、 所述历史目标领域实体之间的关联关系、 所述
当前目标领域实体和所述当前目标领域实体之间的关联关系, 构建中间领域网络向量结
构;
计算步骤, 基于所述中间领域网络向量结构和热点计算模型, 计算出所述中间领域网
络向量结构中各个节点的中间热点 值;
将所述当前目标领域实体和所述历史目标领域实体的集合确定为所述历史目标领域
实体, 重复执行所述获取步骤、 所述构建步骤和 计算步骤, 直到所述中间热点值不变, 将所
述中间热点值不变时对应的中间领域网络向量结构确定为所述领域网络向量结构, 并将所
述中间热点 值不变时的中间热点 值确定为所述初始热点 值。
5.根据权利要求 4所述的方法, 其特 征在于,
所述初始热点 值的计算公式为:权 利 要 求 书 1/2 页
2
CN 114936295 A
2, 其中,
为重复执行第
次时中间网络向量结构中
的节点a的中间热点值; Hot(Ti)为重复执行第
次时, 中间领域网络向量结构中除节点a以
外的其他指向节点a的节点的初始热点值, L(Ti)为是重复执行第
次时中间领域网络向量
结构中除节点a以外的其 他指向节点a的节点的出链数。
6.根据权利要求2所述的方法, 其特 征在于,
所述最终节点问题优化模型的表达式为
, 其中, Hot为所述第一
目标热点值,
为所述初始热点值对应的转移概率矩阵, n为M的行数或列数; V为所述初始
热点值对应的矩阵, m为用0和1填充的矩阵, 且m的大小与M相等, T为m的倒置矩阵。
7.根据权利要求6所述的方法, 其特 征在于,
所述自我指向陷阱问题优化模型的表达式为
, 其中, Hot
为所述最终目标领域实体
的第二目标热
点值; β 为所述领域网络向量结构中最终目标领域实体
实体的出链概率; 1 ‑ β 为所述领
域网络向量结构中最终目标领域实体
随机指向除最终目标领域实体
以外的其他目标领
域实体的概 率; eeT 为由1填满n*n矩阵。
8.一种基于领域知识图谱的通用热点分析系统, 其特征在于, 包括: 获取单元, 构建单
元, 计算单 元和优化单 元, 其中,
所述获取单元, 用于获取待分析领域的自然语言文本, 并通过领域专家确定出所述自
然语言文本中的历史目标 领域实体和所述历史目标 领域实体之间的关联关系;
所述构建单元, 用于基于所述历史目标领域实体和所述历史目标领域实体之间的关联
关系, 构建领域知识图谱, 并将所述领域知识图谱 存储至图数据库;
所述计算单元, 用于基于所述图数据库, 构建领域网络向量结构, 计算出所述领域网络
向量结构内各个节点的初始热点 值;
所述优化单元, 用于基于所述初始热点值和最终节点问题优化模型, 计算出所述领域
网络向量结构内各个节点的第一目标热点值, 以及基于所述初始热点值和自我指向陷阱问
题优化模型, 计算出 所述领域网络向量结构内各个节点的第二目标 热点值。
9.一种电子设备, 其特征在于, 包括存储器以及处理器, 所述存储器用于存储支持处理
器执行权利要求 1至7任一项 所述方法的程序, 所述处理器被配置为用于执行所述存储器中
存储的程序。
10.一种计算机可读存储介质, 计算机可读存储介质上存储有计算机程序, 其特征在
于, 计算机程序被处 理器运行时执 行上述权利要求1至7任一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114936295 A
3
专利 一种基于领域知识图谱的通用热点分析方法和系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:54:39上传分享