(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210497722.7
(22)申请日 2022.05.09
(71)申请人 江苏有米云智慧科技有限公司
地址 225000 江苏省扬州市经济技 术开发
区扬子江中路18 8号A-11F
(72)发明人 高峰 曾燕 顾进广 刘茂福
周杰 王昆 潘巧玲 陆紫雯
(74)专利代理 机构 武汉科皓知识产权代理事务
所(特殊普通 合伙) 42222
专利代理师 严彦
(51)Int.Cl.
G06N 5/04(2006.01)
G06F 40/30(2020.01)
G06F 16/36(2019.01)
(54)发明名称
一种基于规则嵌入表示的多空间语义数据
流推理方法
(57)摘要
本发明提供一种基于规则嵌入和上下文感
知的动态知识 推理方法, 首先实现规则与事实的
联合嵌入表示, 然后针对不同的语义数据流推理
需求和场景实现设置不同的动态推理过程, 包括
基于平行语义空间推理的规则嵌入动态推理, 基
于上下文感知 的规则嵌入动态推理和基于规则
泛化学习的动态 推理。 本发明对融合了规则学习
的联合嵌入模型做出改进以适应高速变化的语
义数据流推理查询, 该方案相比传统的流推理引
擎可以在保证较高推理准确性的前提下提升复
杂推理速度, 其知识嵌入表示方法适用于1 ‑1至
N‑N实体关系嵌入场景, 同时其规则学习方法适
用于弱规则约束下的动态推理场景。
权利要求书1页 说明书12页 附图5页
CN 115438789 A
2022.12.06
CN 115438789 A
1.一种基于规则嵌入和上下文感知的动态知识推理方法, 其特征在于: 首先实现规则
与事实的联合嵌入表示, 然后针对不同的语义数据流推理需求和 场景实现设置不同的动态
推理过程, 包括基于平行语义空间推理的规则嵌入动态推理, 基于上下文感知的规则嵌入
动态推理和基于规则泛化学习的动态推理;
所述基于平行语义空间推理的规则嵌入动态推理, 是针对头尾实体比例为1:1的推理
场景, 结合语义数据流处理平台和知识表示学习进 行处理, 实现过程包括首先, 对联合 嵌入
模型KALE扩展, 实现复杂规则和事实元组的统一表示推理框架; 然后实现嵌入空间的构建
和选择; 最后实现基于联合嵌入模型 的动态推理训练, 并根据训练输出模型实现实时知识
推理;
所述基于上下文感知的规则嵌入动态推理, 是针对头尾实体比例 1对多或多对多的推
理场景, 进 行基于上下文感知的多语义空间融合表示知识推理, 实现过程包括首先, 在多空
间联合嵌入模型基础上扩展, 实现上下文感知的动态推理框架; 其次, 对实体关系及其类型
与规则关联上下文进 行建模和表示; 第三, 进行上下文向量空间和规则嵌入空间的集成; 最
后, 实现对增量更新和累计偏移感知的支持;
所述基于规则泛化学习的动态推理, 是针对弱规则约束或规则不全的推理场景, 依据
规则样例来进行规则学习, 从而泛化规则并扩展推理结果, 实现过程包括在知识表示学习
的实时推理基础上进行规则泛化研究, 并结合语义数据流处理平台, 实现弱规则约束下 的
不确定性实时知识推理。
2.根据权利要求1所述基于规则嵌入和上下文感知的动态知识推理方法, 其特征在于:
所述基于平行语义空间推理的规则嵌入动态推理包括以下步骤:
步骤1, 构建动态联合嵌入 模型整体训练框架;
步骤2, 基于语义与结构关联相结合的子嵌入空间生成方法, 覆盖2跳范围内的语义和
结构关联空间;
步骤3, 基于三元组索引的子嵌入空间选择, 基于新增三元组及其关联规则选择更新的
自嵌入空间;
步骤4, 制定基于间距模型的目标函数与方案;
步骤5, 实现基于 C‑SPARQL引擎的动态联合嵌入 模型扩展和实时推理。
3.根据权利要求1所述基于规则嵌入和上下文感知的动态知识推理方法, 其特征在于:
所述基于上 下文感知的规则嵌入动态推理包括以下步骤:
步骤1, 涵盖2跳距离的实体及其类型 上下文子图构造;
步骤2, 涵盖2跳距离的同向路径、 父关系类型和规则关联的关系上 下文子图构造;
步骤3, 多向量 集成和规则联合嵌入;
步骤4, 基于上下文子图的增量更新, 并动态维护累计向量偏移量, 当累计偏移量超过
限定值时进行全局嵌入空间更新。
4.根据权利要求1或2或3所述基于规则嵌入和上下文感知的动态知识推理方法, 其特
征在于: 所述 规则泛化学习的动态推理包括以下步骤,
步骤1, 面向OW L规则的泛化学习模型;
步骤2, 基于多空间增量训练的NRE推理。权 利 要 求 书 1/1 页
2
CN 115438789 A
2一种基于规则嵌入表示的多空间语 义数据流推 理方法
技术领域
[0001]
[0002]本发明属于知识图谱和数据流处理领域, 具体而言, 是将知识表示学习方法用于
动态知识推理任务中, 实现在高速知识更新场景 下的语义数据流推理技 术。
背景技术
[0003]随着移动互联网、 大数据、 物联网、 社交网络等技术的发展, 越来越多的需要对高
速实时数据流进 行分析和处理。 传统的数据流处理手段主要根据数据流中的数据结构或者
取值进行数据流的聚、 分类研究[1], 无法在语义和知识层面上进 行数据流的分析和推理。 在
知识图谱技术的支持下, 可以利用资源描 述框架(Resourc e Description Framework, RDF)
将语义和知识赋予数据流, 获得具有更好的可互操作性和可推理能力的语义数据流。 语义
数据流可以与静态的背景知识相结合 来进行查询和推理, 具有广泛的应用价 值。
[0004]近年来知识推 理领域取得了较多进展, 但 现有并行规则推 理机制在应对大规模图
谱时仍有不足[2]。 RDFox[3]提出了一种高性能的知识图谱查询推理机制, 并使用前后向结合
的方式进行删除一致性检查。 文献[4]提出了基于单链推导(Single ‑way Derivability)优
化的并行前向推理算法, 并且性能优于RDFox。 然而, 以上知识推理研究主要针对静态数据,
不适用于语义数据流。 国内对于语义数据流的研究主要集中在窗口与查询优化[5]、 事件处
理[6]和聚类分析[7], 对语义数据流的实时推理的研 究较少。 现有的语义数据流推理方案主
要基于确定性规则推导, 不确定性知识推理的目前尚无法应用到语义数据流上。 较早的不
确定性统计推理主要使用马尔可夫逻辑网[8]和概率软逻辑[9]等手段, 对本体频繁模式、 约
束和路径进 行分析, 从而得出推理结果,但这些方法仍然需要依赖实例化, 因此可计算性较
差[10]。
[0005]2013年, 在Mikolov等人提出了wor d2vec[11]词表示学习模型之后, 表示学习的方
式在知识图谱领域受到广泛关注。 随后Bordes等提出了TransE知识表示学习模型[12]。 该模
型将三元组中的关系看作平移向量, 表示头实体与尾实体之间的平移。 因为TransE模型的
参数简单, 计算复杂度低, 出现了大量基于TransE模 型改进和补充的知识表 示学习模 型, 如
TransH[13]、 TransR[14]和TranSpare[15]等。 虽然以上模型 都对Tran sE模型做 了相应的改进,
但是都是基于事实三元组的向量化而没有利用规则, 因此KALE[16]在TransE模型的基础上
建立了三元 组与规则的统一表 示框架。 然而KA LE无法进行增量更新。 此外, KALE也无法进 行
对规则本身的学习和泛化, 来满足弱规则约束下的推理需求。
[0006]动态图嵌入(Dynamic Graph Embedding)方法在知识表示学习的基础上研究对动
态变化的图进行推理。 动态嵌入方法通过在代价函数中引入时间正则化[17]或加入基于时
间层的注意力机制[18]等方法来捕捉图的变化特征, 往往运用在 新闻事件、 社交网络或无线
网络分析领域。 但 这种方法仍需要进 行全量训练, 因此主要研究提高对于低速变化(更新时
间以数日到数年计)图的预测准确性, 而非及时性。 通过对学习率的动态调整 可以缩短训练
时间[19], 这种方法依赖 于数据特性, 因此 可迁移性较差 。说 明 书 1/12 页
3
CN 115438789 A
3
专利 一种基于规则嵌入表示的多空间语义数据流推理方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:54:29上传分享