(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210818339.7
(22)申请日 2022.07.12
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 黄剑辉
(74)专利代理 机构 深圳翼盛智成知识产权事务
所(普通合伙) 44300
专利代理师 李玉婷
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06F 40/134(2020.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种文本匹配方法、 装置、 计算机设备和存
储介质
(57)摘要
本申请实施例公开了一种文本匹配方法、 装
置、 计算机设备和存储介质; 本申请实施例可 以
获取文本信息和知识图谱; 对文本信息进行编码
处理, 得到文本信息对应的语义特征, 以及对知
识图谱进行编码处理, 得到知识图谱对应的语义
特征; 基于文本信息对应的语义特征, 对知识图
谱对应的语义特征进行注意力特征提取, 得到知
识图谱对应的注意力特征; 基于知识图谱对应的
语义特征, 对文本信息对应的语义特征进行注意
力特征提取, 得到文本信息对应的注意力特征;
基于知识 图谱对应的注意力特征和文本信息对
应的注意力特征在知识 图谱中的至少一个参考
实体对象中筛选出和文本信息中的实体对象相
匹配的目标参考实体对象, 可以提高实体链指的
准确性。
权利要求书4页 说明书22页 附图5页
CN 115168609 A
2022.10.11
CN 115168609 A
1.一种文本匹配方法, 其特 征在于, 包括:
获取文本信 息和知识图谱, 所述文本信 息包括实体对象, 其中, 所述知识图谱包括至少
一个参考实体对象;
对所述文本信息进行编码处理, 得到所述文本信息对应的语义特征, 以及对所述知识
图谱进行编码处 理, 得到所述知识图谱 对应的语义特 征;
基于所述文本信 息对应的语义特征, 对所述知识图谱对应的语义特征进行注意力特征
提取, 得到所述知识图谱 对应的注意力特 征;
基于所述知识图谱对应的语义特征, 对所述文本信 息对应的语义特征进行注意力特征
提取, 得到所述文本信息对应的注意力特 征;
基于所述知识图谱对应的注意力特征和文本信息对应的注意力特征在所述知识图谱
中的至少一个参考实体对 象中筛选出和所述文本信息中的实体对 象相匹配的目标参考实
体对象。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述文本信息对应的语义特征,
对所述知识图谱对应的语义特征进行注意力特征提取, 得到所述知识图谱对应的注意力特
征, 包括:
对所述文本信 息对应的语义特征进行全连接映射, 得到所述文本信 息对应的全连接特
征;
对所述文本信 息对应的全连接特征进行归一化处理, 得到所述文本信 息对应的归一化
特征;
利用所述文本信息对应的归一化特征将所述知识图谱对应的语义特征进行注意力映
射, 得到所述知识图谱 对应的注意力特 征。
3.根据权利要求2所述的方法, 其特征在于, 所述对所述文本信 息对应的语义特征进行
全连接映射, 得到所述文本信息对应的全连接特 征, 包括:
确定所述知识图谱中参 考实体对象的数量信息;
基于所述数量信息, 生成全连接映射信息和偏置信息;
将所述文本信 息对应的语义特征和所述全连接映射信 息进行乘法运算, 得到文本信 息
的初始全连接特 征;
将所述文本信 息的初始全连接特征和所述偏置信 息进行加法运算, 得到所述文本信 息
的全连接特 征。
4.根据权利要求2所述的方法, 其特征在于, 所述文本信 息对应的归一化特征包括多个
归一化特征元素; 所述知识图谱的语义特征包括多个语义特征元素; 所述利用所述文本信
息对应的归一化特征将所述知识图谱对应的语义特征进行注意力映射, 得到所述知识图谱
对应的注意力特 征, 包括:
将知识图谱的语义特征元素和对应的文本信 息的归一化特征元素进行逻辑运算处理,
得到注意力特 征元素;
将注意力特 征元素进行整合, 得到所述知识图谱 对应的注意力特 征。
5.根据权利要求1所述的方法, 其特征在于, 所述基于所述知识图谱对应的语义特征,
对所述文本信息对应的语义特征进行注意力特征提取, 得到所述文本信息对应的注意力特
征, 包括:权 利 要 求 书 1/4 页
2
CN 115168609 A
2对所述知识图谱 对应的语义特 征进行统计运 算, 得到所述知识图谱 对应的统计特 征;
对所述知识图谱的统计特 征进行全连接映射, 得到所述知识图谱 对应的全连接特 征;
对所述知识图谱的全连接特征进行归一化处理, 得到所述知识图谱对应的归一化特
征;
利用所述知识图谱对应的归一化特征将所述文本信息对应的语义特征进行注意力映
射, 得到所述文本信息对应的注意力特 征。
6.根据权利要求1所述的方法, 其特征在于, 所述对所述文本信息进行编码处理, 得到
所述文本信息对应的语义特 征, 包括:
对所述文本信息进行 特征提取, 得到所述文本信息的初始特 征;
对所述文本信息的初始特 征进行特征挖掘, 得到所述文本信息的挖掘后特 征;
将所述文本信 息的挖掘后特征映射至预设语义空间中, 得到所述文本信 息对应的语义
特征。
7.根据权利要求1所述的方法, 其特征在于, 所述对所述知识图谱进行编码处理, 得到
所述知识图谱 对应的语义特 征, 包括:
对所述知识图谱进行识别, 得到所述知识图谱 对应的实体信息和实体关系信息;
对所述知识图谱的实体信 息和所述实体关系信 息进行空间特征提取, 得到所述实体信
息对应的空间特 征和所述实体关系信息对应的空间特 征;
将所述实体信 息对应的空间特征和所述实体关系信 息对应的空间特征进行融合, 得到
目标空间特 征;
将所述目标空间特 征映射至知识图谱语义空间, 得到所述知识图谱 对应的语义特 征。
8.根据权利要求1所述的方法, 其特征在于, 所述基于所述知识图谱对应的注意力特征
和文本信息对应的注意力特征在所述知识图谱中的至少一个参考实体对 象中筛选出和所
述文本信息中的实体对象相匹配的目标参 考实体对象, 包括:
将所述知识图谱对应的注意力特征和文本信 息对应的注意力特征进行融合, 得到 融合
后注意力特 征;
对所述融合后注意力特 征进行概 率分布映射, 得到概 率分布映射结果;
基于所述概率分布 映射结果在所述知识图谱中的至少一个参考实体对象中筛选出和
所述文本信息中的实体对象相匹配的目标参 考实体对象。
9.根据权利要求1所述的方法, 其特征在于, 所述知识图谱还包括不同参考实体对象之
间的关联关系; 所述方法还 包括:
确定所述知识图谱中和所述目标参 考实体对象具有的关联关系的关联实体对象;
采集所述关联实体对象的属性信息, 并对所述关联实体对象的属性信息进行清洗处
理, 得到所述关联实体对象的清洗后属性信息;
发送所述关联实体对象的清洗后属性信息 。
10.根据权利要求1所述的方法, 其特征在于, 所述对所述文本信 息进行编码处理, 得到
所述文本信息对应的语义特征, 以及对所述知识图谱进行编码处理, 得到所述知识图谱对
应的语义特 征, 包括:
利用预设文本匹配模型对所述文本信 息进行编码处理, 得到所述文本信 息对应的语义
特征, 以及利用所述预设文本匹配模型对所述知识图谱进行编码处理, 得到所述知识图谱权 利 要 求 书 2/4 页
3
CN 115168609 A
3
专利 一种文本匹配方法、装置、计算机设备和存储介质
文档预览
中文文档
32 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:55:10上传分享