说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433516.X (22)申请日 2022.04.24 (71)申请人 国网上海市电力公司 地址 200122 上海市浦东 新区自由贸易试 验区源深路1 122号 (72)发明人 毛玮韵 魏本刚 徐湘忆 陈璐  吴天逸 彭政睿 任辰  (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 翁惠瑜 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于知识图谱的应答方法、 电子 设备及 介质 (57)摘要 本发明涉及一种基于知识图谱的应答方法、 电子设备及介质, 方法包括以下步骤: S1、 获取用 户问题; S2、 将用户问题输入训练好的语义提取 模型, 获得问题 语义信息; S3、 对问题 语义信息进 行命名实体识别, 获得问题命名实体; S4、 根据问 题命名实体在预先构建的知识图谱中进行匹配, 输出问题答案; 知识图谱的构建过程包括: 采集 若干条应答历史数据, 构成历史数据集, 并输入 训练好的语义提取模型, 获得语义数据集; 对语 义数据集进行命名实体识别, 获得若干个问题语 义向量, 构成知 识图谱。 与现有 技术相比, 本发明 具有精度高、 准确率高和速度快等优点。 权利要求书2页 说明书6页 附图1页 CN 114880481 A 2022.08.09 CN 114880481 A 1.一种基于知识图谱的应答方法, 其特 征在于, 包括以下步骤: S1、 获取用户问题; S2、 将用户问题输入训练好的语义 提取模型, 获得问题语义信息; S3、 对问题语义信息进行命名实体识别, 获得问题命名实体; S4、 根据问题命名实体在预 先构建的知识图谱中进行匹配, 输出问题答案; 其中, 所述的知识图谱的构建过程包括: 采集若干条应答历史数据, 构成历史数据集; 将历史数据集输入训练好的语义 提取模型, 获得语义数据集; 对语义数据集进行命名实体识别, 获得若干个问题语义向量, 构 成知识图谱, 所述的问 题语义向量的表达式为: (实体, 关系, 实体); 所述的步骤S4的具体过程包括: 根据问题命名实体在知识图谱中匹配问题语义向量, 将匹配到的问题语义向量作为问 题答案并输出。 2.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 训练语义提取模 型的损失函数表达式为: 其中, x为输入向量, w为特征权重, n为样本 数量, y为期望输 出值, hw(x)为一般线 性回归 函数的假设函数, hw(x)的表达式为: 其中, b为噪声参数。 3.根据权利要求2所述的一种基于知识图谱的应答方法, 其特征在于, 所述的语义提取 模型的每次迭代训练中, 通过随机斜 率下降法和误差反向传播 算法对特 征权重进行更新。 4.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 所述的步骤S3的 具体过程包括: 通过隐马尔可 夫模型的隐含序列确定问题语义信息中的可观测状态; V={v1, ..., vM} H={h1, ..., hN} O={o1, ..., oT} I={i1, ..., iT} 其中, V和H分别为自然语言集合和隐藏状态合集, 其中v表示字, M为已知字数, h代表隐 状态, N为状态数量, O为可观测状态序列, I为隐含状态序列, o表示已观测 到的文本, i为已 观测到的文本对应的隐状态, T为字数; 计算隐马尔可 夫模型初始化隐状态的概 率分布 π: π =P(i1=hi) 其中, P(i1=hi)为序列中第一个字i1的实体标记为hi的概率;权 利 要 求 书 1/2 页 2 CN 114880481 A 2计算用于表示 不同状态间转移的概 率的状态转移 矩阵Aij: 计算用于表示隐状态生成观测结果的观测概 率矩阵Bjk: Bjk=P(ot=vk|it=hj) 其中, P(ot=vk|it=hj)表示t时刻实体标记hi对应到文字vk的概率, vk∈H, hi, j∈H; 基于概率 分布 π、 状态转移矩阵Aij以及观测概率矩阵Bjk, 通过目标函数得整体的序列和 隐状态发生的概 率最优化, 得到第t时刻的最优标注; 所述的目标函数为: argmax( π, A, B)=P(i1...ito1...ot| π, A, B) 通过维特比算法中的动态规划算法找到全局最优的标记序列, 作为命名实体: 其中, 为全局最优的标记序列。 5.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的隐马尔可 夫模型初始化隐状态的概 率分布 π 的计算公式为: π =P(i1=hi) 其中, P(i1=hi)为序列中第一个字i1的实体标记为hi的概率。 6.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的状态转移 矩阵A的计算公式为: Aij=P(it+1=hj|it=hi) 其中, Aij为状态转移矩阵, P(it+1=hj|it=hi)表示t时刻实体标记为hi, 而在t+1时刻实 体标记转换到 hj的概率。 7.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的观测概率 矩阵Bjk的计算公式为: Bjk=P(ot=vk|it=hj) 其中, P(ot=vk|it=hj)表示t时刻实体标记hi对应到文字vk的概率, vk∈H, hi, j∈H。 8.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 所述的步骤S4的 具体过程包括: 通过索引在知识图谱中搜索问题命名实体, 返回与问题命名实体相关的候选问题语义 向量, 针对问题和关系、 问题和答案进 行联合语义表征, 然后从候选问题语义向量中选择得 分最高的候选问题语义向量作为 答案。 9.一种电子设备, 其特征在于, 包括存储器和 处理器, 所述存储器存储有计算机程序, 所述处理器调用所述 程序指令能够执 行如权利要求1至8任一所述的应答方法。 10.一种计算机可读存储介质, 其特征在于, 包括计算机程序, 所述计算机程序能够被 处理器执行以实现如权利要求1 ‑8任一所述的应答方法。权 利 要 求 书 2/2 页 3 CN 114880481 A 3

.PDF文档 专利 一种基于知识图谱的应答方法、电子设备及介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的应答方法、电子设备及介质 第 1 页 专利 一种基于知识图谱的应答方法、电子设备及介质 第 2 页 专利 一种基于知识图谱的应答方法、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:53:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。