说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433516.X (22)申请日 2022.04.24 (71)申请人 国网上海市电力公司 地址 200122 上海市浦东 新区自由贸易试 验区源深路1 122号 (72)发明人 毛玮韵 魏本刚 徐湘忆 陈璐 吴天逸 彭政睿 任辰 (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 翁惠瑜 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于知识图谱的应答方法、 电子 设备及 介质 (57)摘要 本发明涉及一种基于知识图谱的应答方法、 电子设备及介质, 方法包括以下步骤: S1、 获取用 户问题; S2、 将用户问题输入训练好的语义提取 模型, 获得问题 语义信息; S3、 对问题 语义信息进 行命名实体识别, 获得问题命名实体; S4、 根据问 题命名实体在预先构建的知识图谱中进行匹配, 输出问题答案; 知识图谱的构建过程包括: 采集 若干条应答历史数据, 构成历史数据集, 并输入 训练好的语义提取模型, 获得语义数据集; 对语 义数据集进行命名实体识别, 获得若干个问题语 义向量, 构成知 识图谱。 与现有 技术相比, 本发明 具有精度高、 准确率高和速度快等优点。 权利要求书2页 说明书6页 附图1页 CN 114880481 A 2022.08.09 CN 114880481 A 1.一种基于知识图谱的应答方法, 其特 征在于, 包括以下步骤: S1、 获取用户问题; S2、 将用户问题输入训练好的语义 提取模型, 获得问题语义信息; S3、 对问题语义信息进行命名实体识别, 获得问题命名实体; S4、 根据问题命名实体在预 先构建的知识图谱中进行匹配, 输出问题答案; 其中, 所述的知识图谱的构建过程包括: 采集若干条应答历史数据, 构成历史数据集; 将历史数据集输入训练好的语义 提取模型, 获得语义数据集; 对语义数据集进行命名实体识别, 获得若干个问题语义向量, 构 成知识图谱, 所述的问 题语义向量的表达式为: (实体, 关系, 实体); 所述的步骤S4的具体过程包括: 根据问题命名实体在知识图谱中匹配问题语义向量, 将匹配到的问题语义向量作为问 题答案并输出。 2.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 训练语义提取模 型的损失函数表达式为: 其中, x为输入向量, w为特征权重, n为样本 数量, y为期望输 出值, hw(x)为一般线 性回归 函数的假设函数, hw(x)的表达式为: 其中, b为噪声参数。 3.根据权利要求2所述的一种基于知识图谱的应答方法, 其特征在于, 所述的语义提取 模型的每次迭代训练中, 通过随机斜 率下降法和误差反向传播 算法对特 征权重进行更新。 4.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 所述的步骤S3的 具体过程包括: 通过隐马尔可 夫模型的隐含序列确定问题语义信息中的可观测状态; V={v1, ..., vM} H={h1, ..., hN} O={o1, ..., oT} I={i1, ..., iT} 其中, V和H分别为自然语言集合和隐藏状态合集, 其中v表示字, M为已知字数, h代表隐 状态, N为状态数量, O为可观测状态序列, I为隐含状态序列, o表示已观测 到的文本, i为已 观测到的文本对应的隐状态, T为字数; 计算隐马尔可 夫模型初始化隐状态的概 率分布 π: π =P(i1=hi) 其中, P(i1=hi)为序列中第一个字i1的实体标记为hi的概率;权 利 要 求 书 1/2 页 2 CN 114880481 A 2计算用于表示 不同状态间转移的概 率的状态转移 矩阵Aij: 计算用于表示隐状态生成观测结果的观测概 率矩阵Bjk: Bjk=P(ot=vk|it=hj) 其中, P(ot=vk|it=hj)表示t时刻实体标记hi对应到文字vk的概率, vk∈H, hi, j∈H; 基于概率 分布 π、 状态转移矩阵Aij以及观测概率矩阵Bjk, 通过目标函数得整体的序列和 隐状态发生的概 率最优化, 得到第t时刻的最优标注; 所述的目标函数为: argmax( π, A, B)=P(i1...ito1...ot| π, A, B) 通过维特比算法中的动态规划算法找到全局最优的标记序列, 作为命名实体: 其中, 为全局最优的标记序列。 5.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的隐马尔可 夫模型初始化隐状态的概 率分布 π 的计算公式为: π =P(i1=hi) 其中, P(i1=hi)为序列中第一个字i1的实体标记为hi的概率。 6.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的状态转移 矩阵A的计算公式为: Aij=P(it+1=hj|it=hi) 其中, Aij为状态转移矩阵, P(it+1=hj|it=hi)表示t时刻实体标记为hi, 而在t+1时刻实 体标记转换到 hj的概率。 7.根据权利要求4所述的一种基于知识图谱的应答方法, 其特征在于, 所述的观测概率 矩阵Bjk的计算公式为: Bjk=P(ot=vk|it=hj) 其中, P(ot=vk|it=hj)表示t时刻实体标记hi对应到文字vk的概率, vk∈H, hi, j∈H。 8.根据权利要求1所述的一种基于知识图谱的应答方法, 其特征在于, 所述的步骤S4的 具体过程包括: 通过索引在知识图谱中搜索问题命名实体, 返回与问题命名实体相关的候选问题语义 向量, 针对问题和关系、 问题和答案进 行联合语义表征, 然后从候选问题语义向量中选择得 分最高的候选问题语义向量作为 答案。 9.一种电子设备, 其特征在于, 包括存储器和 处理器, 所述存储器存储有计算机程序, 所述处理器调用所述 程序指令能够执 行如权利要求1至8任一所述的应答方法。 10.一种计算机可读存储介质, 其特征在于, 包括计算机程序, 所述计算机程序能够被 处理器执行以实现如权利要求1 ‑8任一所述的应答方法。权 利 要 求 书 2/2 页 3 CN 114880481 A 3
专利 一种基于知识图谱的应答方法、电子设备及介质
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:53:55
上传分享
举报
下载
原文档
(481.8 KB)
分享
友情链接
GB-T 20502-2006 膜组件及装置型号命名.pdf
GB-T 9473-2022 读写作业台灯性能要求.pdf
GA-T 1735.1-2020 网络安全等级保护检查工具技术规范 第1部分:安全通用检查工具.pdf
GB-T 41670-2022 安全与韧性 社区韧性 突发事件弱势群体救援指南 ISO 22395-2018.pdf
GB-T 33770.1-2017信息技术服务外包第1部分服务提供方通用要求.pdf
GB 25723-2010 点火枪安全与质量.pdf
GB-T 9813.3-2017 计算机通用规范 第3部分:服务器.pdf
GB-T 30287.3-2013 卫星定位船舶信息服务系统 第3部分:信息安全规范.pdf
DB4404-T 13-2021 中小企业卓越绩效评价准则 珠海市.pdf
DB12-T 724.35-2021 安全生产等级评定技术规范 第35部分:医药制造企业 天津市.pdf
GB-T 20274.1-2023 信息安全技术 信息系统安全保障评估框架 第1部分:简介和一般模型.pdf
青藤云安全 ATT&CK 实战指南.pdf
DB65-T3834-2023 废旧地膜分类分级规范 新疆维吾尔自治区.pdf
GB-T 41391-2022 信息安全技术 移动互联网应用程序(App)收集个人信息基本要求.pdf
奇安信 2020年网络安全应急响应分析报告 2021.pdf
信通院 数据安全风险分析及应对策略研究-2022年.pdf
GB-T 1311-2008 直流电机试验方法.pdf
T-CSZFC 1—2022 慈善组织食品捐赠规范.pdf
DB52-T1407-2019 政府数据 开放数据核心元数据 贵州省.pdf
GB-T 39137-2020 难熔金属单晶晶向测定方法.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(481.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。