(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210748904.7
(22)申请日 2022.06.29
(71)申请人 国网浙江省电力有限公司电力科 学
研究院
地址 310014 浙江省杭州市下城区朝晖八
区华电弄 1号
申请人 华北电力大 学
(72)发明人 蔺家骏 李晨 王雅雯 王渊
马国明 邵先军 王威 王少华
詹江杨
(74)专利代理 机构 浙江翔隆专利事务所(普通
合伙) 33206
专利代理师 许守金 张建青
(51)Int.Cl.
G06F 16/332(2019.01)G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06F 40/279(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06K 9/62(2022.01)
B25J 11/00(2006.01)
B25J 9/16(2006.01)
(54)发明名称
一种用于户外变电站的智能问答方法及置
于户外的机 器人
(57)摘要
本发明公开了一种用于户外变电站的智能
问答方法及置于户外的机器人, 属于户外机器人
技术领域。 本发明针对变电设备故障处理问题,
提供一种用于户外变电站的智能问答机器人, 通
过构建知识库模块、 智 能问答模块, 并利用实体
识别BERT+FLAT模型, 抽取自然语言问句中的设
备实体元素, 并对自然语言问句进行槽填充, 进
而能有效提升了机器基于变电设备故障案例文
本信息的问答准确率, 降低了问答机器人的响应
延迟, 能够根据基层人员(提问人)不同描述形式
的提问需求, 快速准确地判断并能反馈给基层人
员变电设备的故障部位、 故障原因、 建议措施等
有效内容, 从而改善了一个问句中包含多个实体
或关系的复杂性问题, 加快站内设备故障处理进
度。
权利要求书5页 说明书15页 附图6页
CN 115129842 A
2022.09.30
CN 115129842 A
1.一种用于户外变电站的智能问答方法, 其特 征在于,
包括以下步骤:
第一步, 接收外 部输入的自然语言问句;
第二步, 对第 一步中的自然语言 问句进行意图识别, 分析提问人员的问询意图, 并按照
故障部位问询、 故障原因问询、 建议措施问询进行分类;
第三步, 根据第二步中的意图识别结果, 构建实体识别BERT+FLAT模型, 抽取自然语言
问句中的设备实体元 素, 并对自然语言问句进行槽填充;
所述实体识别BERT+FLAT模型, 基于字符融入词汇信息的方法, 进行设备实体元素的初
步抽取, 得到初步实体抽取 结果;
对初步实体抽取 结果进行去重、 筛 选后构建实体拼音同指库;
再将实体拼音同指库转换为带有 声调的汉字拼音数据;
根据汉字拼音数据匹配得到最终的实体抽取 结果;
同时根据自然语言 问句的相对位置编码信 息, 填补自然语言 问句的绝对位置编码信 息
的空白, 实现自然语言问句的槽填充;
所述设备实体元素至少包括名称 或/和位置或/和量词或/和时间或/和设备子部件或/
和设备状态信息;
第四步, 判断第 三步中的设备实体元素与设备实体元素之间是否存在关系以及存在什
么关系, 得到设备实体元 素间的关系信息;
第五步, 根据第四步中的关系信息, 挖掘设备实体元素之间隐藏的关系, 得到问句子
图;
第六步, 构建知识图谱模型对第五步中的问句子 图进行子 图匹配, 得到知识图谱三元
组;
第七步, 计算第六步中的知识图谱三元组与问句子 图的相似度, 选择相似度最高的知
识图谱三元组, 作为问答 答案, 实现户外变电站的智能问答。
2.如权利要求1所述的一种用于户外变电站的智能问答方法, 其特 征在于,
所述第二 步中, 意图识别的方法如下:
步骤21, 对自然语言问句进行向量 化处理, 得到词向量;
步骤22, 构建预训练模型BERT对步骤21中的词向量进行优化, 得到优化词向量;
步骤23, 构建神经网络层Bi ‑LSTM对步骤22中的优化词向量进行语义编码, 得到语义编
码向量;
步骤24, 通过注意力层A ttention计算步骤23中的语义编码向量的权 重;
步骤25, 将所有的语义编码向量乘以相应的权 重并进行求和得到特 征向量;
步骤26, 将步骤25中的特征向量输入到逻辑回归函数softmax中, 得到提问人员的问询
意图识别结果。
3.如权利要求1所述的一种用于户外变电站的智能问答方法, 其特 征在于,
所述第三步中, 实体识别BERT+FLAT模型的构建方法如下: 步骤31, 对输入的变电设备
历史故障案例文本进行向量 化处理, 得到案例词向量;
步骤32, 利用预训练模型BERT训练案例词向量生成词语树, 从每一个句子的头部开始,
按照最大匹配原则匹配得到对应字符下 的所有词语, 将词语信息直接置于句 子尾部, 得到权 利 要 求 书 1/5 页
2
CN 115129842 A
2训练文本;
在预训练模型BERT中, 能处理的最大文本长度 为ZD, 每个标识token都表示为一个BS维
的向量;
标识token为单个字符和词语, 其进行标识身份token ‑id转换, 经地址id映射得到一个
(ZD,BS)的向量矩阵表示;
步骤33, 将步骤32中的训练文本输入到位置编码层进行编码, 编码分为绝对位置编码
和相对位置编码;
绝对位置编码按照训练文本序列顺序得到;
相对位置编码具有4种位置编码, 每个字有两个相同的头部Head和尾部Tail位置编码,
每个词有两个不同的头部Head和尾部Tail位置编码, 每两个节点间计算得到四种相对距
离, 其具体的计算公式如下:
式中head[i]、 tail[i]分别 代表字或词的头部和尾部编码,
分别代表第i个字或词的头 部与第j个的字或词的头 部之间的距离;
经全连接层对计算结果进行融合得到最终的相对位置编码, 其计算公式如下:
式中Wr代表可学习的参数, ★代表连接运算符, d是
和k表示
ij位置编码的维度索引;
步骤34, 利用多头自注意力机制, 结合步骤33中的相对位置编码, 提取文本信息特征,
文本信息特 征的计算公式如下:
Attention(A*, V)=softmax(A*)V
[Q, K, V]=Ex[Wq, Wk, Wv]权 利 要 求 书 2/5 页
3
CN 115129842 A
3
专利 一种用于户外变电站的智能问答方法及置于户外的机器人
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:55:33上传分享