(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210555561.2
(22)申请日 2022.05.20
(71)申请人 国网湖北省电力有限公司黄龙 滩水
力发电厂
地址 442000 湖北省十堰市朝阳中路25 -A
号
(72)发明人 唐佳庆 周文 胡晓连 范峰
毛哲 戴伟民 刘辉宇 莫益军
(74)专利代理 机构 北京众达德权知识产权代理
有限公司 1 1570
专利代理师 刘杰
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/84(2019.01)
G06F 16/906(2019.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种水电厂辅助系统故障知识库的构建方
法
(57)摘要
本发明涉及信息技术领域, 公开了一种水电
厂辅助系统故障知识库的构建方法, 从相关文档
中自动抽取设备实体及设备实体间的关联关系,
构建包含设备、 故障、 处置建议等相关实体的水
电站辅助系统故障知识库, 知识库的拓扑结构能
够反应辅助系统之间的运行关联, 同时能够反应
故障与运行状态之间的相关关系, 还 可以动态的
添加故障与诊断建议之间的关联, 辅助故障检
修, 提高检修的效率和准确率。 对于未出现的故
障, 知识库可以采用知识消歧、 更新技术, 关联进
原有的知识库, 实现新故障的推理。
权利要求书2页 说明书8页 附图2页
CN 115017327 A
2022.09.06
CN 115017327 A
1.一种水电厂辅助系统故障知识库的构建方法, 其特 征在于, 包括以下步骤:
S1: 对水电站辅助系 统运维数据进行预处理, 包括: 采集水电站辅助系 统运维数据, 对
所有采集到的数据进行分类处理, 形成水电站辅助系统运维结构化数据; 所述水电站辅助
系统运维数据包括结构化的设备传感器历史测量数据、 半结构化的历史故障检修报告及非
结构化的设备 连接图、 设备运行规 程文档、 设备传感器清单 数据、 历史故障检修单;
S2: 从所述水电站辅助系统运维结构化数据中抽取水电站辅助系统运维中涉及到的基
本概念和关系, 根据相应的领域知识人工创建水电站辅助系统故障诊断知识库本体结构;
S3: 根据水电站辅助系统故障知识库的本体结构, 从水电站辅助系统运维结构化数据
中抽取出知识库中的相关实体, 再通过预定义的故障实体关系模型, 抽取出不同故障实体
间的关系;
S4: 在S3的基础上将抽取得到的故障实体对象, 链接到知识库中对应的正确 实体对象
中, 并于已有知识库进行合并, 形成水电厂辅助系统故障知识库。
2.根据权利要求1所述的水电厂辅助系统故障知识库的构建方法, 其特征在于, 步骤S1
的数据预处 理具体包括:
S11: 对于非结构化的设备连接图, 数据预处理部分通过OCR模型识别出文本, 然后将文
本交给信息抽取模块进行信息抽取;
S12: 对于半结构化的历史故障检修单、 各辅助系统的规程文档, 数据预处理部分通过
正则匹配抽取规则, 从文档中抽取半结构化的数据, 最后将抽取 的数据提交给信息抽取模
块进行后续处 理;
S13: 对于结构化的传感器清单数据, 数据预处理部分直接基于数据表将关系型数据直
接转换为 三元组交给后续的模块进行处 理。
3.根据权利要求1所述的水电厂辅助系统故障知识库的构建方法, 其特征在于, 所述步
骤S3, 具体包括以下步骤:
S31: 选择双 向长短期记忆神经网络与条件随机场相结合的方法从水电站辅助系统运
维结构化数据中抽取 出故障知识库中的相关实体;
S32: 采用共现网络分析方法与模式匹配方法联合提取设备、 测点、 故障、 处置建议实体
间的关系; 首先基于共现网络分析法统计语料中多个实体共现的频率, 然后采用模式匹配
法, 对共现网络的分析 结果添加关系。
4.根据权利要求1所述的水电厂辅助系统故障知识库的构建方法, 其特征在于, 所述步
骤S4, 具体包括以下步骤:
S41: 以待消歧的故障实体指称项、 水电站辅助系统故障知识库作为初始输入, 首先对
故障实体指称项和故障知识库中的故障实体进行预处理, 使它们 具有统一的格式; 然后对
故障知识库进行候选实体生成算法, 即对于每个故障实体指称项, 从故障知识库中选择出
待链接的候选故障实体列表; 最后对于每个故障实体指称项及其候选故障实体, 使用排名
模型对每对进行评分, 最终输出排名靠前的故障实体和指称项 进行链接;
S42: 采用开放数据集成框架从现有的第三方知识库产品中获取知识输入, 用于对构建
的水电站辅助系统故障知识库进行融合和扩充。
5.根据权利要求3所述的水电厂辅助系统故障知识库的构建方法, 其特征在于, 所述步
骤S31包括:权 利 要 求 书 1/2 页
2
CN 115017327 A
2步骤S311: 基于非结构化的故障对象描述信息样本制定标注集, 对样本序列中每个实
体跨度, 按照设备类别、 测点类别、 故障特征定义、 处置 建议定义标签, 并基于此对 预处理后
的所有记录文本进行BIOS标注, 确定文本中词的边界, 为实体识别确定分类特 征;
步骤S312: 利用BiLSTM模型进行训练, 训练时输入的句子序列为X=[w1,w2,w3,…,wn],
标签序列为Y=[y1,y2,y3,…,yn],句子X中的每个单词表达成一个向量, 该向量包含了单词
的词级嵌入及字符级嵌入, 其中字符级嵌入采用LSTM模型学习, 词级嵌入采用BERT预训练
模型初始化, 拼接后作为Bi LSTM层的输入;
步骤S313: 除此以外, 结合水电厂专业名称库, 为每个字符采取正则匹配的方式, 匹配
相关实体词, 使用相关实体词的word2v ec词嵌入拼接, 从而融合词义相关的知识表征, 增强
水电站领域实体识别的准确性;
步骤S314: BiLSTM训练模型中xt表示第t, t=1,2,3, …步的输入, h(t)为隐含层第t步的
状态, 它是网络的记忆单元; h(t)根据当前输入层的输出和上一步隐含层的输出进行计算
其中f为非线性的激
活函数, 在前向计算h(0)时, 即第一个的隐含状态, 需要用到和h(t ‑1), 但其并不存在, 在现
实中一般被设置为0向量; 在反向计算h(0)时, 需要用到h(t+1), 得到隐层输出
再将隐层输出映射到一个k维向量, k 为类别数, 即Pi=tanh(Wih(i)+bi);
步骤S315: 将BiLSTM的模型输出传递给CRF模型作为输入, 根据
训练CRF参数Wk, 最终得到状态序列下条件概率最 大的预测结果, 从
而识别出故障知识库中的相关实体。权 利 要 求 书 2/2 页
3
CN 115017327 A
3
专利 一种水电厂辅助系统故障知识库的构建方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:55:24上传分享