说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210592588.9 (22)申请日 2022.05.27 (71)申请人 国家电网公司华中分部 地址 430223 湖北省武汉市洪山区徐 东大 街47号 申请人 北京科东电力控制系统有限责任公 司 (72)发明人 汪旸 孙望良 程迪 徐浩  刘志成 窦建中 张梦雅 姜涛  张越 单连飞 乔咏田 王宇  (74)专利代理 机构 武汉开元知识产权代理有限 公司 42104 专利代理师 李满 (51)Int.Cl. G06F 40/295(2020.01)G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于神经化正则表达式的电网故障处 置预案解析方法 (57)摘要 本发明提供了一种基于神经化正则表达式 的电网故障处置预案解析方法, 包括以下步骤: 编写每个电网故障处置预案文本实体成分识别 的正则表达式; 将所述正则表达式转换为电网故 障处置预案成分识别的有限状态自动机, 使正则 表达式的规则文本表示转变为矩阵形式表示; 将 所述有限状态自动机转换为具有独立表示能力 的有限状态自动机, 并通过矩阵秩 分解和加入词 向量表示, 构建有限状态自动机双向循环神经网 络; 使用电网故障处置预案语料库数据对有限状 态自动机双向循环神经网络进行训练; 采用训练 后的有限状态自动机双向循环神经网络识别并 提取输入的电网故障处置预案文本的实体成分。 本发明有效提升电网故障处置预案解析效率。 权利要求书3页 说明书10页 附图1页 CN 114997168 A 2022.09.02 CN 114997168 A 1.一种基于神经化正则表达式的电网故障处置预案解析方法, 其特征在于: 包括以下 步骤: 编写每个电网故障处置预案文本实体成分识别的正则表达 式; 其中所述正则表达 式用 于从预先构建的电网故障处置预案语料库的电网故障处置预案文本中识别出实体成分; 将所述正则表达 式转换为电网故障处置预案成分识别的有限状态自动机, 使正则表达 式的规则文本表示 转变为矩阵形式表示; 将所述有限状态自动机转换为具有独立表示 能力的有限状态自动机, 并通过矩阵秩分 解和加入词向量, 构建有限状态自动机双向循环神经网络; 使用电网故障处置预案语料库数据对有限状态自动机双向循环神经网络进行训练; 采用训练后的有限状态自动机双向循环神经网络识别输入的电网故障处置预案文本 的实体成分, 并提取识别结果。 2.根据权利要求1所述的一种方法, 其特征在于: 所述电网故障处置预案语料库的构建 过程包括: 整理电网故障处置预案中全部文本的实体成分信息, 所述 实体成分包含设备类、 动作类、 区域类、 限值类4个类型; 基于电网故障处置预案中动作类词语, 将电网故障处置预 案中的长文本 分割为多个短句, 每个短句中包含一个动作类词语, 在进 行文本分割时, 以文 本中的标点符号为划分点, 判断每个划分的短句中是否包含动作类词语, 如果包含, 则确定 为一个短句, 如果不包含, 则将当前短句与前一个短句进行合并处理, 将一个短句作为一个 电网故障处置预案文本; 将电网故障处置预案中全部文本 分割成多个电网故障处置预案文 本后, 形成电网故障处置预案语料库。 3.根据权利要求1所述的一种方法, 其特征在于: 编写每个电网故障处置预案文本实体 成分识别的正则表达式的过程包括: 将电网故障处置预案语料库中的电网故障处置预案文 本按照句式结构进行归类, 相同的句式结构表示电网故障处置预案文本表述形式及操作意 图相同; 总结每种句 式结构涉及的关键词、 实体成分及其所属类型; 通过关键词定位捕获 组, 通过捕获组表 示实体成分及其所属类型; 编写正则表达式, 所述正则表达式通过特定字 符、 关键词和捕获组的组合, 表达从电网故障处置预案文本中提取其对应的实体成分的过 滤逻辑。 4.根据权利要求3所述的方法, 其特征在于: 电网故障处置预案成分识别的有限状态自 动机包括输入字符表、 输出标签、 有限状态集, 起始状态集、 终止状态集以及有限状态自动 机状态转移 矩阵; 所述输入字符表由电网故障处置预案语料中包含的不重复的字符构 成; 所述输入字符 表通过对电网故障处置预案语料库的遍历, 筛 选出的不重复的字符形成; 所述输出标签由自定义的不重复的标签组成, 采用不同符号作为捕 获组内起始字符标 签、 捕获组内剩余内容标签和非捕获组内容的通配符标签; 并按照区域、 设备、 限值、 动作对 不同的捕获组内起始字符标签、 捕获组内剩余内容标签进行分类标记; 所述有限状态集的状态数由电网故障处置预案正则表达式中关键词及捕获组的数量 决定; 所述起始状态集表示对于不同的输入语料, 电网故障处置预案有限状态自动机的起始 状态; 所述终止状态集表示对于不同的输入语料, 电网故障处置预案有限状态自动机的终止权 利 要 求 书 1/3 页 2 CN 114997168 A 2状态; 所述有限状态自动机状态转移矩阵用于判断有限状态自动机针对每个输入的电网故 障处置预案文本产生的状态转移情况; 有限状态自动机状态 转移矩阵包含四个维度, 其中, 一个维度表示输入字符表大小, 两个维度表示有限状态集的状态数大小, 一个维度表示输 出标签大小。 5.根据权利要求4所述的一种方法, 其特征在于: 将电网故障处置预案文本实体成分识 别的正则表达式转换为电网故障处置预案成分识别的有限状态自动机的过程包括: 有限状态自动机首先进入起始状态, 输入多个电网故障处置预案文本实体成分识别的 正则表达式; 有限状态自动机依 次读取每个正则表达式; 有限状态自动机每次读取完单个 正则表达式均回到起始状态; 有限状态自动机读取单个正则表达式的过程包括: 有限状态自动机每个时刻读取正则 表达式中的一个字符, 当读取到 关键词或捕获组内容时, 有限状态自动机状态发生改变, 读 取到其它内容时, 有限状态自动机的状态不 发生改变, 当读取完正则表达中所有字符, 有限 状态自动机 到达终止状态; 对于每 个读入的字符, 有限状态自动机对应关联一个输出 标签; 有限状态自动机读取所有的正则表达 式后生成有限状态自动机状态转移矩阵; 有限状 态自动机状态转移矩阵结合输入字符表和输出标签, 生成电网故障处置预案成分识别的有 限状态自动机 。 6.根据权利要求4所述的一种方法, 其特征在于: 所述具有独立表示能力的有限状态自 动机用于减小电网故障处置预案成分识别的有限状态自动机状态转移矩阵的维度, 通过引 入格外的状态数, 使得电网故障处置成分识别的有限状态自动机识别捕获组内容时, 从捕 获组内首个字符到捕获组内其它字符之间, 发生一个状态转移; 在任一时刻通过状态转移 矩阵的到 达状态确定其输出 标签。 7.根据权利要求4所述的一种方法, 其特征在于: 通过矩阵秩分解和加入词向量, 构建 有限状态自动机双向循环神经网络的过程包括: 将具有独立表示能力的有限状态自动机使 用一个状态转移三维矩阵和 一个表示到达状态到输出状态的二维矩阵表示电网故障处置 预案成分识别的有限状态自动机中状态转移 矩阵; 用张量秩分解技术将状态转移三维矩阵分解为三个二维矩阵, 分别为输入字符表的词 向量矩阵、 当前状态 矩阵D1和到达状态矩阵D2; 将带有词信 息的预训练词向量与输入字符表的词向量矩阵进行拼接处理, 使输入字符 表的词向量矩阵获得词的语义信息; 所述带有词信息的预训练词向量使用电网故障处置预案语料库对word2vec语言模型 训练后获得的w ord2vec语言模型权 重参数作为输入字符表中字符的向量 化表示; 令预训练词向量矩阵为W, 设置超参数θ, 用超参数来决定预训练词向量W和经矩阵秩分 解后得到的词向量矩阵E拼接时所占权 重大小; 每个时刻t输入字符对应的输出 标签的得分的计算公式为: vt=θ·E[xt]+(1‑θ )W[xt] 权 利 要 求 书 2/3 页 3 CN 114997168 A 3

.PDF文档 专利 一种基于神经化正则表达式的电网故障处置预案解析方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于神经化正则表达式的电网故障处置预案解析方法 第 1 页 专利 一种基于神经化正则表达式的电网故障处置预案解析方法 第 2 页 专利 一种基于神经化正则表达式的电网故障处置预案解析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。