(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210724316.X
(22)申请日 2022.06.24
(71)申请人 国网信息通信产业 集团有限公司
地址 102211 北京市昌平区未来科技城北
区国网智能电网研究院内C座 4层
(72)发明人 张琳瑜 李强 刘迪 邱镇
黄晓光 王晓东 崔迎宝 刘璟
(74)专利代理 机构 济南舜源专利事务所有限公
司 37205
专利代理师 赵阳
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/34(2019.01)
G06F 16/332(2019.01)
G06F 3/04845(2022.01)G06Q 50/06(2012.01)
(54)发明名称
一种基于知识图谱的电力问答与可视化系
统
(57)摘要
本发明提供一种基于知识图谱的电力问答
与可视化系统, 包括: 用户端、 管理员端以及知识
问答服务器; 用户端获取电力知识图谱, 并进行
显示处理; 管理员端供系统管理员使用, 管理员
通过管理员端对用户信息进行增 删改查, 对知识
图谱的问答记录进行增 删改查, 还对用户反馈信
息进行处理; 知识问答服务器用于实现电力问答
与可视化显示, 基于B/S架构, 采用前后端分离的
开发设计, 前端基于Vue.js, 后端采用Python开
发的微型Web框架Flask; 知识问答服务器配置有
数据库, 数据库采用Neo4j数据库存储知识图谱
数据; 知识问答服务器构建电力领域知识图谱,
为问答子系统的实现提供知识库。 还能够为用户
带来更好的用户体验。
权利要求书3页 说明书8页 附图3页
CN 115269862 A
2022.11.01
CN 115269862 A
1.一种基于知识图谱的电力问答与可视化系统, 其特征在于, 包括: 用户端、 管理员端
以及知识问答 服务器;
用户端供用户使用, 用户通过用户端与知识问答服务器通信连接, 获取电力知识图谱,
并进行显示处 理;
管理员端供系统管理员使用, 管理员通过管理员端与知识问答服务器通信连接, 对用
户信息进行增删改查, 对知识图谱的问答记录进行增删改查, 还 对用户反馈信息进行处 理;
知识问答服务器用于实现电力问答与可视化显示, 基于B/S架构, 采用前后端分离的开
发设计, 前端基于Vue.js, 后端采用Pytho n开发的微型Web框架Flask;
知识问答 服务器配置有数据库, 数据库采用Neo 4j数据库存 储知识图谱数据;
知识问答 服务器构建电力领域知识图谱, 为问答子系统的实现提供知识库。
2.根据权利要求1所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
知识问答 服务器基于AIML框架和用户端发送的问答数据从知识图谱中获取答案;
知识问答 服务器还用于对知识图谱 扩充, 实现知识图谱可视化展示功能。
3.根据权利要求2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
知识问答服务器构建知识图谱过程中, 获取知识图谱, 在知识获取阶段, 从数据源获取
构建知识图谱的数据, 包括非结构化、 结构化和半结构化数据;
知识问答服务器对知识进行处理, 具体包括: 将源数据处理为符合构建知识图谱要求
的固定格式结构化数据, 结构化数据的文件格式为CSV文件, 实体和关系数据分别存储在不
同的CSV文件中;
知识问答服务器对知识进行存储; 使用Neo4j数据库 来存储知识图谱的实体、 属性和关
系, 构建电力领域知识图谱, 为问答子系统的实现提供知识库。
4.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
知识问答服务器构建问答模块, 对问题预处理, 其中, 问题预处理过程是将基本问答语
句输入到知识问答 服务器中, 知识问答 服务器进行分词、 词性标注、 关键 字提取相关操作;
知识问答 服务器具有问题理解功能, 结合语义相似度计算, 通过 标签生成对应内容;
知识问答服务器在 问答过程中, 进行相关问答语句的内容检索工作, 如果检索成功会
返回对应的答句, 否则返回Nul l;
对返回的内容进行判定是否为空, 如果 不为空则检索到对应的数据, 将其返回;
否则通过基于AIML问答系统框架进行结果检索, 如果检索数据成功则返回对应的答
句, 否则返回通用答句。
5.根据权利要求2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
知识问答服务器构造SQL语句并进行数据查询, 对数据类型、 结构、 属性进行转换, 构建
Neo4j数据存 储语言, 并结合SQ L语言抽取的信息确定上 下位关系, 创建知识图谱节点;
半结构化数据通过爬虫的方式获得; 爬虫模型基于Scrapy框架构 建, 框架包括爬虫、 调
度器以及下 载器;
非结构化数据采用基于句法语义特征的实体关系抽取方法获得; 通过数据挖掘技术提
取文本, 然后通过清洗的规则处理对提取 的文本进行分句规范化操作, 最后对文本进行对
应的分词、 词性标注操作;
通过事先定义的句法分析规则进行句法分析规则匹配, 通过判断语句判断是否抽取成权 利 要 求 书 1/3 页
2
CN 115269862 A
2功, 如果抽取成功则进 行对应的知识存储, 否则判断是否抽取完 毕, 如果没有 再继续进行抽
取。
6.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
知识问答服务器从半结构化和非结构化数据中获取源数据后, 对知识进行预处理, 将
源数据处 理为符合构建知识图谱要求的固定格式结构化数据;
结构化数据的文件格式为CSV文件, 实体和关系数据分别存储在不同的CSV文件中; 对
源数据进行 数据清洗, 删除不重要的字段, 以及字段值 为空或为 零的记录;
其次, 根据源数据表结构对其进行拆分, 提取实体、 属性和关系, 一个实体对应多个属
性, 不同实体之间通过主键区分源实体和目的实体形成关系。
7.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
数据库使用Neo 4j数据库来存 储知识图谱的实体、 属性和关系;
向数据库储 存数据时, 先导入实体数据, 再根据数据库中的实体导入关系数据;
根据实体 类型和属性名来构建Cypher语句, 实体数据的CSV文件以实体 类型来命名;
对于关系数据的Cypher语句, 则使用源实体和目的实体进行构建; 将构建好的Cypher
语句写入脚本程序中, 实现实体、 属性和关系数据的一键入库。
8.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
知识问答服务器获取基本问答语句, 进行分词、 词性标注、 关键字提取操作, 并结合语
义相似度计算, 通过 标签生成对应内容, 进行相关问答语句的内容检索工作;
知识问答服务器具有语义解析模块, 语义解析模块包含有分词、 词性标注、 Tag标签生
成以及相似度计算;
知识问答服务器基于余弦算法的相似度计算算法, 将句子进行分句和关键词提取之
后, 利用同义词词林, 转换为对应的t ag标签, 对对应的t ag标签进行分层计算, 调整不同层
次的权重, 最后计算出对应的相似度分数;
基于问答对的单轮对话是将对应的问句进行分词、 去除停用词、 词性标注后, 对取得的
内容进行tag计算, 然后使用对应的t ag在数据库中查找对应的匹配内容, 查询到数据则反
馈对应的答案 。
9.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于,
用户端具有用户界面组件; 用户界面组件首页由HeaderCom、 ChatRightCom、
QAListLeftCom、 LoginCom四个组件构成; HeaderCom为页面顶部, 包括几个链接和登录按
钮; ChatRight Com为页面右侧的问答模块, 由ChatInputCo m和ChatOutput Com两个子组件构
成; QAListLeftCom为页面左侧的问答系统列表, 包含问答系统的基本信息; LoginCom为登
录注册模块;
用户端具有知识图谱可视化功能;
使用D3.js和Neo 4j图数据库来实现知识图谱可视化;
将构建知识图谱用到的实体和关系CSV表转化为JSON格式数据, JSON文件的data部分
包括两个字典, 字典名分别是all和power, 前端通过AJAX方式, POST请求后端数据, 返回给
前端进行图谱渲染; 在知识图谱可视化界面, 随意拖拽节点, 放大缩小知识图谱, 点击节点
能够查看节点详细信息, 输入节点 ID和节点名称即可查询节点;
用户端还对知识图谱进行初始化设置; 通过添加鼠标响应事件实现点击节点显示相关权 利 要 求 书 2/3 页
3
CN 115269862 A
3
专利 一种基于知识图谱的电力问答与可视化系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:54:07上传分享