说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210724316.X (22)申请日 2022.06.24 (71)申请人 国网信息通信产业 集团有限公司 地址 102211 北京市昌平区未来科技城北 区国网智能电网研究院内C座 4层 (72)发明人 张琳瑜 李强 刘迪 邱镇  黄晓光 王晓东 崔迎宝 刘璟  (74)专利代理 机构 济南舜源专利事务所有限公 司 37205 专利代理师 赵阳 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/34(2019.01) G06F 16/332(2019.01) G06F 3/04845(2022.01)G06Q 50/06(2012.01) (54)发明名称 一种基于知识图谱的电力问答与可视化系 统 (57)摘要 本发明提供一种基于知识图谱的电力问答 与可视化系统, 包括: 用户端、 管理员端以及知识 问答服务器; 用户端获取电力知识图谱, 并进行 显示处理; 管理员端供系统管理员使用, 管理员 通过管理员端对用户信息进行增 删改查, 对知识 图谱的问答记录进行增 删改查, 还对用户反馈信 息进行处理; 知识问答服务器用于实现电力问答 与可视化显示, 基于B/S架构, 采用前后端分离的 开发设计, 前端基于Vue.js, 后端采用Python开 发的微型Web框架Flask; 知识问答服务器配置有 数据库, 数据库采用Neo4j数据库存储知识图谱 数据; 知识问答服务器构建电力领域知识图谱, 为问答子系统的实现提供知识库。 还能够为用户 带来更好的用户体验。 权利要求书3页 说明书8页 附图3页 CN 115269862 A 2022.11.01 CN 115269862 A 1.一种基于知识图谱的电力问答与可视化系统, 其特征在于, 包括: 用户端、 管理员端 以及知识问答 服务器; 用户端供用户使用, 用户通过用户端与知识问答服务器通信连接, 获取电力知识图谱, 并进行显示处 理; 管理员端供系统管理员使用, 管理员通过管理员端与知识问答服务器通信连接, 对用 户信息进行增删改查, 对知识图谱的问答记录进行增删改查, 还 对用户反馈信息进行处 理; 知识问答服务器用于实现电力问答与可视化显示, 基于B/S架构, 采用前后端分离的开 发设计, 前端基于Vue.js, 后端采用Pytho n开发的微型Web框架Flask; 知识问答 服务器配置有数据库, 数据库采用Neo 4j数据库存 储知识图谱数据; 知识问答 服务器构建电力领域知识图谱, 为问答子系统的实现提供知识库。 2.根据权利要求1所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 知识问答 服务器基于AIML框架和用户端发送的问答数据从知识图谱中获取答案; 知识问答 服务器还用于对知识图谱 扩充, 实现知识图谱可视化展示功能。 3.根据权利要求2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 知识问答服务器构建知识图谱过程中, 获取知识图谱, 在知识获取阶段, 从数据源获取 构建知识图谱的数据, 包括非结构化、 结构化和半结构化数据; 知识问答服务器对知识进行处理, 具体包括: 将源数据处理为符合构建知识图谱要求 的固定格式结构化数据, 结构化数据的文件格式为CSV文件, 实体和关系数据分别存储在不 同的CSV文件中; 知识问答服务器对知识进行存储; 使用Neo4j数据库 来存储知识图谱的实体、 属性和关 系, 构建电力领域知识图谱, 为问答子系统的实现提供知识库。 4.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 知识问答服务器构建问答模块, 对问题预处理, 其中, 问题预处理过程是将基本问答语 句输入到知识问答 服务器中, 知识问答 服务器进行分词、 词性标注、 关键 字提取相关操作; 知识问答 服务器具有问题理解功能, 结合语义相似度计算, 通过 标签生成对应内容; 知识问答服务器在 问答过程中, 进行相关问答语句的内容检索工作, 如果检索成功会 返回对应的答句, 否则返回Nul l; 对返回的内容进行判定是否为空, 如果 不为空则检索到对应的数据, 将其返回; 否则通过基于AIML问答系统框架进行结果检索, 如果检索数据成功则返回对应的答 句, 否则返回通用答句。 5.根据权利要求2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 知识问答服务器构造SQL语句并进行数据查询, 对数据类型、 结构、 属性进行转换, 构建 Neo4j数据存 储语言, 并结合SQ L语言抽取的信息确定上 下位关系, 创建知识图谱节点; 半结构化数据通过爬虫的方式获得; 爬虫模型基于Scrapy框架构 建, 框架包括爬虫、 调 度器以及下 载器; 非结构化数据采用基于句法语义特征的实体关系抽取方法获得; 通过数据挖掘技术提 取文本, 然后通过清洗的规则处理对提取 的文本进行分句规范化操作, 最后对文本进行对 应的分词、 词性标注操作; 通过事先定义的句法分析规则进行句法分析规则匹配, 通过判断语句判断是否抽取成权 利 要 求 书 1/3 页 2 CN 115269862 A 2功, 如果抽取成功则进 行对应的知识存储, 否则判断是否抽取完 毕, 如果没有 再继续进行抽 取。 6.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 知识问答服务器从半结构化和非结构化数据中获取源数据后, 对知识进行预处理, 将 源数据处 理为符合构建知识图谱要求的固定格式结构化数据; 结构化数据的文件格式为CSV文件, 实体和关系数据分别存储在不同的CSV文件中; 对 源数据进行 数据清洗, 删除不重要的字段, 以及字段值 为空或为 零的记录; 其次, 根据源数据表结构对其进行拆分, 提取实体、 属性和关系, 一个实体对应多个属 性, 不同实体之间通过主键区分源实体和目的实体形成关系。 7.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 数据库使用Neo 4j数据库来存 储知识图谱的实体、 属性和关系; 向数据库储 存数据时, 先导入实体数据, 再根据数据库中的实体导入关系数据; 根据实体 类型和属性名来构建Cypher语句, 实体数据的CSV文件以实体 类型来命名; 对于关系数据的Cypher语句, 则使用源实体和目的实体进行构建; 将构建好的Cypher 语句写入脚本程序中, 实现实体、 属性和关系数据的一键入库。 8.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 知识问答服务器获取基本问答语句, 进行分词、 词性标注、 关键字提取操作, 并结合语 义相似度计算, 通过 标签生成对应内容, 进行相关问答语句的内容检索工作; 知识问答服务器具有语义解析模块, 语义解析模块包含有分词、 词性标注、 Tag标签生 成以及相似度计算; 知识问答服务器基于余弦算法的相似度计算算法, 将句子进行分句和关键词提取之 后, 利用同义词词林, 转换为对应的t ag标签, 对对应的t ag标签进行分层计算, 调整不同层 次的权重, 最后计算出对应的相似度分数; 基于问答对的单轮对话是将对应的问句进行分词、 去除停用词、 词性标注后, 对取得的 内容进行tag计算, 然后使用对应的t ag在数据库中查找对应的匹配内容, 查询到数据则反 馈对应的答案 。 9.根据权利要求1或2所述的基于知识图谱的电力问答与可视化系统, 其特 征在于, 用户端具有用户界面组件; 用户界面组件首页由HeaderCom、 ChatRightCom、 QAListLeftCom、 LoginCom四个组件构成; HeaderCom为页面顶部, 包括几个链接和登录按 钮; ChatRight Com为页面右侧的问答模块, 由ChatInputCo m和ChatOutput Com两个子组件构 成; QAListLeftCom为页面左侧的问答系统列表, 包含问答系统的基本信息; LoginCom为登 录注册模块; 用户端具有知识图谱可视化功能; 使用D3.js和Neo 4j图数据库来实现知识图谱可视化; 将构建知识图谱用到的实体和关系CSV表转化为JSON格式数据, JSON文件的data部分 包括两个字典, 字典名分别是all和power, 前端通过AJAX方式, POST请求后端数据, 返回给 前端进行图谱渲染; 在知识图谱可视化界面, 随意拖拽节点, 放大缩小知识图谱, 点击节点 能够查看节点详细信息, 输入节点 ID和节点名称即可查询节点; 用户端还对知识图谱进行初始化设置; 通过添加鼠标响应事件实现点击节点显示相关权 利 要 求 书 2/3 页 3 CN 115269862 A 3

.PDF文档 专利 一种基于知识图谱的电力问答与可视化系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的电力问答与可视化系统 第 1 页 专利 一种基于知识图谱的电力问答与可视化系统 第 2 页 专利 一种基于知识图谱的电力问答与可视化系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。