说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210794241.2 (22)申请日 2022.07.05 (71)申请人 上海晏鼠计算机技 术股份有限公司 地址 200433 上海市杨 浦区国定路3 35号 3201-3室 (72)发明人 陈刚 (74)专利代理 机构 北京深川专利代理事务所 (普通合伙) 16058 专利代理师 吴晓丹 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 16/36(2019.01) G06F 16/383(2019.01) (54)发明名称 一种基于知识图谱的公务文书写作方法及 系统 (57)摘要 本发明公开了一种基于知识图谱的公务文 书写作方法与系统, 方法包括: 将用于参考的素 材导入系统 ‑从素材内容中抽取知识图谱 ‑根据 文章大纲生成基础信息表 ‑对基础信息表进行排 序‑推送文段, 系统包括: 存储模块、 传递模块、 图 数据库模块、 召回查询模块、 排序模块、 推送模 块。 本发明采用了NLP、 知识图谱、 大数据等相关 技术, 可以对参考素材的内容进行切分与提取, 生成知识图谱。 生成的知识图谱 可以帮助用户在 撰写公文时, 推送匹配的文段用于参考。 减少员 工写作时消耗的时间与精力, 提高了员工的写作 效率。 权利要求书2页 说明书4页 附图2页 CN 115146030 A 2022.10.04 CN 115146030 A 1.一种基于知识图谱的公务文 书写作方法, 其特 征在于, 包括: 步骤1: 将用于参 考的素材导入系统; 步骤2: 从素 材内容中抽取知识图谱; 步骤3: 根据文章大纲生成基础信息表; 步骤4: 对基础信息表进行排序; 步骤5: 推送文段。 2.一种基于知识图谱的公务文书写作系统, 其特征在于,包括存储模块、 传递模块、 图 数据库模块、 召回查询模块、 排序模块、 推送模块。 3.根据权利要求2所述的一种基于知识图谱的公务文书写作系统, 其特征在于, 所述存 储模块用于存 储数据; 所述存储模块包含Neo4j数据库和ES非标数据库, 所述Neo4j数据库用于存储 “实体‑‑ 关系‑‑实体”格式的数据, 所述ES非标 数据库用于存 储es表格数据。 4.根据权利要求2所述的一种基于知识图谱的公务文书写作系统, 其特征在于, 所述传 递模块用于将数据在不同模块之间传输; 所述传递模块包含接收单元、 发送单元、 传输单元, 所述接收单元用户接收其他模块发 出的数据, 所述发送单元用于将数据发送给其他单元, 所述传输单元用于将数据在接 收单 元和发送单 元之间运输 。 5.根据权利要求2所述的一种基于知识图谱的公务文书写作系统, 其特征在于, 所述图 数据库模块用于提取知识图谱; 所述图数据库模块包含文档预处理单元、 哈希计算单元、 三元组抽取单元、 Neo4j数据 库存储单元, 所述文档预处理单元将获取 的文章内容以大纲为分割分成段落, 所述哈希计 算单元按照段落计算哈希值生成Pid代表段落的索引, 所述三元组抽取单元先将es表格中 的段落数据划分为句子级别颗粒度, 切词后按照句法依存关系以 “名词”和“动词”级别抽取 知识三元组, 三元组提交至Neo 4j数据库存 储单元。 6.根据权利要求2所述的一种基于知识图谱的公务文书写作系统, 其特征在于, 所述召 回查询模块, 用于生成基础信息表; 所述召回查询模块包含用户检索单元、 Neo4j库模糊查询单元、 召回结果存储单元, 所 述用户检索单元, 获取用户输入的大纲数据, 调用分词工具对 数据进行切割, 最后将数据传 入ES数据库生成大纲数据的基础信息表保存, 所述Neo4j库模糊查询单元, 调用大纲数据的 基础信息表, 通过模糊查询查询Neo4j数据库生成查询结果表, 并去除查询结果表的重复 项, 所述召回结果存储单元, 接收查询结果表, 依照查询结果表对文章进 行标记创建文章ID 作为补充信息, 生成后续的基础信息表。 7.根据权利要求2所述的一种基于知识图谱的公务文书写作系统, 其特征在于, 所述排 序模块用于计算相似度; 所述排序模块包含TF ‑IDF矩阵变换单元和相似度计算单元, 所述TF ‑IDF矩阵变换单元 根据基础信息表建立大矩阵和查询索引, 根据用户的大纲数据建立搜索矩阵, 所述相似度 计算单元, 对大矩阵和搜索矩阵进行欧式距离计算, 最后根据计算结果取topk个返回段落 的正文。 8.根据权利要求2所述的一种基于知识图谱的公务文书写作系统, 其特征在于, 所述推权 利 要 求 书 1/2 页 2 CN 115146030 A 2送模块用于推送文段内容; 所述推送模块包含召回单元和排序单元, 所述召回单元将ES非标数据库中的所有数据 与大纲进行相似度计算, 推送相似的内容, 并保存在文字表中, 所述排序单元, 当用户在输 入搜索词时, 通过相似度计算, 取最相似的内容进行推送。权 利 要 求 书 2/2 页 3 CN 115146030 A 3
专利 一种基于知识图谱的公务文书写作方法及系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:53:49
上传分享
举报
下载
原文档
(338.0 KB)
分享
友情链接
腾讯 2022产业互联网安全十大趋势.pdf
DB3301-T 0213-2018 城市道路防沉降检查井盖和雨水口技术管理规范 杭州市.pdf
GB-T 41958-2022 浸胶帆布 导热性能试验方法.pdf
GB/T 39188-2020 电动门窗通用技术要求.pdf
GB-T 34300-2017 城乡社区网格化服务管理规范.pdf
DB14-T 1502-2017 富硒谷子栽培技术规程 山西省.pdf
湖南省地理空间数据管理办法.pdf
GB-T 2424.1-2015 环境试验 第3部分:支持文件及导则 低温和高温试验.pdf
GB-T 18312-2015 双筒望远镜检验规则.pdf
电力行业网络安全等级保护管理办法 修订征求意见稿 .pdf
DB52-T 702-2011 杉木二元立木材积表 贵州省.pdf
SY-T 7652-2021 气藏型储气库库容参数设计方法.pdf
逐浪大模型:互联网巨头的AI野望.pdf
GB-T 43038-2023 通信网络可信性工程.pdf
GB-T 40645-2021 信息安全技术 互联网信息服务安全通用要求.pdf
GB-T 23794-2023 企业信用评价指标.pdf
GB-T 40656.1-2021 智慧城市 运营中心 第1部分:总体要求.pdf
GB-T 42048-2022 载人航天空间科学与应用项目遴选要求.pdf
GB-T 42535-2023 锅炉定期检验.pdf
GB-T 30273-2013 信息安全技术 信息系统安全保障通用评估指南.pdf
1
/
3
9
评价文档
赞助2.5元 点击下载(338.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。