说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210753820.2 (22)申请日 2022.06.28 (71)申请人 华南理工大 学 地址 510640 广东省广州市天河区五山路 381号 (72)发明人 满奕 李继庚 张欢欢 洪蒙纳  (74)专利代理 机构 成都方圆聿联专利代理事务 所(普通合伙) 51241 专利代理师 苟铭 (51)Int.Cl. G06Q 10/06(2012.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06Q 50/04(2012.01) (54)发明名称 一种用于造纸领域的产品质 量知识图谱构 建方法 (57)摘要 本发明公开了一种用于造纸领域的产品质 量知识图谱构建方法, 基于已有造纸领域结构化 数据和互联网数据生成产品质量的相关数据, 获 取的数据通过收集、 筛选、 分析、 汇总形成造纸领 域产品质量的基础数据; 根据采集的数据信息, 进行分词处理后形成造纸领域产品质量语料库; 在语料库中选取部分数据为训练集, 通过人工方 式进行标注作为训练数据; 利用标注 好的训练数 据来迭代训练命名实体识别模型来实现知识的 抽取; 本发明通过对相关书籍、 网页、 论坛等信息 获取, 得到综合造纸领域的产品质量相关数据资 料, 构建基于造纸领域的产品质量知识分类体 系, 通过图数据库的形式进行存储; 本发明提供 的技术方案还可以从造纸行业泛化到其 他行业。 权利要求书2页 说明书4页 附图2页 CN 115115227 A 2022.09.27 CN 115115227 A 1.一种用于 造纸领域的产品质量知识图谱构建方法, 其特 征在于, 包括如下步骤: 步骤(1)、 收集数据: 基于已有造纸行业结构化数据、 互联网数据以及书籍数据生成造纸行业; 获取的数据 通过收集、 筛 选、 分析、 汇总后形成造纸领域产品质量的基础数据; 步骤(2)、 数据分词: 根据上述步骤(1)采集的数据信息, 运用分词模型进行分词处理, 最后形成造纸领域产 品质量语料库; 步骤(3)、 数据标注: 根据上述步骤(2)中的语料库, 选取部分数据以汉语每个字为识别单位进行人工标注, 然后将标注好的数据作为训练集; 在人工标注过程中, 标注的分类包含故障类型、 故障名、 故障设备名称、 故障描述、 故障 原因以及故障解决办法; 步骤(4)、 知识抽取 根据步骤(3)中的训练集建立命名实体识别模型并进行模型训练, 用训练好的模型对 所有文档进行知识的抽取; 步骤(5)、 构建产品质量知识图谱分类 体系 运用自顶而下的方式, 采用人工构建的方式来构建造纸领域产品质量概念和关系的分 类体系; 步骤(6)、 知识存 储 根据构建的造纸领域产品质量概念和关系分类体系, 将抽取出来的知识分类对应存储 于Neo4j图数据库中。 2.根据权利要求1所述的一种用于造纸领域的产品质量知识图谱构建方法, 其特征在 于, 步骤(1)中所述的相关数据, 包括已有相关设备和工艺的结构化数据, 以及通过爬虫在 相关造纸企业网站、 造纸故障类网站、 造纸产品质量问题相关网站采集的造纸产品质量问 题相关文档信息; 这些造纸产品质量相关文档信息包括造纸产品质量标准类文档信息、 政 策标准、 专利、 报告、 百 科。 3.根据权利要求1中所述的一种用于造纸领域的产品质量知识图谱构建方法, 其特征 在于, 在步骤(5)包括以下子步骤: 5.1、 定义造纸产品质量问题的知识分类体系, 设计了6类造纸故障概念, 分别是产品质 量问题、 产生原因、 现象、 解决办法、 部位、 检测; 5.2、 根据上述步骤5.1中6种已定义的造纸过程故障概念, 将泛化的概念共现关系按照 语义类型进一 步细分为7 大类的概念关系以及14小类的概念关系。 4.根据权利要求3中所述的一种用于造纸领域的产品质量知识图谱构建方法, 其特征 在于, 7大类的概念关系包括: 故障诊断、 故 障表现、 作用部位、 质量检测、 故 障部位、 检测结 果、 诊断依据; 14小类的概念关系包括: “产品质量问题 ”与“现象”、“现象”与“产生原因”、“故障决策 ” 与“现象”之间的关系类型定义为 “故障表现 ”;“产品质量问题 ”与“发生部位 ”、“部位”与“现 象”之间的关系类型定义为 “故障部位 ”;“产品质量问题 ”与“检测”、“检测”与“现象”之间的 关系类型定义为 “质量检测 ”;“产品质量问题 ”与“产生原因 ”、“产生原因 ”与“解决办法 ”、权 利 要 求 书 1/2 页 2 CN 115115227 A 2“解决办法 ”与“产品质量问题 ”之间的关系类型定义为 “故障诊断 ”;“检测”与“部位”、“部 位”与“解决办法 ”之间的关系类型定义为 “作用部位 ”;“检测”与“现象”之间的关系类型定 义为“检测结果 ”;“现象”与“产品质量问题 ”之间的关系类型定义 为“诊断依据 ”。权 利 要 求 书 2/2 页 3 CN 115115227 A 3

.PDF文档 专利 一种用于造纸领域的产品质量知识图谱构建方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于造纸领域的产品质量知识图谱构建方法 第 1 页 专利 一种用于造纸领域的产品质量知识图谱构建方法 第 2 页 专利 一种用于造纸领域的产品质量知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:36上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。