说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210584768.2 (22)申请日 2022.05.26 (71)申请人 上海麦开信息科技有限公司 地址 202172 上海市崇明区新村乡耀洲路 741号2幢497室 (上海新村经济小区) (72)发明人 尹莉丽 (74)专利代理 机构 北京中索 知识产权代理有限 公司 11640 专利代理师 朱晓丹 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) (54)发明名称 一种知识图谱构建方法及构建系统 (57)摘要 本发明涉及知识图谱 领域, 尤其涉及一种知 识图谱构建方法及构建系统。 系统包括数据挖掘 模块、 逻辑连接建立模块、 体系连接模块和应用 模块。 本发 明中的知识图谱构建系统从海量数据 中挖掘相关领域、 相关行业的用户信息以及产品 信息, 通过第一次的信息提取、 合并, 建立, 结构 化数据集和非结构化数据集, 第二次的信息提 取、 合并, 完成信息在模式上的连接与数据上的 连接, 以SPO三元组形式形成完整的数据库。 再对 不同实体的要素进行信息融合、 修正, 形成知识 图谱。 实现对信息关系的深度挖掘 、 连接, 信息融 合的高, 关联性强, 使得特定领域的垂直行业信 息分析更具有准确性、 高效性和智能性, 增强用 户感受, 提升 搜索转化率。 权利要求书2页 说明书3页 附图1页 CN 114925171 A 2022.08.19 CN 114925171 A 1.一种知识图谱构建系统, 其特征在于, 包括数据挖掘模块、 逻辑连接建立模块、 体系 连接模块和应用模块; 数据挖掘模块包括信 息挖掘单元和分类单元, 采用集成爬取工具对用户信 息挖掘以及 产品信息的挖掘, 得到相关信息点, 将信息点分类为实体(实体1、 实体2...实体n)和属性 (属性1、 属性2. ..属性n); 逻辑连接建立模块包括数据库建立单元、 数据整合单元和信息抽取单元, 通过对实体 和属性进 行信息提取、 合并, 得到结构化数据集和非结构化数据集, 再分别对两个数据集进 行数据整合和信息抽取, 提取出相关联的实体、 关系、 属性信息, 并以SPO三元 组形式形成完 整的数据库; 体系连接模块包括信息融合单元、 信息更新单元和知识图谱构建单元, 通过在同一框 架规范下进行信息的异构数据整合, 对不同实体的要素进行信息融合, 消除实体、 关系、 属 性与事实对象之间的歧义, 达 到信息融合的目的, 最终形成知识图谱; 应用模块包括输入单 元、 智能搜索单 元、 语音搜索单 元和输出 单元。 2.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 用户信 息包括商家的背 景信息、 作品风格、 销售策略和市场评价。 3.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 产品信息包括产品特 点、 受众群 体、 市场反馈和销售记录 。 4.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 逻辑连接建立模块包括 模式连接与数据连接; 数据连接主由一系列的事实组成, 而信息点将以事实为单位进行存 储; 模式连接构建在数据连接上, 通过最终的数据库来 规范数据连接的一系列事实表达 。 5.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 信 息抽取单元主要是面 向开放的链接数据, 通过自动化的技术抽取出可用的信息单元, 有三个主要工作: 实体抽 取、 关系抽取和 属性抽取。 6.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 实体抽取是从结构化数 据集和非结构化数据集中自动识别出命名实体。 由于实体是知识图谱中的最基本元素, 其 抽取的完整性、 准确、 召回率 等将直接影响到知识库的质量。 7.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 关系抽取通过提前建立 关系模型, 设置预定义的语法与规则, 解决实体间语义链接的问题。 8.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 知识图谱构建单元需要 进行实体对齐, 将其相关属 性进行交叉连接, 做出修正后, 再完成本体构建; 同时知识图谱 通过知识更新单 元定期进行自我修 正。 9.根据权利要求1所述的一种知识图谱构建系统, 其特征在于, 应用与 特定领域的垂直 行业信息分析。 10.一种包括权利要求1 ‑9任一项所述的知识图谱构建方法, 其特 征在于, 步骤如下: 。 S1、 采用集成爬取工具对用户信息挖掘以及产品信 息的挖掘, 得到相关信息点, 将信息 点分类为实体(实体1、 实体2. ..实体n)和 属性(属性1、 属性2. ..属性n); S2、 通过对实体和属性进行信息提取、 合并, 得到结构化数据集和 非结构化数据集, 再 分别对两个数据集进行数据整合和信息抽取, 提取出相关联的实体、 关系、 属 性信息, 完成 模式连接与数据连接, 以S PO三元组形式形成完整的数据库;权 利 要 求 书 1/2 页 2 CN 114925171 A 2S3、 通过在同一框架规范下进行信息的异构数据整合, 对不同实体的要素进行信息融 合, 消除实体、 关系、 属性与事实对象之间的歧义, 达到信息融合的目的, 最终形成知识图 谱。权 利 要 求 书 2/2 页 3 CN 114925171 A 3
专利 一种知识图谱构建方法及构建系统
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:55:50
上传分享
举报
下载
原文档
(379.2 KB)
分享
友情链接
T-CFA 031103.4—2018 铸造工艺数字化设计通用要求.pdf
ISOIEC 30111-2019.pdf
GB-T 31200-2014 电梯、自动扶梯和自动人行道乘用图形标志及其使用导则.pdf
GB-T 37124-2018 进入天然气长输管道的气体质量要求.pdf
GB-T 42568-2023 工业互联网平台 微服务参考框架.pdf
GB-T 11446.1-2013 电子级水.pdf
GB-Z 42285-2022 道路车辆 电子电气系统ASIL等级确定方法指南.pdf
GM-T 0012-2020 可信计算 可信密码模块接口规范.pdf
GB-T 6996-2012 透射式电视测试图.pdf
智慧水务整体解决方案.pdf
GB-T 1457-2022 夹层结构滚筒剥离强度试验方法.pdf
JR-T0116-2014 银行业标准化工作指南.pdf
GB-T 40753-2021 供应链安全管理体系 ISO 28000实施指南 ISO 28004-2007.pdf
NB-T 13007—2021 生物柴油(BD100)原料 废弃油脂.pdf
DB11-T 945.1-2023 建设工程施工现场安全防护、场容卫生及消防保卫标准 第1部分:通则 北京市.pdf
GB-T 23536-2022 超硬磨料 人造金刚石品种.pdf
GB-T 21392-2008 船舶运输能源消耗统计及分析方法.pdf
GB-T 30274-2013 信息安全技术 公钥基础设施 电子签名卡应用接口测试规范.pdf
SN-T 2770-2011 国境口岸军团菌荧光PCR检测方法.pdf
GB-T 17639-2023 土工合成材料 长丝纺粘针刺非织造土工布.pdf
1
/
3
7
评价文档
赞助2.5元 点击下载(379.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。