说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210703746.3 (22)申请日 2022.06.21 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市金寨路96号 (72)发明人 郭庆浪 刘跃 吴曼青 廖勇  蒋能莹  (74)专利代理 机构 合肥天明专利事务所(普通 合伙) 34115 专利代理师 谢中用 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/335(2019.01) G06N 5/04(2006.01) G06Q 10/08(2012.01) (54)发明名称 一种快递信息补全方法和系统 (57)摘要 本发明涉及知识图谱技术领域, 公开了一种 快递信息补全方法和系统, 包括两个大步骤, 一 是通过数据检索, 从而筛选出可能是目标数据的 碰撞结果数据集; 二是通过算法分析, 在碰撞结 果数据集中找到最接近快递信息M本身的那条数 据, 进而对快递信息进行补全。 权利要求书1页 说明书3页 附图1页 CN 115422363 A 2022.12.02 CN 115422363 A 1.一种快递信息补全方法, 包括以下步骤: 步骤A: 将脱敏的快递信息M以特定格式作为参数在大数据平台中进行数据碰撞, 数据 碰撞所用的基础库包括手机号码专题库、 手机号码置信度库和地址专题库; 数据碰撞具体 包括: 步骤A1: 基于特定地区H的常住人口库数据进行数据碰撞, 如果碰撞失败则进行步骤 A2, 如果碰撞成功则得到碰撞结果数据集C1, 通过步骤B将快递信息M与碰撞结果数据集C1 进行匹配; 步骤A2: 基于特定地区H的健康码出入库数据进行数据碰撞, 如果碰撞失败则进行步骤 A3, 如果碰撞成功则得到碰撞结果数据集C2, 通过步骤B将快递信息M与碰撞结果数据集C2 进行匹配; 步骤A3: 基于特定地区H的实有人口库数据进行数据碰撞, 如果碰撞成功则得到碰撞结 果数据集C 3, 通过步骤B将快递信息 M与碰撞结果数据集C 3进行匹配; 步骤B: 快递信息M与碰撞结果数据集C1、 或与碰撞结果数据集C2、 或与碰撞结果数据集 C3进行匹配, 在碰撞结果数据集C1、 C2或C 3中找到与快递信息 M最接近的数据Z; 步骤C: 通过 数据Z对快递信息 M进行信息补全, 实现快递信息 M的反脱敏。 2.根据权利要求1所述的快递信息补全方法, 其特征在于, 步骤B中, 在碰撞结果数据集 C1、 C2或C 3中匹配与快递信息 M最接近的数据Z时, 当满足以下 条件之一时, 得到数据Z: 将快递信 息M与碰撞结果数据集的常住地址名称进行相似度匹配或者进行文本向量对 比, 相似度匹配结果或者向量对比结果达 到设定条件; 将快递信息M与碰撞结果数据集中的常住地址经纬度进行覆盖算法分析, 分析结果达 到设定条件; 将快递信 息M对应的人员的家庭汇总信 息与碰撞结果数据集的常住地址名称进行相似 度匹配或者进行文本向量对比, 相似度匹配结果或者向量对比结果达 到设定条件。 3.一种快递信息补全系统, 其特 征在于, 包括: 数据检索模块, 其将脱敏的快递信息M以特定格式作为参数在大数据平台中进行数据 碰撞, 数据碰撞所用的基础库包括手机号码专题库、 手机号码置信度库和地址专题库; 数据 碰撞具体包括: 基于特定地区H的常住 人口库数据进行数据碰撞, 如果碰撞失败则进行步骤A2, 如果碰 撞成功则得到 碰撞结果数据集C1, 通过步骤B将快递信息 M与碰撞结果数据集C1进行匹配; 基于特定地区H的健康码出入库数据进行数据碰撞, 如果碰撞失败则进行步骤A3, 如果 碰撞成功则得到碰撞结果数据集C2, 通过步骤B将快递信息M与碰撞结果数据集C2进行匹 配; 基于特定地区H的实有人口库数据进行数据碰撞, 如果碰撞成功则得到碰撞结果数据 集C3, 通过步骤B将快递信息 M与碰撞结果数据集C 3进行匹配; 算法分析模块, 其将快递信息M与碰撞结果数据集C1、 或与碰撞结果数据集C2、 或与碰 撞结果数据集C3进行匹配, 在碰撞结果数据集C1、 C2或C3中找到与快递信息M最接近的数据 Z; 信息补全 模块, 其通过数据Z对快递信息 M进行信息补全, 实现快递信息 M的反脱敏。权 利 要 求 书 1/1 页 2 CN 115422363 A 2一种快递信息补全方 法和系统 技术领域 [0001]本发明涉及 知识图谱技 术领域, 具体涉及一种快递信息补全方法和系统。 背景技术 [0002]给定模糊信息, 对其进行信息匹配并进一步补全需要用到知识图谱实体抽取技 术, 包含知识库中的实体、 归类和链接。 实体消歧和实体链接是一个统一的任务, 通过将具 有歧义的实体指称项链接到给定的知识库中从而实现实体歧义的消除, 能够较好解决一词 多义问题。 [0003]现存在脱敏的快递数据, 公共安全系统无法精准分析使用, 需要对现有脱敏快递 数据进行反脱敏补齐, 方便公共安全系统基于反脱敏 数据精准 业务分析。 发明内容 [0004]为解决上述 技术问题, 本发明提供一种快递信息补全方法和系统。 [0005]为解决上述 技术问题, 本发明采用如下技 术方案: [0006]一种快递信息补全方法, 包括以下步骤: [0007]步骤A: 将脱敏的快递信息M以特定格式作为参数在大数据平台中进行数据碰撞, 数据碰撞所用的基础库包括手机号码专题库、 手机号码置信度库和地址专题库; 数据碰撞 具体包括: [0008]步骤A1: 基于特定地区H的常住人口库数据进行数据碰撞, 如果碰撞失败则进行步 骤A2, 如果碰撞成功则得到碰撞结果数据集C1, 通过步骤B将快递信息M与碰撞结果数据集 C1进行匹配; [0009]步骤A2: 基于特定地区H的健康码出入库数据进行数据碰撞, 如果碰撞失败则进行 步骤A3, 如果碰撞成功则得到碰撞结果数据集C2, 通过步骤B将快递信息M与碰撞结果数据 集C2进行匹配; [0010]步骤A3: 基于特定地区H的实有人口库数据进行数据碰撞, 如果碰撞成功则得到碰 撞结果数据集C 3, 通过步骤B将快递信息 M与碰撞结果数据集C 3进行匹配; [0011]步骤B: 快递信息M与碰撞结果数据集C 1、 或与碰撞 结果数据集C2、 或与碰撞结果数 据集C3进行匹配, 在碰撞结果数据集C1、 C2或C 3中找到与快递信息 M最接近的数据Z; [0012]步骤C: 通过 数据Z对快递信息 M进行信息补全, 实现快递信息 M的反脱敏。 [0013]具体地, 步骤B中, 在碰撞结果数据集C 1、 C2或C3中匹配与快递信息M最接近的数据 Z时, 当满足以下 条件之一时, 得到数据Z: [0014]将快递信息M与碰撞结果数据集的常住地址名称进行相似度匹配或者进行文本向 量对比, 相似度匹配结果或者向量对比结果达 到设定条件; [0015]将快递信息M与碰撞结果数据集中的常住地址经纬度进行覆盖算法分析, 分析结 果达到设定条件; [0016]将快递信息M对应的人员的家庭汇总信息与碰撞结果数据集的常住地址名称进行说 明 书 1/3 页 3 CN 115422363 A 3

.PDF文档 专利 一种快递信息补全方法和系统

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种快递信息补全方法和系统 第 1 页 专利 一种快递信息补全方法和系统 第 2 页 专利 一种快递信息补全方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:54:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。