说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210765108.4 (22)申请日 2022.07.01 (71)申请人 银联商务股份有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区张衡路10 06、 1008号 (72)发明人 孙战平 葛晓军 胡颖皓 夏伟  刘邓 叶国林 郭家文 陈志豪  (74)专利代理 机构 上海申汇 专利代理有限公司 31001 专利代理师 翁若莹 柏子雵 (51)Int.Cl. G06Q 30/02(2012.01) G06F 16/9535(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01)G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种提高商户拓展成功率的筛 选系统 (57)摘要 本发明涉及一种提高商户拓展成功率的筛 选系统, 其特征在于, 包括外部商户信息归集系 统; 银商商户管理系统; 银商新清分交易流水系 统; 大数据平台; 银商机器学习平台/关联图谱平 台; 商户拓展系统数据库; 上层应用系统。 本发明 提供的一种提高商户拓展成功率的筛选系统采 用了自动化的基于银商机器学习平台和关联图 谱平台的御风筛选算法。 该御风筛选算法通过文 本分析法赋予商户权重; 通过机器学习中的聚类 算法, 从空间的角度为商户进行商圈和行业划 分, 为拓展商户行业和类型提供了依据和保障; 根据行业规则和业务人员经验, 结合关联图谱技 术, 可以充分挖掘外部商户与存量商户的潜在关 系, 大大缩小拓展商户群体数量, 发现了更多优 质商户。 权利要求书3页 说明书8页 附图3页 CN 115293792 A 2022.11.04 CN 115293792 A 1.一种提高商户拓展成功率的筛 选系统, 其特 征在于, 包括: 外部商户信息归集系统: 用于归集外部商户的外部商户数据, 外部商户数据至少包括 商户名称、 商户经纬度坐标、 法人手机号和所属区域信息; 银商商户管理系统: 用于存储银商内部存量商户的内部商户数据, 内部商户数据至少 包括商户名称、 商户所属行业类别、 商户经纬度坐标、 法人手机号和所属区域信息; 银商新清分交易 流水系统: 用于收集并汇总银商内部存量商户的交易数据; 大数据平台: 在大数据平台中构建定时工作流, 使得大数据平台能够定时拉取外部商 户数据文件、 内部商户数据文件以及交易数据文件; 银商机器学习平台/关联图谱平台: 与大数据平台整合, 其计算资源和存储资源与大数 据平台共享; 银商机器学习平台/ 关联图谱平台通过御风筛选算法系统, 从所有外部商户中 筛选出价值较高、 可能性较大的实体候选商户, 并将筛选结果推送、 保存至商户拓展系统数 据库; 商户拓展系统数据库: 用于保存银商机器学习平台/关联图谱平台获得的实体候选商 户筛选结果, 并向上层应用 系统提供结果查询服务; 上层应用系统向商户拓展系统数据库 发送查询请求, 商户拓展系统数据库所提供 的查询服务响应该查询请求后, 向上层应用系 统反馈查询到的与当前查询请求相匹配的可拓展的实体候选商户; 上层应用系统: 相关业务人员在上层应用系统上设置查询条件, 上层应用系统基于查 询条件生成查询请求, 并将该查询请求发送给商户拓展系统数据库, 商户拓展系统数据库 响应查询请求后, 再由上层应用系统接收、 显示由商户拓展系统数据库反馈的查询结果, 基 于查询结做业 务拓展。 2.如权利要求1所述的一种提高商户拓展成功率的筛选系统, 其特征在于, 还包括FTP 文件存储系统: 用于存 储从外部商户信息归集系统推送过来的外 部商户数据文件; 所述外部商户信息归集系统归集的所述外部商户数据定时向FTP文件存储系统推送, 所述大数据平台定时从FTP文件 存储系统拉取 所述外部商户数据文件。 3.如权利要求1所述的一种提高商户拓展成功率的筛选系统, 其特征在于, 还包括数据 库, 所述大数据平台对所述外部商户数据、 所述内部商户数据以及所述交易数据进行清洗 后, 将所有数据导入数据库。 4.如权利要求1所述的一种提高商户拓展成功率的筛选系统, 其特征在于, 所述御风筛 选算法系统包括商户行业评分计算模块、 商户价 值分析模块以及优质商户推荐模块, 其中: 商户行业评分计算模块: 根据内部商户数据, 提取内部存量商户所在行业类别的关键 词, 依据所属行业类别为每个关键词设定不同的行业词权重; 提取每个外部商户的外部商 户数据的关键词, 计算不同行业类别所对应的同一个外部商户的所有关键词的行业词权重 的和作为外部商户属于各个行业的得分, 基于得分获得每个外部商户所属的行业, 并赋予 每个外部商户对应的行业标签; 商户价值分析模块通过聚类算法, 对外部商户进行商户群划分以及对同类别属性进行 预测, 最终分别估算待拓展的外 部商户的经 营状况; 优质商户推荐模块利用关联图谱等技术, 深度挖掘外部商户与内部存量商户的潜在关 联, 已识别被行业评 分子模块保留的外部商户中的潜在 商户; 同时, 优质商户推荐模块利用 代理手机标识和连锁商户, 更进一 步从外部商户中筛 选符合商户拓展的优质商户。权 利 要 求 书 1/3 页 2 CN 115293792 A 25.如权利要求4所述的一种提高商户拓展成功率的筛选系统, 其特征在于, 所述商户行 业评分计算模块进一 步包括行业词权 重计算子模块以及行业评分子模块, 其中: 行业词权 重计算子模块的实现包括以下步骤: 步骤101、 将内部存量商户划分为 不同行业类别; 步骤102、 对于每个行业类别下的所有内部存量商户, 利用结巴分词对每个内部存量商 户的商户名称进行分词处 理, 获得每 个行业类别下的所有候选关键词; 步骤103、 计算各行业类别下每个候选关键词的词比, 当前行业类别下当前候选关键词 的词比=当前候选关键词的词频/属于当前 行业类别的所有内部存量商户的数量; 步骤104、 过 滤各行业类别下词比小于预设阈值的所有候选关键词; 步骤105、 剔除各行业类别下与非行业高频词匹配的候选关键词, 得到最终的关键词, 本实施例中, 非行业高频词由人工定义, 比如可以将商户名称中所包含的省市、 公司企业名 称等定义 为非行业高频词; 步骤106、 为每个关键词设定与行业类别相对应的行业词权重, 当前关键词与当前行业 类别相对应的行业词权 重越大则当前关键词属于当前 行业类别的概 率越大; 行业评分子模块的实现包括以下步骤: 步骤201、 获得当前外部商户的商户名称, 利用结巴分词对商户名称进行分词 处理, 获 得当前商户名称所对应的候选关键词; 步骤202、 将候选关键词与非实体商户关键词相匹配, 若匹配成功, 则将当前外部商户 作为非实体商户剔除, 若匹配失败, 则进入步骤20 3; 步骤203、 剔除候选关键词中与非行业高频词匹配的候选关键词, 获得最终的关键词; 步骤204、 将当前外部商户的关键词与行业词权重计算子模块获得的各行业类别下内 部存量商户的关键词相匹配, 将匹配的内部存量商户的关键词对应于不同行业类别的行业 词权重赋予当前外 部商户的关键词; 步骤205、 计算同一行业类别下当前外部商户的所有关键词的行业词权重和, 将最大行 业词权重和所对应的行业类别作为当前外部商户所属的行业类别, 并赋予当前外部商户对 应的行业标签; 被行业评分子模块保留的外部商户及获得的对应的行业标签作为实体候选商户筛选 结果保存在商户拓展系统数据库。 6.如权利要求5所述的一种提高商户拓展成功率的筛选系统, 其特征在于, 所述商户价 值分析模块的实现包括以下步骤: 步骤301、 提取所有内部存量商户的经纬度坐标以及所属区域信息, 本实施例中, 所属 区域信息为区县编码信息; 步骤302、 利用聚类算法对同一所属区域下所有内部存量商户的经纬度坐标做聚类, 获 得每个所属区域所对应的聚类算法模型, 聚类算法模型中的不同簇代 表不同的商户群; 步骤303、 基于被行业评分子模块保留的外部商户的所属区域信息获得对应的聚类算 法模型, 再基于外部商户的经纬度坐标获得聚类算法模型中当前外部商户所属的簇, 即预 测得到当前外 部商户所属的商户群; 步骤304、 获取当前商户群中与当前外部商户所属同一行业类别的所有内部存量商户 的历史交易数据, 基于内部存量商户的历史交易数据计算当前外部商户的交易数据预测值权 利 要 求 书 2/3 页 3 CN 115293792 A 3

.PDF文档 专利 一种提高商户拓展成功率的筛选系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种提高商户拓展成功率的筛选系统 第 1 页 专利 一种提高商户拓展成功率的筛选系统 第 2 页 专利 一种提高商户拓展成功率的筛选系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。