(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211278879.7
(22)申请日 2022.10.19
(71)申请人 上海零数众合信息科技有限公司
地址 200135 上海市浦东 新区中国(上海)
自由贸易试验区 峨山路101号C 3幢
(72)发明人 孙银银
(74)专利代理 机构 北京品源专利代理有限公司
11332
专利代理师 王瑞云
(51)Int.Cl.
G06N 20/00(2019.01)
G06K 9/62(2022.01)
G06F 17/16(2006.01)
H04L 9/00(2022.01)
(54)发明名称
一种业务指标预测方法、 装置、 设备和存储
介质
(57)摘要
本发明公开了一种业务指标预测方法, 包
括: 确定纵向联邦学习中发起方的发起方数据集
和合作方的合作方数据集; 通过 发起方设备对发
起方数据集进行加密, 并向合作方设备发送加密
后的发起方数据集; 通过 发起方设备对密文相关
系数矩阵进行解密, 以确定明文相关系数矩阵;
根据发起方数据集和合作方数据集, 确定发起方
相关系数矩阵, 以及合作方相关系数矩阵; 根据
发起方相关系数矩阵、 合作方相关系数矩阵和所
述明文相关系数矩阵, 对发起方和所述合作方进
行特征多重共线性分析; 根据分析结果, 从发起
方数据集和合作方数据集中确定模 型训练数据,
并采用模型训练数据训练联邦学习模 型。 提高了
联邦学习模 型的训练效率, 保证线性模型的特征
可解释性。
权利要求书3页 说明书13页 附图5页
CN 115545216 A
2022.12.30
CN 115545216 A
1.一种业 务指标预测方法, 其特 征在于, 包括:
根据纵向联邦学习中的发起方的发起方业务数据和合作方的合作 方业务数据, 确定发
起方数据集和合作方 数据集;
通过发起方设备对所述发起方数据集进行加密, 并向合作 方设备发送加密后的发起方
数据集; 以及, 从所述合作方设备获取发起方和合作方之 间的密文相关系数矩阵, 并通过所
述发起方设备对所述密文相关系数矩阵进行解密, 且根据解密结果确定明文相关系数矩
阵;
根据所述发起方数据集和所述合作方数据集, 确定所述发起方的发起方相关系数矩
阵, 以及所述 合作方的合作方相关系数矩阵;
根据所述发起方相关系数矩阵、 所述合作方相关系数矩阵和所述明文相关系数矩阵,
对所述发起方和所述 合作方进行 特征多重共线性分析;
根据特征多重共线性分析结果, 从所述发起方数据集和所述合作 方数据集中确定模型
训练数据, 并采用模型训练数据训练联邦学习模型; 所述联邦学习模型用于预测用户的业
务指标值。
2.根据权利要求1所述的方法, 其特征在于, 通过发起方设备对所述发起方数据集进行
加密, 并向合作方设备发送加密后的发起方数据集; 以及, 从所述合作方设备获取发起方和
合作方之 间的密文相关系数矩阵, 并通过所述发起方设备对所述密 文相关系数矩阵进 行解
密, 且根据解密结果确定明文相关系数矩阵, 包括:
通过发起方设备, 采用同态加密算法生成密钥对, 采用所述密钥对中的公钥对所述发
起方数据集进行加密;
将加密后的发起方数据集发送至所述合作方设备, 以通过所述合作方设备, 根据加密
后的发起方数据集, 以及同态加密算法的乘法特性, 计算所述发起方数据集中的特征数据
和所述合作方数据集中的特征数据之间的密文特征相关系数, 根据所述密文特征相关系
数, 确定所述发起方和所述 合作方之间的密文相关系数矩阵;
将所述密文相关系数矩阵发送给所述发起方设备, 以通过所述发起方设备, 采用所述
密钥对中的私钥, 对所述密文相关系 数矩阵进行解密, 根据解密结果确定所述发起方数据
集中的特 征数据和所述 合作方数据集中的特 征数据之间的明文相关系数矩阵。
3.根据权利要求1所述的方法, 其特征在于, 根据所述发起方相关系数矩阵、 所述合作
方相关系数矩阵和所述明文相关系数矩阵, 对所述发起方和所述合作方进 行特征多重共线
性分析, 包括:
根据所述发起方相关系数矩阵、 所述合作方相关系数矩阵和所述明文相关系数矩阵,
确定相关系数融合矩阵, 并确定所述相关系数融合矩阵的完整矩阵行列式值;
确定从所述相关系数融合矩阵中删除矩阵特征数据所在的特征行和特征列后特征矩
阵行列式值;
将所述特征矩阵行列式值和所述完整矩阵行列式值之间的比值, 作为所述矩阵特征数
据的多重共线性值, 整合所有矩阵特征数据的多重共线性值, 确定所述发起方和所述合作
方的多重共线性值, 将所述 发起方和所述合作方的多重共线性值作为特征多重共线性分析
结果。
4.根据权利要求1所述的方法, 其特征在于, 根据纵向联邦学习中的发起方的发起方业权 利 要 求 书 1/3 页
2
CN 115545216 A
2务数据和合作方的合作方业 务数据, 确定发起方 数据集和合作方 数据集, 包括:
确定纵向联邦学习中的发起方和合作方的相同用户, 基于所述相同用户的身份标识,
确定所述发起方的发起方业 务数据和所述 合作方的合作方业 务数据之间的数据交集;
根据所述数据交集分别对所述发起方业务数据和所述合作 方业务数据进行处理, 确定
发起方数据集和合作方 数据集。
5.根据权利要求1所述的方法, 其特征在于, 根据 所述发起方数据集和所述合作 方数据
集, 确定所述发起方的发起方相关系数矩阵, 以及所述合作方的合作方相关系数矩阵, 包
括:
对所述发起方数据集中的特征数据和所述合作方数据集中的特征数据进行标准化处
理, 确定发起方 标准化数据和合作方 标准化数据;
根据发起方标准化数据的各特征数据之间的相关系数, 确定所述发起方的发起方相关
系数矩阵, 根据合作方标准化数据的各特征数据之间的相关系 数, 确定所述合作方 的合作
方相关系数矩阵。
6.根据权利要求1所述的方法, 其特征在于, 根据特征多重共线性分析结果, 从所述发
起方数据集和所述合作方数据集中确定模型训练数据, 并采用模型训练数据训练联邦学习
模型, 包括:
根据特征多重共线性分析结果和多重共线性阈值, 对所述发起方数据集中的特征数据
和所述合作方数据集中的特征数据进 行筛选, 确定所述 发起方数据集和所述合作方数据集
中多重共线性值小于多重共线性阈值的特征数据为模型训练数据, 通过模 型训练数据训练
联邦学习模型。
7.根据权利要求1所述的方法, 其特征在于, 根据纵向联邦学习中的发起方的发起方业
务数据和合作方的合作方业 务数据, 确定发起方 数据集和合作方 数据集之后, 还 包括:
确定发起方 数据集中的特 征数据和所述 合作方数据集中的特 征数据的数据贡献度;
根据所述数据贡献度, 对所述发起方数据集中的特征数据和所述合作方数据集中的特
征数据进行 过滤处理。
8.一种业 务指标预测装置, 其特 征在于, 包括:
数据集确定模块, 用于根据纵向联邦学习中的发起方的发起方业务数据和合作 方的合
作方业务数据, 确定发起方 数据集和合作方 数据集;
数据集加密传输模块, 用于通过发起方设备对所述发起方数据集进行加密, 并向合作
方设备发送加密后的发起方数据集; 以及, 从所述合作方设备获取发起方和 合作方之间的
密文相关系 数矩阵, 并通过所述发起方设备对所述密文相关系 数矩阵进行解密, 且根据解
密结果确定明文相关系数矩阵;
相关系数矩阵确定模块, 用于根据所述发起方数据集和所述合作方数据集, 确定所述
发起方的发起方相关系数矩阵, 以及所述 合作方的合作方相关系数矩阵;
多重共线性分析模块, 用于根据所述发起方相关系数矩阵、 所述合作方相关系数矩阵
和所述明文相关系数矩阵, 对所述发起方和所述 合作方进行 特征多重共线性分析;
模型训练模块, 用于根据特征多重共线性分析结果, 从所述发起方数据集和所述合作
方数据集中确定模型训练数据, 并采用模型训练数据训练联邦学习模型; 所述联邦学习模
型用于预测用户的业 务指标值。权 利 要 求 书 2/3 页
3
CN 115545216 A
3
专利 一种业务指标预测方法、装置、设备和存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 05:42:09上传分享