(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211219715.7
(22)申请日 2022.10.08
(71)申请人 豪符密码检测技 术 (成都) 有限责任
公司
地址 610095 四川省成 都市中国 (四川) 自
由贸易试验区成都高新区和乐二街
150号2栋2单 元12层
(72)发明人 陈万钢 李昆阳 饶金涛 杨伟
(74)专利代理 机构 成都立新致创知识产权代理
事务所 (特殊普通合伙)
51277
专利代理师 刘俊
(51)Int.Cl.
G06F 21/60(2013.01)
G06F 21/57(2013.01)G06N 20/00(2019.01)
(54)发明名称
一种联邦学习模型和数据安全性及正确性
的检测方法
(57)摘要
本发明涉及一种联邦学习模型和数据安全
性及正确性的检测方法, 属于密码和数据安全技
术领域, 对联邦学习参与方的合格性进行检测,
通过在联邦学习检测过程中引入第三方可信计
算模块实现整个联邦学习模型对数据安全性和
正确性的检测和验证, 并且通过对 联邦学习涉及
相关环节的检测和总体判断, 实现对模型失败与
否的判断, 以及联邦学习过程中数据安全性的判
断。 本发明解决了传统技术不检测参与方合格
性, 不检测参与方密码应用正确性, 不对最终模
型安全性和正确性进行检测以及没有采用第三
方可信计算模块进行验证的缺陷, 能够在保证安
全的前提下进行正确性和安全性检测。
权利要求书3页 说明书7页 附图1页
CN 115292738 A
2022.11.04
CN 115292738 A
1.一种联邦学习模型和数据安全性及正确性的检测方法, 其特征在于: 所述检测方法
包括:
S1、 设定选择联邦学习参与方的评价参数和模型, 并检测参与方是否合格以及样本是
否对齐;
S2、 参与方使用密码模块产生密码杂凑算法参数, 采用密码杂凑算法计算参与训练数
据的杂凑值;
S3、 设定每一轮模型下发方式和顺序后发送模型, 将至少一个参与方接收到的模型和
模型发出 方的模型进行对比, 检测模型的一 致性;
S4、 根据模型特征和目的设定样本数据, 模型发出方下发样本数据、 权重数据和参数数
据, 将参与方接收到的数据与下发的数据进行对比, 检测数据和模型的一 致性;
S5、 根据预先设定的数据 特征重叠评价指标和用户重叠评价指标对数据发出方与参与
方数据进行评价检测, 判断联邦学习类型 是否合理, 并输出 联邦学习类型合理性结果;
S6、 按比例和数量选择训练过程中设定参数异常的参与方, 并对其进行数据检测, 数据
异常的参与方停止参与训练, 并进行异常提醒;
S7、 将训练模型得到的模型梯度、 模型参数和中间结果数据加密后发送给其他参与方
进行检测;
S8、 对模型梯度、 模型参数和中间结果数据进行检测以及整合的检测;
S9、 根据联邦学习模型, 各参与方接收新的模型梯度、 模型参数和中间数据, 将这些数
据解密后更新模型, 并至少检测一个参与方新模型的偏差 。
2.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特
征在于: 所述检测参与方 是否合格以及样本是否对齐包括:
S11、 按照评价参数至少对一个符合参与要求的参与方进行检测, 可将模型和数据导入
第三方可信计算模块计算验证, 输出检测结果;
S12、 按照参数要求至少对一个不符合参与要求的潜在参与方进行检测, 可将模型和数
据导入第三方 可信计算模块计算验证, 输出检测结果;
S13、 对需要开展样本加密对齐的联邦学习, 查看样本对齐过程中数据交互是否进行了
加密保护和 编码保护, 如果数据没有进 行加密保护, 或者只进 行了编码保护, 则提醒存在风
险;
S14、 对需要开展样本加密对齐的联邦学习, 在数据交互过程中输入指定的明文数据,
获取数据交互过程中的加密数据或者编码数据, 并根据获取 结果输出风险提醒;
S15、 对需要开展样本加密对齐的联邦学习, 将参与方样本数据导入到第三方可信计算
模块中对比重叠用户, 并将 重叠用户名与样本数据进 行对比, 如果不一致, 则表明样本对齐
存在问题, 输出风险提醒。
3.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特
征在于: 所述检测模型的一 致性包括:
S31、 对模型文件进行加密保护的情况, 通过参与方收到的密钥 对模型加密文件进行解
密, 如果解密成功, 则进行 执行步骤S32, 如果 解密不成功, 则检测终止, 输出检测结果;
S32、 采用密码杂凑算法计算参与方接收到的模型杂凑值, 并将该模型杂凑值与模型发
出方的模型计算得到的杂凑值进行对比, 如果一致, 则判断模型一致, 执行步骤S4, 如果不权 利 要 求 书 1/3 页
2
CN 115292738 A
2一致, 则判断模型不 一致, 则检测终止, 输出检测结果。
4.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特
征在于: 所述检测数据和模型的一 致性包括:
S41、 对数据进行加密的情况, 用接收到的密钥 对文件进行解密, 如果解密成功, 则执行
步骤S42, 如果 解密不成功, 则检测终止, 输出检测结果;
S42、 采用密码杂凑算法计算参与方接收到的数据杂凑值, 并将该数据杂凑值与数据发
出方的数据计算得到的杂凑值进 行对比, 如果一致, 则判断数据一致, 则执行步骤S43, 如果
不一致, 则判断数据不 一致, 则检测终止, 输出检测结果;
S43、 将样本数据代入模型计算, 将得到的结果与模型发出方采用该样本数据在模型中
计算得到的结果进 行对比, 如果一致, 则判断模 型一致, 则执行步骤S 5, 如果不一致, 则判断
模型不一致, 则检测终止, 输出检测结果。
5.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特
征在于: 步骤S6中数据检测的具体包括以下内容:
S61、 计算安全特征参数异常的参与方占总的参与方比值, 并输出该比值结果, 如果该
值超过预期值, 则进行风险提醒;
S62、 将被检测参与方数据杂凑值与检测开始 阶段计算的杂凑值进行对比, 如果一致,
说明数据未被修改, 如果 不一致, 则说明数据被修改, 输出风险提醒;
S63、 将被检测参与方的本轮训练结果、 训练数据、 训练模型、 模型参数以及数据允许的
偏差输入到第三方可信计算模块, 在第三方可信计算模块内部重新训练, 并根据训练结果
判断是否 输出风险提醒。
6.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特
征在于: 步骤S7中检测的具体内容包括:
S71、 查看参与方之间、 参与方与模型下发方通信个方数据传输是否被加密保护、 编码
保护或者加密与编码共同保护, 如果没有, 则提醒存在数据安全风险;
S72、 对被保护数据进行解密或者解码, 并对解码或者解码结果与明文进行对比, 如果
一致, 则判断保护措施实现正确, 如果不一致, 则判断保护措施实现错误, 并提醒存在数据
安全风险;
S73、 输入指定数据, 检查指定数据加密后的结果数据是否与预计结果数据一致或者在
允许的偏差范围内, 并将数据解密后得到的数据与指定数据进行对比, 判断是否一 致。
7.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特
征在于: 步骤S 8中对模型梯度、 模型参数和中间结果数据进行检测的具体内容包括:
A1、 对加密保护或者编码保护的模型梯度、 模型参数和中间结果数据进行解密或者解
码得到相应的数据;
A2、 根据设定的各个重要数据偏差对解密或者解码得到的数据进行对比, 判断是否在
允许的偏差范围内, 如果在, 则执 行步骤A3, 如果 不在, 则输出风险提醒;
A3、 将参与方的模型梯度、 数据结构、 中间结果和少量样本数据传入到第三方可信计算
模块, 根据求取模型梯度和中间结果的计算方式进行逆运算, 得到基于该数据结构的数据
模型, 将样本数据导入 模型进行运 算。
8.根据权利要求1所述的一种联邦学习模型和数据安全性及正确性的检测方法, 其特权 利 要 求 书 2/3 页
3
CN 115292738 A
3
专利 一种联邦学习模型和数据安全性及正确性的检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 05:38:54上传分享