全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210885729.6 (22)申请日 2022.07.26 (71)申请人 西安电子科技大 学 地址 710071 陕西省西安市太白南路2号 (72)发明人 王楠楠 吴子成 朱明瑞 易云  何潇  (74)专利代理 机构 西安嘉思特知识产权代理事 务所(普通 合伙) 6123 0 专利代理师 勾慧敏 (51)Int.Cl. G06T 5/50(2006.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于双路条件归一化的人脸照 片-素描 画像合成方法 (57)摘要 本发明公开了一种基于双路条件归一化的 人脸照片 ‑素描画像合成方法, 包括: 获取待 合成 人脸照片 ‑素描画像对; 将待 合成人脸照片 ‑素描 画像对输入至训练好的人脸照片 ‑素描画像合成 网络得到合成结果; 其中, 人脸照片 ‑素描画像合 成网络包括编码器、 生成器和语义分割模块, 生 成器包括双路归一化模块、 门控注 意力特征融合 模块和解码器; 训练好的人脸照片 ‑素描画像合 成网络通过人脸照片 ‑素描画像对训练集训练得 到的。 本发明提高了人脸照片 ‑素描画像合成效 果的质量。 权利要求书2页 说明书12页 附图6页 CN 115375596 A 2022.11.22 CN 115375596 A 1.一种基于双路条件 归一化的人脸照片 ‑素描画像合成方法, 其特 征在于, 包括: 获取待合成人脸照片 ‑素描画像对; 将所述待合成人脸照片 ‑素描画像对输入至训练好的人脸照片 ‑素描画像合成网络得 到合成结果; 其中, 所述人脸照片 ‑素描画像合成网络包括编码器、 生成器和语义分割模块, 所述生 成器包括双路归一化模块、 门控注意力特征融合模块和解码 器; 所述训练好的人脸照 片‑素 描画像合成网络通过 人脸照片 ‑素描画像对训练集训练得到的; 对应训练过程包括: 所述编码器对所述人脸照片 ‑素描画像对训练集进行编码并输出深度特征; 所述语义 分割模块提取训练集中素描画像的语义标签; 所述双路归一化模块根据所述语义标签和所 述深度特征按空间信息支路和纹理信息支路进行加强; 所述门控注意力特征融合模块将空 间信息支路和纹理信息支路的输出结果进 行融合; 所述解码 器对融合结果进 行解码输出所 述人脸照 片‑素描画像对训练集对应的合成结果; 根据所述人脸照 片‑素描画像对训练集及 其对应的合成结果构建所述人脸照片 ‑素描画像合成网络的损失函数; 根据所述损失函数 更新所述人脸照片 ‑素描画像合成网络的参数, 继续进 行训练直至满足迭代停止条件, 得到 所述训练好的人脸照片 ‑素描画像合成网络 。 2.根据权利要求1所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述编码器包括若干依次连接的卷积层; 在所述编码器中, 将所述编码器最后三个卷积层对应的输出作为深度特 征。 3.根据权利要求1所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述双路归一 化模块包括S PADE Resblock模块和AdaI N Resblock模块, 其中, 所述SPADE  Resblock模块根据训练集 中素描画像的语义标签, 以及训练集 中人脸照片 的深度特 征进行空间信息加强; 所述AdaIN  Resblock模块根据训练集中素描画像和人脸照片的深度特征进行纹理信 息加强。 4.根据权利要求3所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述AdaIN  Resblock模块包括若干依次连接的残差AdaIN模块; 其中, 每一所述残差 AdaIN模块包括依次连接的一基础AdaI N模块和一残差模块。 5.根据权利要求3所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述S PADE Resblock模块的输出表示 为: 其中, p表示人脸照片, Ai表示第i(i=1,2,3)层深度特征对应的所述SPADE  Resblock模 块的输出, 表示第i(i=1,2,3)层深度特征中人脸照片p对应的深度特征, c表示通道, (y,x)表示 在通道c上的一位置, 表示 在第c通道上点(y,x)处的值, Ms表示语义 标签, 分别表示 在第c通道上从语义标签Ms中学习到的放缩 量、 偏移 量, 分别表示 在第c通道上的均值和方差 。权 利 要 求 书 1/2 页 2 CN 115375596 A 26.根据权利要求5所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述AdaI N Resblock模块的输出表示 为: 其中, s表示素描画像, Bi表示第i(i=1,2,3)层深度特征对应的所述AdaIN  Resblock模 块的输出, 表示第i(i=1,2,3)层深度特征中素描画像s对 应的深度特征, 表示 在第c通道上与 对应的同一点(y,x)处的值, 分别表示 在第c通道上 的均值和方差 。 7.根据权利要求6所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述门控注意力特 征融合模块包括两个门控 模块、 一通道注意力模块; 其中, 所述SPADE Resblock模块和所述AdaI N Resblock模块的输出分别输入两个门控 模块; 所述SPADE  Resblock模块和所述AdaIN  Resblock模块的输出叠加后输入所述通道注 意力模块; 将两个门控 模块的输出和所述 通道注意力模块的输出进行融合。 8.根据权利要求7所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 将两个门控 模块的输出和所述 通道注意力模块的输出进行融合表示 为: 其中, Ci表示第i(i=1,2,3)层深度特征对应的所述门控注意力特征融合模块的输出, CA(·)表示通道注意力函数, 表示Ai对应的门控函数, 表示Bi对应的门控函数。 9.根据权利要求1所述的基于双 路条件归一化的人脸照片 ‑素描画像合成方法, 其特征 在于, 所述 解码器为基于AF F模块的解码器; 在所述解码器 中, 将所述门控注意力特征融合模块的输出进行上采样得到相同分辨率 的特征后, 利用AF F模块进行 特征融合, 并解码输出。 10.根据权利要求1所述的基于双路条件归一化的人脸照片 ‑素描画像合成方法, 其特 征在于, 构建的所述人脸照片 ‑素描画像合成网络的损失函数表示 为: Lfull= λ1Ladversarial+λ2Lcycle+λ3Lperceptual; 其中, Lfull表示所述人脸照片 ‑素描画像合成网络的损失函数; Ladversarial表示生成对抗 损失, Lcycle表示循环一 致性损失, Lperceptual表示感知损, λ1、 λ2、 λ3表示平衡参数。权 利 要 求 书 2/2 页 3 CN 115375596 A 3

.PDF文档 专利 一种基于双路条件归一化的人脸照片-素描画像合成方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于双路条件归一化的人脸照片-素描画像合成方法 第 1 页 专利 一种基于双路条件归一化的人脸照片-素描画像合成方法 第 2 页 专利 一种基于双路条件归一化的人脸照片-素描画像合成方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:10:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。