说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210704281.3 (22)申请日 2022.06.21 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 张举勇 蔡泓锐 (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06T 17/00(2006.01) G06T 7/33(2017.01) (54)发明名称 基于RGB-D序列的三维动态重建方法、 训练 装置及电子设备 (57)摘要 本发明公开了一种基于RGB ‑D序列的三维动 态重建方法, 包括: 将待重建对象输入到参数优 化后的三维动态重建模型中, 得到待重建对象 的 几何重建模 型和颜色重建模型。 本发 明还公开了 基于RGB‑D序列的三维动态重建训练装置。 本发 明同时还公开了适用于基于RGB ‑D序列的三维动 态重建方法的电子设备以及存 储介质。 权利要求书3页 说明书10页 附图4页 CN 115018989 A 2022.09.06 CN 115018989 A 1.一种基于RGB ‑D序列的三维动态重建方法, 包括: 将待重建对象输入到参数优化后的三维动态重建模型中, 得到所述待重建对象的几何 重建模型和颜色重建模型, 其中, 所述参数优化后的三维动态重建模型通过下述方法训练 得到: 随机初始化三维动态重建模型, 其中, 所述三维动态重建模型包括双射映射网络、 拓扑 感知网络和隐式基准空间; 获取深度相机的视线方向以及目标训练对象上采样点的法 向量, 并通过所述深度相机 获取训练对象的RGB信息和深度信息; 将通过所述深度相机采集得到的RGB ‑D序列信息进行预处理, 得到所述训练对象的掩 码信息; 将所述掩码信 息与所述三维动态重建模型的形变编码进行张量运算, 得到张量运算结 果; 利用所述双射映射网络和所述拓扑感知网络将所述张量运算结果映射到所述 隐式基 准空间中, 得到映射结果; 利用所述 隐式基准空间处理所述映射结果, 并利用符号距离函数渲染处理结果, 得到 所述训练对象的预测的掩码信息和所述训练对象的预测的深度信息; 将所述视线方向、 所述三维动态重建模型的外观编码和所述映射结果进行复合运算, 并利用神经辐射场对复合 运算的结果进行渲染, 得到所述训练对象的预测的RGB信息; 将所述视线方向、 所述法向量、 所述掩码信息、 所述RGB信息、 所述深度信息、 所述预测 的掩码信息、 所述预测的RGB信息以及所述预测的深度信息输入到损失函数中, 得到损失 值, 并根据损失值优化所述 三维动态重建模型的参数; 迭代进行获取操作、 预处理操作、 张量运算操作、 映射操作、 渲染操作以及优化操作, 直 到所述损失值满足预设条件, 得到参数优化后的三维动态重建模型。 2.根据权利要求1所述的方法, 其中, 所述利用所述双射映射网络和所述拓扑感知网络 将所述张量 运算结果映射到所述隐式基准空间中, 得到映射结果包括: 利用所述双射映射网络的坐标变换模块对所述张量运算结果进行坐标变换, 得到变换 结果, 其中, 所述双射映射网络的坐标变换模块的数量与所述张量运算结果的维度相同, 每 个所述双射映射网络的坐标变换模块用于对所述张量 运算结果进行一次坐标变换; 利用所述拓扑感知网络将所述变换 结果映射到隐式基准空间中, 得到映射结果。 3.根据权利要求2所述的方法, 其中, 所述利用所述双射映射网络的坐标变换模块对所 述张量运算结果进行坐标变换, 得到变换 结果包括: 随机选择所述张量运算结果中的一个坐标轴作为变换基准轴, 并利用所述坐标变换模 块对所述变换基准轴上的张量 值进行平 移, 得到平 移结果; 根据所述平移结果, 利用所述坐标变换模块对所述张量运算结果中的其他坐标轴 进行 平移和进行绕所述变换基准轴旋转, 得到一次变换 结果; 迭代进行平移操作和旋转操作, 直到所有所述坐标变换模块完成对所述张量运算结果 的坐标变换, 得到变换 结果。 4.根据权利要求2 ‑3任一所述的方法, 其中, 每 个所述变换 结果连续可微且周期相同。 5.根据权利要求1所述的方法, 其中, 所述损失函数包括自由空间损失函数和表面上的权 利 要 求 书 1/3 页 2 CN 115018989 A 2损失函数。 6.根据权利要求5所述的方法, 其中, 所述自由空间损失函数包括RGB监督损失函数、 深 度图监督损失函数、 掩码图监 督损失函数和正则项损失函数; 其中, 所述RGB监 督损失函数由公式(1)确定: 所述深度图监 督损失函数由公式(2)确定: 所述掩码图监 督损失函数由公式(3)确定: 所述正则项损失函数由公式(4)确定: 其中, 表示RGB相机的内参矩阵, 表示深度相机的内参矩阵, 为相机运 动的外参矩阵, 表示采样射线集合, C(r)表示观测的RGB信息, D(r)表示观测的深度信息, M(r)表示观测的掩码信息, 表示预测的RGB信息, 表示预测的深度信息, 表 示预测的掩码信息, BC E为交叉熵函数, 为采样点 集合。 7.根据权利要求5所述的方法, 其中, 所述表面上的损失函数包括SDF损失函数和可见 性损失函数; 其中, 所述S DF损失函数由公式(5)确定: 所述可见性损失函数由公式(6)确定: 其中, np表示法向, vp表示视线方向, pi表示, d(x)表示, 表示。 8.一种基于RGB ‑D序列的三维动态重建训练装置, 包括: 初始化模块, 用于随机初始化三维动态重建模型, 其中, 所述三维动态重建模型包括双 射映射网络、 拓扑感知网络和隐式基准空间; 获取模块, 用于获取深度相机的视线方向以及目标训练对象上采样点的法向量, 并通 过所述深度相机获取训练对象的RGB信息和深度信息; 预处理模块, 用于将通过所述深度相机采集得到的RGB ‑D序列信息进行预处理, 得到所 述训练对象的掩码信息; 张量运算模块, 用于将所述掩码信 息与所述三维动态重建模型的形变编码进行张量运 算, 得到张量 运算结果; 映射模块, 用于利用所述双射映射网络和所述拓扑感知网络将所述张量运算结果映射 到所述隐式基准空间中, 得到映射结果;权 利 要 求 书 2/3 页 3 CN 115018989 A 3
专利 基于RGB-D序列的三维动态重建方法、训练装置及电子设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 05:40:21
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
T-CES 143—2022 分布式电化学储能电站智能运维技术规范.pdf
GB-T 20273-2019 信息安全技术 数据库管理系统安全技术要求.pdf
GB-T 35010.3-2018 半导体芯片产品 第3部分:操作、包装和贮存指南.pdf
GB-T 10001.1-2012 公共信息图形符号 第1部分:通用符号.pdf
GB 29384-2012 乙酰甲胺磷原药.pdf
GB-T 31167-2023 信息安全技术 云计算服务安全指南.pdf
GB-T 9846-2015 普通胶合板.pdf
DB34-T 3433.2-2019 计量检测数据信息 第 2 部分:采集规范 安徽省.pdf
T-CESA 1299-2023 信息技术服务 运行维护服务能力成熟度模型.pdf
GB-T 39909-2021 科技计划形成的科学数据汇交 通用数据元.pdf
GB-T 36549-2018 电化学储能电站运行指标及评价.pdf
T-CADERM 2001—2018 胸痛中心 标准版 建设与评估标准.pdf
DB52-T 1541.5-2021 政务数据平台 第5部分:安全技术规范 贵州省.pdf
GB-T 26778-2023 汽车列车性能要求及试验方法.pdf
T-ZZB 0602—2018 环保节能舒适型冷风扇.pdf
T-YFSEA 0008—2023 陆用液体装卸臂检验规程.pdf
GB-T 42716-2023 电化学储能电站建模导则.pdf
教育部机关及直属事业单位教育数据管理办法.pdf
NIST.SP.800-190 容器安全指南.pdf
信通院 数据安全技术与产业发展研究报告-2021年.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。