专利 一种动作识别中基于通道分组的时空特征分离提取方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210908816.9 (22)申请日 2022.07.29 (71)申请人南京邮电大学地址 210003 江苏省南京市鼓楼区新模范马路66号 (72)发明人张伟　吉晨钟　陈云芳　 (74)专利代理机构南京经纬专利商标代理有限公司 32200 专利代理师王慧 (51)Int.Cl. G06V 20/40(2022.01) G06V 40/20(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/77(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种动作识别中基于通道分组的时空特征分离提取方法 (57)摘要本发明公开了一种动作识别中基于通道分组的时空特征分离提取方法，首先对视频进行稀疏采样，使用ResNet网络作为骨干网络对采样得到的帧序列提取基本特征，得到各帧的特征图；再通过对特征图的通道分组，将每一帧特征图的通道分成两组，一组使用可学习的通道移位操作赋予2D卷积学习时间特征的能力；另一组通过减少时间特征增加空间通道的方式使其关注空间特征的学习；最后对时间特征提取分支和空间特征提取分支得到的特征进行时间对齐后堆叠融合，得到时空特征的聚合表达。本发明解决了现有技术中视频动作识别中2D卷积神经网络难以提取视频时间特征的问题，使得动作识别效率和准确性兼顾。权利要求书2页说明书5页附图2页 CN 115331140 A 2022.11.11 CN 115331140 A 1.一种动作识别中基于通道分组的时空特征分离提取方法，其特征在于，包括如下步骤： S1，对视频进行稀疏采样，使用ResNet网络作为骨干网络对采样得到的帧序列提取基本特征，得到各帧的特征图； S2，在ResNet网络的每个残差块的残差分支中，每一帧的特征图经过通道注意力模块，得到特征图各通道的权重；然后依据权重值将各帧的特征图的通道分成两组，权重不小于阈值的通道分入第一组，权重小于阈值的通道分入第二组；组内的通道顺序遵从原特征图的通道顺序； S3，第一组通道组成的特征图送入时间特征提取分支中，将可学习的通道平移操作作用于特征图所有通道，使得各帧特征图拥有与相邻帧特征图动态交互的能力，学习时间特征；第二组通道组成的特征图送入在空间特征提取分支中，保持特征总数量不变的前提下，在特征图时间维度下采样的同时通过卷积操作增加各帧特征图空间通道数量。 S4，对时间特征提取分支和空间特征提取分支得到的特征进行时间对齐后堆叠融合，得到时空特征的聚合表达。 2.根据权利要求1所述的动作识别中基于通道分组的时空特征分离提取方法，其特征在于，所述步骤S1中，将动作视频平均分为T份，在每一份中随机抽取一帧图片，然后经过 ResNet网络提取基础特征，得到对应的特征图组为： X＝{x1,x2,…,xT} 其中,T是输入网络的视频帧数，是第t帧的特征图， C是通道数量， H和W是空间维度大小。 3.根据权利要求1所述的动作识别中基于通道分组的时空特征分离提取方法，其特征在于，所述步骤S2中，每一帧的特征图经过通道注意力模块，得到特征图各通道的权重；然后依据权重值将各帧的特征图的通道分成两组的实现步骤如下： S21，在空间维度对各帧的特征图xt进行平均池化，得到 S22，对所有池化后时间相邻的特征图和分别进行2D卷积运算后逐元素相减，相减得到的结果为st：其中， Wθ和为卷积参数， Co nv()为卷积运算； S23，对st进行2D卷积运算得到然后采用sigmo id函数运算，记为其中， σ 是 sigmoid函数，是卷积参数， C onv()为卷积运算；中每个元素的范围都在0 到1之间， C是通道数量； S24，根据将特征图xt的通道划分成两组：第一组选取中值不小于阈值ζ 的对应的xt通道，记为其通道数量记为ρ( ζ )；第二组选取中值小于阈值ζ 的对应的xt通道，记为其通道数量记为C ‑ρ( ζ )。权　利　要　求　书 1/2 页 2 CN 115331140 A 24.根据权利要求3所述的动作识别中基于通道分组的时空特征分离提取方法，其特征在于，所述步骤S 3中，将可学习的通道移位操作作用于特征图所有通道，使得各通道拥有与相邻通道交互的能力的实现步骤如下：对第一组特征图组在每个通道上采用 channel‑wise 1D卷积，得到其中T是时间维度大小,H和W是空间维度大小， ρ( ζ )是通道维度数量；对第二组特征图组在时间维度上采用 Temporal ‑wise 1D卷积，使得特征图组的时间维度由T降低至 α 为变化幅度；然后采用2D 卷积使得特征图组中各特征图的通道增加到α( C ‑ρ(ζ) ) ，最后得到 5.根据权利要求1所述的动作识别中基于通道分组的时空特征分离提取方法，其特征在于，所述步骤S4中，将对时间特征提取分支和空间特征提取分支得到的特征进行融合的实现步骤如下：将第二组输出的特征图进行 R e s h a p e 操作，得到使得两组特征在时间维度对齐；然后使用Concatenate操作和第一组的输出进行融合。权　利　要　求　书 2/2 页 3 CN 115331140 A 3

专利 一种动作识别中基于通道分组的时空特征分离提取方法

专利一种动作识别中基于通道分组的时空特征分离提取方法