论文阅读笔记之CNN_MBH_StackedC3D_ovrSVM_Voting | Hello 橙子

作者

Jianqin Yin1, Bin Wang2, Xiaoli Liu1, Bin Fang2, Yanchun Wu1, Yanyan Bao2

思路

提取CNN（主要捕获外观特征） , MBH 和 stacked C3D 特征（主要捕获动态特征），构造one-vs-rest 线性 SVM ，对结果进行投票

特征提取

MBH：运动边界直方图，通过GMM和Fisher Vector 进行编码
Stacked C3D：提取时间和空间信息。由数据集Sport-1M 进行训练，通过PCA降维。通过把序列分为3部分mean-pool 获取时间信息。最后对特征堆叠获得stacked 3D
CNN（ImageNetShuffle）：从Google inception net提取，在每秒2帧的pool5层提取CNN特征，对帧进行mean-pool，然后使用L1-normalization.

分类

通过one-vs-rest linear SVM分类，weight voting 和 hard voting 做决策
如果3个结果都不同，使用weight voting：通过one-vs-rest linear SVM 学习每个动作的权重，归一所有动作得到每个动作的置信度，最高票动作是最终结果
如果至少2个结果相同，使用one-vs-rest linear SVM 对每类特征学习其置信度

置信度计算公式：

cof =1- (1- c1) (1- c2)
cof =1- (1- c1) (1- c2) (1- c3)

Prev Home Next

Comments

⬆︎TOP