论文阅读笔记之CNN_MBH_StackedC3D_ovrSVM_Voting
作者
Jianqin Yin1, Bin Wang2, Xiaoli Liu1, Bin Fang2, Yanchun Wu1, Yanyan Bao2
思路
提取CNN(主要捕获外观特征) , MBH 和 stacked C3D 特征(主要捕获动态特征) ,构造one-vs-rest 线性 SVM ,对结果进行投票
特征提取
- MBH:运动边界直方图,通过GMM和Fisher Vector 进行编码
- Stacked C3D:提取时间和空间信息。由数据集Sport-1M 进行训练,通过PCA降维。通过把序列分为3部分mean-pool 获取时间信息。最后对特征堆叠获得stacked 3D
- CNN(ImageNetShuffle) :从Google inception net提取,在每秒2帧的pool5层提取CNN特征,对帧进行mean-pool,然后使用L1-normalization.
分类
通过one-vs-rest linear SVM分类,weight voting 和 hard voting 做决策
如果3个结果都不同,使用weight voting:通过one-vs-rest linear SVM 学习每个动作的权重,归一所有动作得到每个动作的置信度,最高票动作是最终结果
如果至少2个结果相同,使用one-vs-rest linear SVM 对每类特征学习其置信度
置信度计算公式:
- cof =1- (1- c1) (1- c2)
- cof =1- (1- c1) (1- c2) (1- c3)