作者

Jianqin Yin1, Bin Wang2, Xiaoli Liu1, Bin Fang2, Yanchun Wu1, Yanyan Bao2

思路

提取CNN(主要捕获外观特征) , MBH 和 stacked C3D 特征(主要捕获动态特征) ,构造one-vs-rest 线性 SVM ,对结果进行投票

特征提取

  • MBH:运动边界直方图,通过GMM和Fisher Vector 进行编码
  • Stacked C3D:提取时间和空间信息。由数据集Sport-1M 进行训练,通过PCA降维。通过把序列分为3部分mean-pool 获取时间信息。最后对特征堆叠获得stacked 3D
  • CNN(ImageNetShuffle) :从Google inception net提取,在每秒2帧的pool5层提取CNN特征,对帧进行mean-pool,然后使用L1-normalization.

分类

通过one-vs-rest linear SVM分类,weight voting 和 hard voting 做决策
如果3个结果都不同,使用weight voting:通过one-vs-rest linear SVM 学习每个动作的权重,归一所有动作得到每个动作的置信度,最高票动作是最终结果
如果至少2个结果相同,使用one-vs-rest linear SVM 对每类特征学习其置信度

置信度计算公式:
  • cof =1- (1- c1) (1- c2)
  • cof =1- (1- c1) (1- c2) (1- c3)

Comments

⬆︎TOP