视频分类
动态RNN(LSTM,GRU)
使用视频完全具有的所有帧而无需填充。
静态RNN(LSTM,GRU)
使用固定数量的帧。
如果视频长度大于固定数量,则使用统一或随机采样。
如果视频长度小于固定数量,则将使用所有帧,并使用“零功能”填充视频。
汇集
平均池化
使用所有框架。
均匀采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。
随机采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。
最大池化
使用所有框架。
均匀采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。
随机采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。
对于ConvLSTM,输入(帧/图像特征)和状态为3D张量(侧面,侧面,通道)。
ConvLSTM中的操作不是完全连接,而是后果。
继续...
如果您认为此代码有用,请考虑引用与我的视频相关的作品:
评论0
最新资源