《表1 空间布局模块的长时记忆度结果》
对于空间布局,我们考虑3种不同的设置,即简单遮罩、重叠遮罩和面积大小遮罩.简单遮罩即为我们用值1填充对象的像素,其他像素用值0填充.带重叠的遮罩表示重叠区域由包含此区域的对象数填充.而面积大小遮罩是用区域大小而不是值1填充像素.对于每种设置,我们还考虑沿时间维度融合所有帧的两种策略:平均和LSTM.表1和表2给出不同空间布局策略的结果.可以看到,重叠在空间布局中并不重要,简单遮罩就可以很好地表示空间布局.此外,时序信息对性能没有帮助.我们认为,首先,大多数视频的场景没有剧烈的变化,捕捉到的时序信息并不能很好地和平均策略有所区分.其次,对于场景变化不大的视频来说,人们可能更关注视频的整体空间布局,而不是随时间变化的模式.如果我们将实验数据换成电影广告等视频,也许动作场面的设计、场景的变幻更能抓住人的眼球.
图表编号 | XD00168936800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 王帅、王维莹、陈师哲、金琴 |
绘制单位 | 中国人民大学信息学院、中国人民大学信息学院、中国人民大学信息学院、中国人民大学信息学院 |
更多格式 | 高清、无水印(增值服务) |