日常行为,包含ActivityNet,HMDB,UCF101,MPII HumanPose,ACT等数据库 一共306245个clips,400类 每类400-1150个clips,训练250-1000,clips,验证50clips,测试100clips 每个clip大约10s, 每帧短边最短320 有些视频含有两类,所以top5更合适评测
148092 videos clip, 27 gestures 148092/27=5484 12帧每秒,平均35帧左右,最长70帧,最短12帧
108499视频,174类,每类77-987个样本 12帧每秒 38G
13320个视频clip,多个clip为一组,The videos from the same group may share some common features, such as similar background, similar viewpoint, etc. 。 101类行为,每个行为100个clip左右,每个clip2-8s
该数据集包括行为识别和时序行为检测两个任务。它的训练集为UCF101数据集,包括101类动作,共计13320段分割好的视频片段。THUMOS2014的验证集和测试集则分别包括1010和1574个未分割过的视频。
在时序行为检测任务中,只有20类动作的未分割视频是有时序行为片段标注的,每个长视频含多个动作。 数据集有200个验证集视频(包含3007个行为片段)和213个测试集视频(包含3358个行为片段)。这些经过标注的未分割视频可以被用于训练和测试时序行为检测模型。
之后还有THUMOS Challenge 2015,包括更多的动作类别和视频数,Test集不可用。且由于上面可以比较的方法不是很多,目前基本上还是在THUMOS14上进行实验。
2081个长视频,30fps,640×320,每个视频10个左右手势 24161段 gestures,平均25帧 83类手势,每个手势291个样本
47933 RGB-D gesture videos (about 9G) 320×240 249 gestures labels performed by 21 different individuals.
200 (1.3) train:10024视频(15410个实例) val:4926(7654个实例) test:5044 100 (1.2) train:4819视频(7151个实例) val:2383(3582个实例) test:2480 有测试服务器,需要YouTube-dl下载 download
