公开数据集
数据结构 ? 11.16G
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
加州理工学院行人数据集包括大约10小时的640x480 30Hz视频,这些视频来自在城市环境中通过常规交通的车辆。大约250,000个框架(137个近似分钟的长段)共有350,000个边界框和2300个独特的行人被注释。注释包括边界框和详细遮挡标签之间的时间对应。更多信息可以在我们的PAMI 2012和CVPR 2009基准测试文件中找到。
数据结构
加州理工学院行人数据集。训练数据(set00-set05)由六个训练集(每个约1GB)组成,每个训练集有6-13个一分钟长的seq文件,以及所有注释信息(详见论文)。测试数据(set06-set10)由五组组成,每组约1GB。新增:现在还提供了整个数据集的注释。还提供包含所有评估算法的检测结果的输出文件。
Seq视频格式。seq文件是一系列具有固定大小标题的连接图像帧。用于读/写/操作seq文件的matlab例程可以在 Piotr的Matlab工具箱中找到(需要3.20或更高版本)。这些例程还可用于将seq文件提取到图像目录。
Matlab评估/标签代码(3.2.1)。注释使用自定义的“视频边界框”(vbb)文件格式。该代码还包含用于查看覆盖注释的seq文件的实用程序,用于生成本文中所有ROC图的评估例程,以及用于创建数据集的vbb标记工具(另请参见此有点过时的视频教程)。
标准格式的其他数据集。为方便起见,我们发布了seq / vbb格式的完整图像/注释以及许多其他数据集上所有评估算法的检测结果。这有助于对这些附加数据集的训练/测试以及所有ROC曲线的精确再现。原作者仍享有完整版权,请参阅相应网站以获取更多信息,包括如何引用这些数据集的评估结果。INRIA行人数据集[已转换 ], ETH行人数据集 [已转换 ], TUD-布鲁塞尔行人数据集 [已转换 ],戴姆勒行人数据集 [转换 ]。
基准测试结果
算法细节和参考 | 算法运行时与性能
有关评估方案的详细信息,请参阅我们的PAMI 2012论文。
注意:自我们的CVPR 2009论文以来,评估方案已经发展。
注意:我们每个绘图最多渲染15个最佳结果(但始终包括VJ和HOG基线)。
加州理工学院行人测试数据集:我们提供两组结果:50像素或更高,未被遮挡或部分遮挡的行人(合理),以及更详细的性能细分,如文中所述(详细)。
加州理工学院行人培训数据集:加州理工学院培训数据的结果:合理,详细。
加州理工学院行人日本数据集:类似于加州理工学院行人数据集(无论是幅度还是注释),视频都是在日本收集的。我们无法发布这些数据,但是,我们将对结果进行基准测试,以对各种检测器进行二次评估。结果:合理,详细。
INRIA行人测试数据集:INRIA Pedestrian数据集的全图像结果(评估详情)。
ETH行人数据集:ETH行人数据集的结果(评估详情)。
TUD-Brussels Pedestrian Dataset:TUD-Brussels Pedestrian数据集的结果(评估详情)。
戴姆勒行人数据集:戴姆勒行人数据集的结果(评估详情)。
提交结果
请联系我们,将您的探测器结果包含在本网站上。我们从第30帧开始每隔30帧进行一次评估。对于每个视频,每个帧的结果应该是一个文本文件,命名如下:“I00029.txt,I00059.txt,...”。每个文本文件应包含每个检测到的边界框1行,格式为“[left,top,width,height,score]”。如果未找到任何检测项,则文本文件应为空(但必须仍然存在)。目录结构应该模仿包含视频的目录结构:“set00 / V000,set00 / V001 ......”。如果上面的描述不清楚,请参阅评估算法的输出文件(可从下载部分获得)。请注意,在评估期间,给定视频的所有检测都连接成一个文本文件,
相关数据集
下面我们列出其他行人数据集,大致按照与Caltech Pedestrian数据集的相关性和相似性的顺序。可以在本文中找到数据集(前两个除外)的更详细比较。
GM-ATCI:从鱼眼镜头相机拍摄的后视行人数据集。
戴姆勒:还在城市环境中捕获,更新旧的戴姆勒克莱斯勒数据集。包含跟踪信息和大量标记的边界框。
NICTA:在多个城市/国家收集的大规模城市数据集。没有运动/跟踪信息,但有大量独特的行人。
ETH:从安装在婴儿车上的立体装置捕获的城市数据集。
TUD-Brussels:在拥挤的城市环境中使用车载摄像头记录图像对的数据集。
INRIA:目前最受欢迎的静态行人检测数据集之一。
PASCAL:具有不同对象视图和姿势的静态对象数据集。
CVC-ADAS:行人数据集的集合,包括在船上获得的行人视频,虚拟世界的行人(带有部分注释)和被遮挡的行人。
南加州大学:一些相当小的行人数据集主要来自监控视频。
麻省理工学院:第一个行人数据集之一,相当小,相对较好地解决了这一点。
更改日志
07/01/2019:添加了ADM,ShearFtrs和AR-Ped结果。
08/31/2018:添加了GDFL结果。
07/05/2018:添加了TLL-TFA结果。
07/05/2018:添加了FasterRCNN + ATT和AdaptFasterRCNN结果。
06/03/2018:添加了F-DNN2 + SS结果。
04/15/2018:添加了PCN结果。
2017年11月20日:添加了SDS-RCNN结果。
10/23/2017:添加了UDN +结果。
2016年12月12日:添加了ACF ++ / LDCF ++,MRFC和F-DNN结果。
2016年9月9日:添加了MS-CNN结果。
07/26/2016:添加了RPN + BF结果。
2016年3月3日:添加了SA-FastRCNN结果。
2015年8月11日:添加了SCF + AlexNet结果。
2015年10月26日:添加了CompACT-Deep结果。
2015年9月24日:添加了CCF结果。
2015年9月16日:添加了Checkerboards,LFOV,DeepCascade,DeepParts,SCCPriors,TA-CNN,FastCF和NAMC结果。最新的OSX Matlab显示更新的显示代码。修复了一些破碎的链接
2014年10月29日:新代码版本v3.2.1(已修改的dbExtract.m,已更新的标头)。
2014年9月21日:增加了LDCF,ACF-Caltech +,SpatialPooling,SpatialPooling +和Katamari结果。
2014年7月22日:更新了CVC-ADAS数据集链接和说明。
2014年7月16日:添加了WordChannels和InformedHaar结果。
06/04/2014:添加了RandForest结果。
2014年5月20日:添加了Franken,JointDeep,MultiSDP和SDN结果。
11/11/2013:添加了FisherBoost和pAUCBoost结果。
08/08/2013:添加了ACF + SDt结果。
2013年7月30日:新代码发布v3.2.0(添加了dbExtract.m以提取图像和文本文件,重构了dbeval.m)。增加了ACF和ACF-Caltech结果。
07/16/2013:添加了MOCO结果。
07/11/2013:添加了DBN-Isol,DBN-Mut和+ 2Ped结果。更新了algorithm.pdf和网站。
07/08/2013:添加了MLS和MT-DPM结果。每个绘图最多渲染15个最高结果。
07/07/2013:添加了ConvNet,SketchTokens,Roerei和AFS结果。
07/05/2013:新代码发布v3.1.0(清理和评论)。更新的情节颜色和样式。不再以二进制形式接受结果。更新了检测格式,每个视频都有一个结果文本文件。
11/26/2012:添加了VeryFast结果。更新了TUD和Daimler数据集的链接。
08/04/2012:添加了串扰结果。新代码版本v3.0.1。
01/18/2012:在Caltech Pedestrian Testing Dataset上添加了MultiResC结果。
09/05/2011:对应于PAMI 2012出版物的网站的主要更新(发布的测试注释,更新的评估代码,更新的图表,发布的PAMI论文,添加的FeatSynth和HOG-LBP检测器)。
08/02/2010:添加了运行时与性能图。
08/01/2010:增加了FPDW和PLS结果。修复了美国数据的MultiFtr + CSS结果。新代码发布v2.2.0。
06/27/2010:在戴姆勒数据上添加了戴姆勒行人数据集的转换版本和评估结果。
05/31/2010:添加了MultiFtr + CSS和MultiFtr + Motion结果。
04/18/2010:添加了TUD-Brussels和ETH结果,新代码发布(新vbbLabeler),网站更新。
03/15/2010:重大改革:新的评估标准,发布测试图像,所有新的rocs,添加的ChnFtrs结果,更新的HikSvm和LatSvm-V2结果,更新的代码,网站更新。
06/12/2009:添加了PoseInv结果,链接到TUD-Brussels数据集。
06/08/2009:添加了LatSvm-V2结果。
06/02/2009:对网站的各种调整。
05/18/2009:网站的初始版本
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。