公开数据集
数据结构 ? 842M
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
UT Zappos50K(UT-Zap50K)是一个大型鞋类数据集,由从Zappos.com收集的50025张目录图像组成。这些图像分为4大类-鞋子、凉鞋、拖鞋和靴子,然后是功能类型和单个品牌。鞋子以白色背景为中心,并以相同的方向拍摄,以便于分析。
该数据集是在在线购物任务的上下文中创建的,用户特别关注细粒度的视觉差异。例如,购物者更有可能在两双类似的男士跑鞋之间做出选择,而不是在女士高跟鞋和男士拖鞋之间做出选择。提供GIST和LAB颜色特征。此外,每个图像都有8个相关的元数据(性别、材料等)标签,用于在Zappos.com上过滤鞋子。
我们在成对比较任务的上下文中引入了这个数据集,其中的目标是预测两个图像中的哪一个更强烈地表现出视觉属性。当给定一个新的图像对时,我们想回答这样一个问题:“图像a是否比图像B包含更多或更少的属性?”训练和评估都是使用成对标签进行的。
然而,这个数据集的有用性超出了我们所演示的比较任务。元数据标签和数据集的大尺寸也使其适用于其他任务,例如:
1、类别/品牌分类
2、基于理性的细粒度属性学习
3、特定性别的风格搭配
4、零样本学习
Annotations
使用Mechanical Turk,我们收集了4个相对属性的实例级别†比较标签:开放、尖尖、运动和舒适。我们从可能的50K²对中抽取了3000对图像,对类别内和性别内图像有强烈的偏见。我们要求5名工人评估每对属性(更多细节)。在剔除置信度或一致性较低的对之后,人类注释的示例由6751个有序对和4612个“相等”对组成。这被称为UT-Zap50K-1。
虽然“equal”标签可以表示属性中没有可检测的差异,但我们也怀疑这是一种简单的回退响应,适用于需要稍微思考的情况,即显示细粒度差异的情况。因此,我们将这些“相等”的对交给了一组新的工人,但这次没有“相等”选项。我们要求工人仔细挑选,并给出一句话的理由。修剪后,有4334个细粒度对。这被称为UT-Zap50K-2。
两组样本标签如下所示。66%的Zap50K-1和63%的Zap50 K-2员工至少有四分之五的员工对同一标签有高度的信心,确保了一致性和可靠性。
†UT-Zap50K包含迄今为止最大的实例级别(单个图像)比较标签。现有数据集中包含的比较标签是在类别级别(图像组)收集的。
Open | Pointy | Sporty | Comfort | |
Ordered Pairs | ||||
Fine-Grained Pairs |
Benchmarks
我们提供了本文中用于基准测试的列车测试分割。我们还提供了一个演示脚本,以帮助进行相对属性预测的实验设置。UT-Zap50K-1当前基准的ROC曲线如下所示。图例中的数字表示平均排名精度。
Fine-Grained Lexicon
此外,我们还收集了另一组为细粒度比较任务定制的数据。这样的学习任务需要强调图像对之间微妙之处的训练数据。为此,我们(1)使用众包挖掘明确细粒度的属性词典,(2)为词典中的每个属性收集了更多的实例级比较标签。
给出一对图片,我们让工人用一个单词完成句子“Shoe a比Shoe B多一点他们被指示识别图像之间的细微差异,并提供简短的理由。目标是找出人们如何区分鞋子图像之间的细微差别。超过1000名工作人员参与了这项研究,在观看的4000对图片中,共产生了350+个不同的单词建议。
上面的单词cloud表示原始结果,然后我们根据基本原理和同义词的合并对其进行后期处理。最后,最常见的10个词构成了我们新的细粒度相对属性词典:舒适、休闲、简单、运动、多彩、耐用、支持、大胆、时尚和开放。我们为每个属性收集了4000个有序对的人类注释。
This dataset is for academic, non-commercial use only. If you use this dataset in a publication, please cite the following papers:
A. Yu and K. Grauman. "Fine-Grained Visual Comparisons with Local Learning". In CVPR, 2014.
[paper] [supp] [poster] [bibtex] [project page]
A. Yu and K. Grauman. "Semantic Jitter: Dense Supervision for Visual Comparisons via Synthetic Images". In ICCV, 2017.
[paper] [supp] [poster] [bibtex] [project page]
Many thanks to Mark Stephenson for his contributions to collecting the UT Zappos50K data.
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。