Select Language

AI社区

公开数据集

UT Zappos50K 一个大型鞋类数据集

UT Zappos50K 一个大型鞋类数据集

842M
575 浏览
0 喜欢
1 次下载
0 条讨论
Image Search,Clothing and Accessories Classification

UT Zappos50K(UT-Zap50K)是一个大型鞋类数据集,由从Zappos.com收集的50025张目录图像组成。这些图像分为4大类-鞋子、凉鞋、拖......

数据结构 ? 842M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    UT Zappos50K(UT-Zap50K)是一个大型鞋类数据集,由从Zappos.com收集的50025张目录图像组成。这些图像分为4大类-鞋子、凉鞋、拖鞋和靴子,然后是功能类型和单个品牌。鞋子以白色背景为中心,并以相同的方向拍摄,以便于分析。
    该数据集是在在线购物任务的上下文中创建的,用户特别关注细粒度的视觉差异。例如,购物者更有可能在两双类似的男士跑鞋之间做出选择,而不是在女士高跟鞋和男士拖鞋之间做出选择。提供GIST和LAB颜色特征。此外,每个图像都有8个相关的元数据(性别、材料等)标签,用于在Zappos.com上过滤鞋子。

    我们在成对比较任务的上下文中引入了这个数据集,其中的目标是预测两个图像中的哪一个更强烈地表现出视觉属性。当给定一个新的图像对时,我们想回答这样一个问题:“图像a是否比图像B包含更多或更少的属性?”训练和评估都是使用成对标签进行的。
    然而,这个数据集的有用性超出了我们所演示的比较任务。元数据标签和数据集的大尺寸也使其适用于其他任务,例如:
    1、类别/品牌分类
    2、基于理性的细粒度属性学习
    3、特定性别的风格搭配
    4、零样本学习

    Annotations

    使用Mechanical Turk,我们收集了4个相对属性的实例级别†比较标签:开放、尖尖、运动和舒适。我们从可能的50K²对中抽取了3000对图像,对类别内和性别内图像有强烈的偏见。我们要求5名工人评估每对属性(更多细节)。在剔除置信度或一致性较低的对之后,人类注释的示例由6751个有序对和4612个“相等”对组成。这被称为UT-Zap50K-1。
    虽然“equal”标签可以表示属性中没有可检测的差异,但我们也怀疑这是一种简单的回退响应,适用于需要稍微思考的情况,即显示细粒度差异的情况。因此,我们将这些“相等”的对交给了一组新的工人,但这次没有“相等”选项。我们要求工人仔细挑选,并给出一句话的理由。修剪后,有4334个细粒度对。这被称为UT-Zap50K-2。
    两组样本标签如下所示。66%的Zap50K-1和63%的Zap50 K-2员工至少有四分之五的员工对同一标签有高度的信心,确保了一致性和可靠性。
    †UT-Zap50K包含迄今为止最大的实例级别(单个图像)比较标签。现有数据集中包含的比较标签是在类别级别(图像组)收集的。


    OpenPointySportyComfort
    Ordered
    Pairs
    Order OpenOrder PointyOrder SportyOrder Comfort
    Fine-Grained
    Pairs
    Hard OpenHard PointyHard SportyHard Comfort

    Benchmarks

    我们提供了本文中用于基准测试的列车测试分割。我们还提供了一个演示脚本,以帮助进行相对属性预测的实验设置。UT-Zap50K-1当前基准的ROC曲线如下所示。图例中的数字表示平均排名精度。

    ShoesSandalsSlippersBoots

    Fine-Grained Lexicon

    此外,我们还收集了另一组为细粒度比较任务定制的数据。这样的学习任务需要强调图像对之间微妙之处的训练数据。为此,我们(1)使用众包挖掘明确细粒度的属性词典,(2)为词典中的每个属性收集了更多的实例级比较标签。

    给出一对图片,我们让工人用一个单词完成句子“Shoe a比Shoe B多一点他们被指示识别图像之间的细微差异,并提供简短的理由。目标是找出人们如何区分鞋子图像之间的细微差别。超过1000名工作人员参与了这项研究,在观看的4000对图片中,共产生了350+个不同的单词建议。

    Word Cloud

    上面的单词cloud表示原始结果,然后我们根据基本原理和同义词的合并对其进行后期处理。最后,最常见的10个词构成了我们新的细粒度相对属性词典:舒适、休闲、简单、运动、多彩、耐用、支持、大胆、时尚和开放。我们为每个属性收集了4000个有序对的人类注释。


    Citation & Acknowledgement

    This dataset is for academic, non-commercial use only. If you use this dataset in a publication, please cite the following papers:

    A. Yu and K. Grauman. "Fine-Grained Visual Comparisons with Local Learning". In CVPR, 2014.
    [paper] [supp] [poster] [bibtex] [project page]

    A. Yu and K. Grauman. "Semantic Jitter: Dense Supervision for Visual Comparisons via Synthetic Images". In ICCV, 2017.
    [paper] [supp] [poster] [bibtex] [project page]

    Many thanks to Mark Stephenson for his contributions to collecting the UT Zappos50K data.


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:25 去赚积分?
    • 575浏览
    • 1下载
    • 0点赞
    • 收藏
    • 分享