Select Language

AI社区

公开数据集

Helen dataset  人脸检测数据集

Helen dataset 人脸检测数据集

1.02G
1159 浏览
1 喜欢
2 次下载
0 条讨论
Person,Face 2D Keypoints

在我们努力构建一种能够在包括姿势、光照、表情、遮挡和个体差异在内的各种外观变化下可靠且准确地运行的面部特征定位算法的过程......

数据结构 ? 1.02G

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    在我们努力构建一种能够在包括姿势、光照、表情、遮挡和个体差异在内的各种外观变化下可靠且准确地运行的面部特征定位算法的过程中,我们意识到训练集必须包含高分辨率示例,以便在测试时可以准确拟合高分辨率测试图像。尽管存在许多人脸数据库,但我们发现没有一个符合我们的要求,尤其是分辨率要求。因此,我们使用带注释的 Flickr 图像构建了一个新数据集。

    具体来说,数据集的构建如下:首先,使用 Flickr 上的各种关键字搜索收集了大量候选照片。在所有情况下,查询都包含关键字“portrait”,并增加了不同的术语,例如“family”、“outdoor”、“studio”、“boy”、“wedding”等(试图通过用几种不同的语言重复查询来避免文化偏见。)在生成的候选集上运行人脸检测器,以识别包含足够大人脸(宽度大于 500 像素)的图像子集)。该子集进一步手动过滤以去除误报、个人资料视图以及低质量图像。对于每个接受的人脸,我们生成了原始图像的裁剪版本,其中包括人脸和一定比例的背景。在某些情况下,面部非常靠近或与原始图像的边缘接触,因此不在裁剪图像的中心。此外,裁剪后的图像可以包含其他人脸实例,因为许多照片包含多个近距离的人。

    最后,使用 Amazon Mechanical Turk 对图像进行手工注释,以精确定位眼睛、鼻子、嘴巴、眉毛和下巴线。 (我们采用与 PUT 人脸数据库相同的注释约定。)为了协助土耳其工人完成这项任务,我们将点位置初始化为在 PUT 数据库上训练的 STASM 算法的结果。然而,由于 Helen 数据集比 PUT 更加多样化,自动初始化的点通常远离正确的位置。

    无论如何,我们发现这个特殊的注释任务需要对数据进行大量的审查和后处理,以确保高质量的结果。最终,这归因于所涉及的大量自由度。例如,土耳其工人经常会置换组件(将眼睛和眉毛或内唇换成外唇),或者充分地移动点的位置以改变它们的角色(例如选择不同的顶点来服务)作为眼角或嘴角)。界面中的图形提示以及培训视频和资格测试被用来协助该过程。此外,还开发了自动化流程来强制数据集中的一致性和统一性。除上述内容外,作者还在组件级别手动审查了这些面孔,以识别注释中的错误。有不可接受错误的组件被重新提交给土耳其人进行更正。

    生成的数据集由 2000 个训练图像和 330 个测试图像组成,具有高度准确、详细和一致的主要面部组件注释。

    Reference

    Interactive Facial Feature Localization

    Vuong Le, Jonathan Brandt, Zhe Lin, Lubomir Boudev, Thomas S. Huang


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:16 去赚积分?
    • 1159浏览
    • 2下载
    • 1点赞
    • 收藏
    • 分享