公开数据集

Helen dataset 人脸检测数据集

1.02G

1482 浏览

1 喜欢

2 次下载

0 条讨论

Person,Face 2D Keypoints

在我们努力构建一种能够在包括姿势、光照、表情、遮挡和个体差异在内的各种外观变化下可靠且准确地运行的面部特征定位算法的过程......

数据介绍
文件预览
相关论文
Code
分享讨论(0)
使用声明

启动Notebook开发

数据结构 ? 1.02G

* 以上分析是由系统提取分析形成的结果，具体实际数据为准。

README.md

在我们努力构建一种能够在包括姿势、光照、表情、遮挡和个体差异在内的各种外观变化下可靠且准确地运行的面部特征定位算法的过程中，我们意识到训练集必须包含高分辨率示例，以便在测试时可以准确拟合高分辨率测试图像。尽管存在许多人脸数据库，但我们发现没有一个符合我们的要求，尤其是分辨率要求。因此，我们使用带注释的 Flickr 图像构建了一个新数据集。

具体来说，数据集的构建如下：首先，使用 Flickr 上的各种关键字搜索收集了大量候选照片。在所有情况下，查询都包含关键字“portrait”，并增加了不同的术语，例如“family”、“outdoor”、“studio”、“boy”、“wedding”等（试图通过用几种不同的语言重复查询来避免文化偏见。）在生成的候选集上运行人脸检测器，以识别包含足够大人脸（宽度大于 500 像素）的图像子集）。该子集进一步手动过滤以去除误报、个人资料视图以及低质量图像。对于每个接受的人脸，我们生成了原始图像的裁剪版本，其中包括人脸和一定比例的背景。在某些情况下，面部非常靠近或与原始图像的边缘接触，因此不在裁剪图像的中心。此外，裁剪后的图像可以包含其他人脸实例，因为许多照片包含多个近距离的人。

最后，使用 Amazon Mechanical Turk 对图像进行手工注释，以精确定位眼睛、鼻子、嘴巴、眉毛和下巴线。（我们采用与 PUT 人脸数据库相同的注释约定。）为了协助土耳其工人完成这项任务，我们将点位置初始化为在 PUT 数据库上训练的 STASM 算法的结果。然而，由于 Helen 数据集比 PUT 更加多样化，自动初始化的点通常远离正确的位置。

无论如何，我们发现这个特殊的注释任务需要对数据进行大量的审查和后处理，以确保高质量的结果。最终，这归因于所涉及的大量自由度。例如，土耳其工人经常会置换组件（将眼睛和眉毛或内唇换成外唇），或者充分地移动点的位置以改变它们的角色（例如选择不同的顶点来服务）作为眼角或嘴角）。界面中的图形提示以及培训视频和资格测试被用来协助该过程。此外，还开发了自动化流程来强制数据集中的一致性和统一性。除上述内容外，作者还在组件级别手动审查了这些面孔，以识别注释中的错误。有不可接受错误的组件被重新提交给土耳其人进行更正。

生成的数据集由 2000 个训练图像和 330 个测试图像组成，具有高度准确、详细和一致的主要面部组件注释。

Reference

Interactive Facial Feature Localization

Vuong Le, Jonathan Brandt, Zhe Lin, Lubomir Boudev, Thomas S. Huang

暂无相关内容。

分享你的想法

去分享你的想法~~

全部内容

欢迎交流分享

开始分享您的观点和意见，和大家一起交流分享.

数据使用声明：

一、数据来源与展示说明：

1、该数据来自于互联网数据采集或服务商的提供，本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息，如数据集描述中有描述差异，请以数据原地址或服务商原地址为准。

二、所有权说明：

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明：

1、如您需要转载本站数据，请保留原数据地址及相关版权声明。

四、侵权与处理说明：

1、如本站中的部分数据涉及侵权展示，请及时联系本站，我们会安排进行数据下线。

所需积分：

16 去赚积分？

1482浏览
2下载
1点赞
收藏
分享

Select Language

AI社区

今日排行

本月搜索

Dataset Category