公开数据集

野外标记人脸 (LFW) 人脸照片数据库

112.43M

959 浏览

1 喜欢

2 次下载

0 条讨论

People Classification

野外标记人脸 (LFW) 是一个人脸照片数据库，旨在研究无约束人脸识别问题。该数据库由马萨诸塞大学阿默斯特分校的研究人员创建和......

数据介绍
文件预览
相关论文
Code
分享讨论(0)
使用声明

启动Notebook开发

数据结构 ? 112.43M

* 以上分析是由系统提取分析形成的结果，具体实际数据为准。

README.md

野外标记人脸 (LFW) 是一个人脸照片数据库，旨在研究无约束人脸识别问题。该数据库由马萨诸塞大学阿默斯特分校的研究人员创建和维护（具体参考资料在致谢部分）。 Viola Jones 人脸检测器检测到 5,749 人的 13,233 张图像并将其居中，并从网络收集。照片中的 1,680 人在数据集中有两张或更多张不同的照片。原始数据库包含四组不同的 LFW 图像以及三种不同类型的“对齐”图像。据研究人员称，与其他图像类型相比，深度漏斗图像对大多数人脸验证算法产生了更好的结果。因此，这里上传的数据集是深度漏斗版本。

Content

该数据集中有 11 个文件。 lfw-deepfunneled.zip 是包含图像的文件。所有其他 10 个文件都是相关元数据，可以帮助您为模型形成训练和测试集。下面有两个部分可以帮助您更好地浏览文件。第一部分提供专门与图像有关的信息。第二部分解释了每个元数据文件的内容。

Image information:

1、图像文件格式：每张图像都以“lfw/name/namexxxx.jpg”形式提供，其中“xxxx”是用前导零填充为四个字符的图像编号。例如，第 10 个 GeorgeWBush 图像可以找到为“lfw/GeorgeWBush/GeorgeWBush0010.jpg”

2、图像尺寸：每张图像都是 250x250 jpg，使用 Viola-Jones 人脸检测器的 openCV 实现进行检测和居中。然后检测器返回的裁剪区域在每个维度上自动放大 2.2 倍，以捕获更多的头部，然后缩放到统一大小。

metadata information:

1、lfwallnames.csv：包含数据集中每个人脸的所有名称以及每个人脸拥有的图像数量。

2、lfwreadme.csv：在原始数据库中找到的综合自述文件。如果您在此处遗漏了任何信息或正在寻找其他资源，您可能会在此文件中找到它。它解释了每个 .csv 文件在形成训练和测试模型时如何发挥作用，以及用于确定 .csv 所指内容的列元数据信息。原始网站还提供有关训练/测试拆分和比较基准的建议。

有两种推荐的配置用于开发训练和测试集（成对与人）。根据您选择的路线，您将使用以下 .csv 文件：

1、pairs.csv：包含随机生成的拆分，用于专门针对对的 10 折交叉验证。在形成训练集时将其用于图像受限配置（请参阅自述文件）。一共10套； 5 组包含 300 个匹配对，其他 5 组包含 300 个错配对。

2、people.csv：包含随机生成的分割，用于专门针对单个人脸的 10 折交叉验证。在形成训练集时将其用于不受限制的配置（请参阅自述文件）。一共10组，每组人数不同；第 1 组：601。第 2 组：555。第 3 组：552。第 4 组：560。第 5 组：567。第 6 组：527。第 7 组：597。第 8 组：601。第 9 组：580。第 10 组：609。

3、matchpairsDevTest.csv：如果您决定采用对配置，请使用此测试集。包含 500 对匹配的测试集人脸。

4、matchpairsDevTrain.csv：如果您决定采用对配置，请使用此训练集。包含 1100 对匹配的人脸作为训练集。

5、mismatchpairsDevTest.csv：如果您决定采用对配置，请使用此测试集。包含 500 对不匹配的人脸用于测试集。

6、mismatchpairsDevTrain.csv：如果您决定采用对配置，请使用此训练集。包含 1100 对不匹配的人脸作为训练集。

7、peopleDevTest.csv：如果您决定采用人员配置，请使用此测试测试。包含 1711 个人和 3708 张图片。

8、peopleDevTrain.csv：如果您决定采用人员配置，请使用此训练集。包含 4038 个人和 9525 张图片。

Acknowledgements

All data and metadata were originally found on http://vis-www.cs.umass.edu/lfw/. Please visit the site for other data versions including original, non-aligned data as well as more information on errata and training/testing model resources.

A big thank you and kudos to the creators of this dataset and relevant research:

Gary B. Huang, Manu Ramesh, Tamara Berg, and Erik Learned-Miller. Labeled Faces in the Wild: A Database for Studying Face Recognition in Unconstrained Environments. University of Massachusetts, Amherst, Technical Report 07-49, October, 2007.

Specifically for the deep-funneled version of the image data:

Gary B. Huang, Marwan Mattar, Honglak Lee, and Erik Learned-Miller. Learning to Align from Scratch. Advances in Neural Information Processing Systems (NIPS), 2012.

Banner photo by John Bakator on Unsplash

暂无相关内容。

分享你的想法

去分享你的想法~~

全部内容

欢迎交流分享

开始分享您的观点和意见，和大家一起交流分享.

数据使用声明：

一、数据来源与展示说明：

1、该数据来自于互联网数据采集或服务商的提供，本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息，如数据集描述中有描述差异，请以数据原地址或服务商原地址为准。

二、所有权说明：

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明：

1、如您需要转载本站数据，请保留原数据地址及相关版权声明。

四、侵权与处理说明：

1、如本站中的部分数据涉及侵权展示，请及时联系本站，我们会安排进行数据下线。

所需积分：

15 去赚积分？

959浏览
2下载
1点赞
收藏
分享

Select Language

AI社区

今日排行

本月搜索

Dataset Category