公开数据集
数据结构 ? 5.7G
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
SVHN 是一个真实世界的图像数据集,用于开发机器学习和对象识别算法,对数据预处理和格式化的要求最低。它可以被视为与 MNIST 风格相似(例如,图像是经过裁剪的小数字),但包含了一个数量级的更多标记数据(超过 600,000 个数字图像),并且来自一个更难、未解决的现实世界问题(识别自然场景图像中的数字和数字)。 SVHN 是从谷歌街景图像中的门牌号获得的。
10 classes, 1 for each digit. Digit '1' has label 1, '9' has label 9 and '0' has label 10.
73257 digits for training, 26032 digits for testing, and 531131 additional, somewhat less difficult samples, to use as extra training data
Comes in two formats:
1、Original images with character level bounding boxes.
2、MNIST-like 32-by-32 images centered around a single character (many of the images do contain some distractors at the sides
Format 1: Full Numbers: train.tar.gz, test.tar.gz , extra.tar.gz (Note: for non-commercial use only)
这些是带有字符级边界框的原始、可变分辨率、彩色门牌号图像,如上面的示例图像所示。 (此处的蓝色边界框仅用于说明目的。边界框信息存储在 digitStruct.mat 中,而不是直接在数据集中的图像上绘制。)每个 tar.gz 文件都包含 png 格式的原始图像,以及一个digitStruct.mat 文件,可以使用 Matlab 加载。 digitStruct.mat 文件包含一个名为 digitStruct 的结构,其长度与原始图像的数量相同。 digitStruct 中的每个元素都有以下字段: name 是一个包含相应图像文件名的字符串。 bbox 是一个结构数组,包含图像中每个数字边界框的位置、大小和标签。例如: digitStruct(300).bbox(2).height 给出第 300 个图像中第 2 个数字边界框的高度。
Format 2: Cropped Digits: train_32x32.mat, test_32x32.mat , extra_32x32.mat (Note: for non-commercial use only)
类似 MNIST 格式的字符级基本事实。所有数字都已调整为 32 x 32 像素的固定分辨率。原始字符边界框在适当的维度上扩展为方形窗口,因此将它们调整为 32×32 像素不会引入纵横比失真。然而,这种预处理会在感兴趣的数字的两侧引入一些分散注意力的数字。加载 .mat 文件会创建 2 个变量:X 是包含图像的 4-D 矩阵,y 是类标签的向量。为了访问图像,X(:,:,:,i) 给出第 i 个 32×32 RGB 图像,类标签为 y(i)。
Please cite the following reference in papers using this dataset:
Yuval Netzer, Tao Wang, Adam Coates, Alessandro Bissacco, Bo Wu, Andrew Y. Ng Reading Digits in Natural Images with Unsupervised Feature Learning NIPS Workshop on Deep Learning and Unsupervised Feature Learning 2011. (PDF)
Please use http://ufldl.stanford.edu/housenumbers as the URL for this site when necessary
For questions regarding the dataset, please contact streetviewhousenumbers@gmail.com
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。