公开数据集
数据结构 ? 391M
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
Creators: Aleksey Vilkin and Ilia Safonov, NRNU MEPhI, Moscow, Russia, Date: 2012
Data Set Information:
该数据集用于文本、图片和背景区域文档分类区域的机器学习算法的训练和验证。它包含101张俄文报纸和杂志的扫描图像。大多数图像的分辨率为300 dpi,大小为A4,约为2400x3500像素。对于所有图像,手动创建基于地面真实像素的遮罩。地面真相面具的命名类似于带有后缀的原始图像?。有三类:文本区、图片区、背景。遮罩上颜色为255、0、0(rgb,红色)的像素对应于图片区域,颜色为0、0、255(rgb,蓝色)的像素对应于文本区域,所有其他像素对应于背景。具有不同颜色背景的图像位于数据集中。
Attribute Information:
There are three classes: text area, picture area, background. Pixels on the mask with color 255, 0, 0 (rgb, red color) correspond to picture area, pixels with color 0, 0, 255 (rgb, blue color) correspond to text area, all other pixels correspond to background.
Relevant Papers:
A. M. Vilkin, I. V. Safonov, M. A. Egorova. Algorithm for segmentation of documents based on texture features // Pattern Recognition and Image Analysis March 2013, Volume 23, Issue 1, pp 153-159
Citation Request:
A. M. Vilkin, I. V. Safonov, M. A. Egorova. Algorithm for segmentation of documents based on texture features // Pattern Recognition and Image Analysis March 2013, Volume 23, Issue 1, pp 153-159
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。