公开数据集
数据结构 ? 895.28M
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
NIST 结构化表格数据库由 5,590 页合成文档的二进制黑白图像组成。
该数据库中的文件是 1988 年 IRS 1040 Package X 中的 12 种不同的税表。
其中包括 1040、2106、2441、4562 和 6251 表以及附表 A、B、C、D、E、F 和东南。其中八个表格包含两个页面或表格面;因此,数据库中有 20 种不同的形状面。
该数据库中的文档图像似乎是由个人准备的真实表格,但这些图像是使用计算机自动导出和合成的。
1、900个模拟报税
2、5,590 张完整的结构化人脸图像
3、5,590 个包含输入字段答案的文本文件
4、20 个输入字段类型和上下文表
该数据集适用于文档处理和自动数据采集研究、开发和评估,可用于:
1、表格识别场隔离;
2、在表单上找到输入字段字符分割:
3、将输入字段值分成字符字符识别:
4、识别特定机器打印的字符
For more information on Special Database 2 please contact:
Standard Reference Data Program
National Institute of Standards and Technology
100 Bureau Dr., Stop 6410
Gaithersburg, MD 20899-6410
(844) 374-0183 (Toll Free)
The scientific contact for this database is:
Michael Garris
National Institute of Standards and Technology
100 Bureau Drive, Stop 8940
Gaithersburg, MD 20899-8940
mgarris [at] nist.gov
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。