公开数据集
数据结构 ? 65.92M
README.md
上下文如果你曾经排过数学表达式,你可能会想: 如果我能给一个手写的表达式拍张照片,让它自动识别出来,不是很棒吗?这个数据集包含构建系统所需的所有数据。数据集提供了来自不同国家的数百名作家手写的超过11,000个表达式,合并了来自4个 CROHME 竞赛的数据集。作者被要求从一系列表达式中复制出印刷的表达式。该语料库的设计涵盖了不同任务提出的多样性,并从现有的数学语料库和嵌入维基百科页面的表达式中进行选择。使用了不同的设备(不同的数字笔技术,白板输入设备,带有显示屏的平板电脑) ,因此使用了不同的尺度和分辨率。数据集只提供在线信号。在2013年的最后一次竞赛中,测试部分是完全原创的,列车部分使用了5个现有的数据集: * MathBrush (滑铁卢大学) ,* HAMEX (南特大学) ,* MfrDB (捷克技术大学) ,* ExpressMatch (圣保罗大学) ,* KAIST 数据集。在 CROHME 2014中,我们创建了一个新的测试集,其中包括987个新的表达式和2个新的任务: 孤立符号识别和矩阵识别。提供了作为这些新任务的评估脚本的培训和测试文件。对于孤立的符号数据集,使用现有的数据集从完整的表达式中提取元素,其中还包括分割错误。在矩阵识别任务中,380个新的表达式被标记并分解成训练集和测试集。此外,2012年比赛的6名参赛者提供了他们认可的2012年测试部分的表达式。这些数据允许对决策融合或评估指标进行研究。技术细节与每个表达式对应的墨水存储在 InkML 文件中。
暂无相关内容。
暂无相关内容。
- 分享你的想法
去分享你的想法~~
全部内容
欢迎交流分享
开始分享您的观点和意见,和大家一起交流分享.
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。