Select Language

AI社区

人工智能数据集交易平台

39,993张互联网图像OCR数据【数据堂】

39,993张互联网图像OCR数据【数据堂】

133 浏览
0 喜欢
0 条评论
39,993张 图像 可用于多种互联网图像OCR任务

数据规模39,993张,227,910个框采集环境包括影视字幕、广告、手机截屏、漫画、表情包、海报、杂志封面等采集多样性包括多种互联......

README.md

  • 数据规模

  • 39,993张,227,910个框

  • 采集环境

  • 包括影视字幕、广告、手机截屏、漫画、表情包、海报、杂志封面等

  • 采集多样性

  • 包括多种互联网图像

  • 采集设备

  • 监控摄像头

  • 语言分布

  • 中文、英文(少量)

  • 数据格式

  • 图像数据格式为.jpg,标注文档格式为.json

  • 标注内容

  • 行级矩形框标注、行级内容转写(少量数据为列级矩形框标注、列级内容转写)

  • 准确率

  • 矩形框顶点偏差不超过五个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%


0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司