Select Language

AI社区

人工智能数据集交易平台

71,535张英文自然场景OCR数据【数据堂】

71,535张英文自然场景OCR数据【数据堂】

277 浏览
0 喜欢
0 条评论
71,535张 图像 可用英文自然场景下的OCR任务。

数据规模71,535张,每张图片有1-200个单词采集环境英国和美国实地采集,包括商店牌匾、海报、路标、提示语、警示语、包装说明、......

README.md

  • 数据规模

  • 71,535张,每张图片有1-200个单词

    • 采集环境

    • 英国和美国实地采集,包括商店牌匾、海报、路标、提示语、警示语、包装说明、菜单、建筑物标志等

    • 采集多样性

    • 包括多种场景、多种拍摄角度、多种光照条件

    • 拍摄角度

    • 仰视、俯视、平视

    • 采集设备

    • 手机、相机、平板电脑

    • 数据格式

    • 图像数据格式为.jpg,标注文档格式为.json

    • 标注内容

    • 行级&单词级&字符级矩形框(或四边形框)标注,文本转写

    • 准确率

    • 检测框标注准确率不低于95%;文本转写准确率不低于95%


    0相关评论
    数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司