Select Language

AI社区

人工智能数据集交易平台

4,995张越南语OCR标注及转写数据【数据堂】

4,995张越南语OCR标注及转写数据【数据堂】

180 浏览
0 喜欢
0 条评论
4,995张 图像 可用于多种场景下的越南语识别、越南语拍照翻译等任务

数据规模4,995张,包括自然场景图片258张,互联网图像2,553张,文本图像2,184张采集环境包括自然场景(牌匾、包装说明、小广告、......

README.md

  • 数据规模

  • 4,995张,包括自然场景图片258张,互联网图像2,553张,文本图像2,184张

  • 采集环境

  • 包括自然场景(牌匾、包装说明、小广告、菜单、海报等)、互联网图像(杂志封面、漫画封面等)、文本图像(文本文档等)

  • 采集多样性

  • 包括多种场景、多种角度、不同光照条件

  • 采集设备

  • 手机

  • 数据格式

  • 图像数据格式为.jpg,标注文档数据格式为.json

  • 标注内容

  • 行级四边形标注、行级内容转写;竖列四边形标注、竖列内容转写

  • 准确率

  • 四边形框顶点偏差不超过10个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%



0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司