相关搜索
您是不是在找?
今日排行
本周排行
本月排行
街景文本(SVT)数据集,来自谷歌街景的图像数据
The Street View Text (SVT) dataset was harvested from Google Street View. Image text in this data exhibits high variabil...NLP,Energy 2D Box,Classification
112.7M
1300
Kai Wang
355M
773
Prof. Jin Hyung Kim Seonghun Lee
MSRA文本检测500数据库(MSRA-TD500)
MSRA文本检测500数据库(MSRA-TD500),作为评估文本检测算法的基准,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测...NLP 2D Box
96.05M
1255
Cong Yao
自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例
这是一个综合生成的数据集,其中word实例被放置在自然场景图像中,同时考虑场景布局。该数据集由80万张图像和大约800万个合成单...NLP,Animal 2D Box
37.9G
566
Ankush Gupta, Andrea Vedaldi and Andrew Zisserman
文字袋(包含文本和单词)数据集
Data Set Information:For each text collection, D is the number of documents, W is the number of words in the vocabulary,...NLP Classification
1.77G
717
University of California, Irvine
LAION-5B:大规模图文数据集
一、LAION-5B概述LAION-5B由58.5亿个图像文本组合组成,通过CLIP过滤的图像分类模型,其中23亿是图像-英文文本对,22亿是图像,...NLP,Image Search,Image Data Classification
80T
1605
laion
THUCTC 中文文本分类数据集
THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自...OCR/Text Detection Classification
1.1G
2587
清华大学自然语言处理与社会人文计算实验室
心灵鸡汤文本数据集
来自github的一个毒鸡汤文本数据集,该数据是网站 http://www.nows.fun/ 的站点数据。数据量:1232条。文件格式为sql...OCR/Text Detection Classification
125K
1000
robot
20万英语笑话文本数据集
发布时间: 2016年这个数据库中有大约208000个笑话。文件目前数据集包含来自三个来源的笑话。---------------------------------...OCR/Text Detection Classification
24.57M
682
robot
自然图像中文本定位的合成数据集,包含80万张图像
这是一个综合生成的数据集,其中单词实例被放置在自然场景图像中,同时考虑到了场景布局。该数据集由80万张图像组成,其中有大约...Image Search Classification
73.5G
1199
robot
常识问答文本数据集(CommonsenseQA)
CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M
1237
Tel-Aviv University
ArT场景文本数据集 包括10166幅图像
ArT数据集将包括10166幅图像。它被分为一个包含5603张图像的训练集和一个包含4563张图片的测试集。 ArT是Total Text[4]、SCUT-CT...OCR/Text Detection,Action/Event Detection,Image Data Classification
5.59G
1091
robot
基于单词级别的英语曲线文本检测数据集(TOTAL-TEXT)
总计文本由1555张图像组成,这些图像具有3种以上不同的文本方向:水平,多方向和弯曲(一种)。数据引用:@article{CK2019,autho...NLP Classification
441M
688
robot
TTC-3600:土耳其文本分类数据集的基准数据集
Assist.Prof.Dr. Deniz KILIN??, Faculty of Technology, Celal Bayar University, Turkeydrdenizkilinc'@'gmail.comDat...Computer Classification
2.5M
774
University of California, Irvine
路透社21578文本分类收集数据集
David D. LewisATT Labs - Research lewis '@' research.att.comdocuments came from Reuters newswire in 1987.Data Se...Agriculture Classification
7.8M
2517
University of California, Irvine