心灵鸡汤文本数据集
来自github的一个毒鸡汤文本数据集,该数据是网站 http://www.nows.fun/ 的站点数据。数据量:1232条。文件格式为sql...OCR/Text Detection Classification
125K
1055
robot
20万英语笑话文本数据集
发布时间: 2016年这个数据库中有大约208000个笑话。文件目前数据集包含来自三个来源的笑话。---------------------------------...OCR/Text Detection Classification
24.57M
739
robot
常识问答文本数据集(CommonsenseQA)
CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M
1307
Tel-Aviv University
ArT场景文本数据集 包括10166幅图像
ArT数据集将包括10166幅图像。它被分为一个包含5603张图像的训练集和一个包含4563张图片的测试集。 ArT是Total Text[4]、SCUT-CT...OCR/Text Detection,Action/Event Detection,Image Data Classification
5.59G
1149
robot
KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)
Data Set Information:该数据集最重要的特点是其使用简单且有良好的文档记录,可广泛用于有关库尔德索拉尼新闻和文章的各种文本...Computer Classification
853K
564
University of California, Irvine
亚洲宗教圣经文本数据集研究
这个数据集中的大部分神圣文本都是从古腾堡计划收集的。我们在此提供原始文本以及预处理的文档术语矩阵(DTM)。Attribute Infor...Social Classification
629K
667
University of California, Irvine
用于NLP的文本数据集
This is a bundle of three text data sets to be used for NLP research.Dialog system technology challenge 7 (DSTC7)UbuntuA...NLP,Earth and Nature,Education Classification
6.49G
650
Florian Peters