相关搜索
您是不是在找?
今日排行
本周排行
本月排行
Twitter 社交数据集
This dataset consists of 'circles' (or 'lists') from Twitter. Twitter data was crawled from public sourc...NLP Classification
31.4M
1439
Stanford University![](https://www.payititi.com/api/avatar/show.php?username=stanford&size=large)
Google+ 社交圈子数据集
This dataset consists of 'circles' from Google+. Google+ data was collected from users who had manually shared t...NLP Classification
773M
967
Stanford University![](https://www.payititi.com/api/avatar/show.php?username=stanford&size=large)
Facebook圈子数据集
This dataset consists of 'circles' (or 'friends lists') from Facebook. Facebook data was collected from...NLP Classification
1M
1512
Stanford University![](https://www.payititi.com/api/avatar/show.php?username=stanford&size=large)
Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本)
For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification
1.46G
924
University of Edinburgh![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
人民日报词性标注语料数据(199801)
人民日报语料,分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)资源为1998年人民日报1-6月份...OCR/Text Detection Classification
3.37M
993
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
心灵鸡汤文本数据集
来自github的一个毒鸡汤文本数据集,该数据是网站 http://www.nows.fun/ 的站点数据。数据量:1232条。文件格式为sql...OCR/Text Detection Classification
125K
1160
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
20万英语笑话文本数据集
发布时间: 2016年这个数据库中有大约208000个笑话。文件目前数据集包含来自三个来源的笑话。---------------------------------...OCR/Text Detection Classification
24.57M
866
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
手语数字图片数据集
手语(也称为手语)是使用手动交流传达含义的语言。这可以包括同时采用手势,运动,手指,手臂或身体的方向以及面部表情来传达讲...OCR/Text Detection Classification
16.4M
903
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
自然图像中文本定位的合成数据集,包含80万张图像
这是一个综合生成的数据集,其中单词实例被放置在自然场景图像中,同时考虑到了场景布局。该数据集由80万张图像组成,其中有大约...Image Search Classification
73.5G
1441
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
美国手语中字母的图像数据集
数据集是来自美国手语的字母图像的集合,分为29个文件夹,代表各个类别。训练数据集包含87,000张200x200像素的图像。有29个...NLP,Image Search Classification
1.03G
1145
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
处理单词和物体时的fMRI图像数据
OpenfMRI数据库(Poldrack等人,2013年;Poldrack和Gorgolewski,2015年)是一个使用MRI和EEG技术收集的人脑成像数据库。它从201...Image Search Classification
3.14G
791
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
腾讯AI Lab开源大规模高质量中文词向量数据
腾讯AI Lab此次公开的中文词向量数据包含800多万中文词汇,其中每个词对应一个200维的向量。相比现有的中文词向量数据,腾讯AI L...NLP,MNIST Classification
39.4G
705
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
Euler图学习开源数据集
本数据集根据2018年10月23日多类目下采样得到的用户点击行为数据,构建得到图数据。注:列分割符为”||”节点编号:图数据包括两...MNIST Classification
243.41M
558
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
TED平行语料库
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行...MNIST Classification
872.9M
984
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
SMS垃圾邮件收集数据集,标记为垃圾邮件或合法短信的集合
SMS Spam Corpus v.0.1是一组SMS短信标签消息,已收集用于SMS Spam研究。它包含两个英文短信息集合,包含1084和1319条消息,标记...MNIST Classification
503K
1199
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
Twitter情感分析训练语料库
推特情感分析数据集包含1,578,627条分类推文,每一行都被标记为1代表积极情感,0代表消极情感。我建议使用1/10的语料库来测试你...MNIST Classification
53.8M
881
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
多领域情感数据集(2.0版)
多域情感数据集包含来自Amazon.com的许多产品类型(域)的产品评论。某些域(书籍和DVD)具有数十万条评论。其他(乐器)只有几...MNIST Classification
1.53G
700
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)
斯坦福大学Sentiment140情感分析数据集
Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集,数据抓取自twitter;这个流行的数据集能让你完...MNIST Classification
77.6M
1117
robot![](https://www.payititi.com/api/avatar/show.php?username=xiaochengxu&size=large)