Facebook圈子数据集
This dataset consists of 'circles' (or 'friends lists') from Facebook. Facebook data was collected from...NLP Classification
1M
1358
Stanford University
Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本)
For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification
1.46G
772
University of Edinburgh
腾讯AI Lab开源大规模高质量中文词向量数据
腾讯AI Lab此次公开的中文词向量数据包含800多万中文词汇,其中每个词对应一个200维的向量。相比现有的中文词向量数据,腾讯AI L...NLP,MNIST Classification
39.4G
579
robot
Euler图学习开源数据集
本数据集根据2018年10月23日多类目下采样得到的用户点击行为数据,构建得到图数据。注:列分割符为”||”节点编号:图数据包括两...MNIST Classification
243.41M
472
robot
TED平行语料库
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行...MNIST Classification
872.9M
829
robot
SMS垃圾邮件收集数据集,标记为垃圾邮件或合法短信的集合
SMS Spam Corpus v.0.1是一组SMS短信标签消息,已收集用于SMS Spam研究。它包含两个英文短信息集合,包含1084和1319条消息,标记...MNIST Classification
503K
1062
robot
多领域情感数据集(2.0版)
多域情感数据集包含来自Amazon.com的许多产品类型(域)的产品评论。某些域(书籍和DVD)具有数十万条评论。其他(乐器)只有几...MNIST Classification
1.53G
582
robot
斯坦福大学Sentiment140情感分析数据集
Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集,数据抓取自twitter;这个流行的数据集能让你完...MNIST Classification
77.6M
970
robot
中文繁体字分词数据集 UD-Chinese-GSD
Universal Dependencies 是一个旨在为多种语言开发跨语言一致的树库注释的项目,其目标是促进多语言解析器的开发、跨语言学习和...MNIST Classification
400.17M
620
robot
百度实体标注数据集
一个大规模的中文短文本语料库,用于实体识别和链接任务。BEL包含100K注释的短文本,以及对应于百度知识库中的实体的提及和链接...NLP,MNIST Classification
381.4M
490
robot
微软表格数据集TableBank
TableBank 是一个新的基于图像的表格检测和识别数据集,利用互联网上 Word 和 Latex 文档的新颖弱监督构建,包含 417K 高质量标...MNIST Classification
23.1G
691
robot
MSParS (V1.0):用于基于知识的问答的多视角语义解析数据集
MSParS是一个用于开放领域语义解析任务的大规模数据集。整个数据集由81,826个样本组成,这些样本由以英语为母语的人注释。我们对...MNIST Classification
4.94M
506
robot
Chinese Word Analogy Lists 汉语词语类比数据集
Most word embedding methods take a word as a basic unit and learn embeddings according to words’ external contexts, ign...MNIST Classification
121.1M
504
robot
常识问答文本数据集(CommonsenseQA)
CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M
1249
Tel-Aviv University
354K
566
robot