自然_公开数据集帕依提提-人工智能高质量数据集开放平台

Twitter 社交数据集 This dataset consists of 'circles' (or 'lists') from Twitter. Twitter data was crawled from public sourc...NLP Classification

31.4M 1612

Stanford University

Google+ 社交圈子数据集 This dataset consists of 'circles' from Google+. Google+ data was collected from users who had manually shared t...NLP Classification

773M 1059

Stanford University

Facebook圈子数据集 This dataset consists of 'circles' (or 'friends lists') from Facebook. Facebook data was collected from...NLP Classification

1M 1625

Stanford University

Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本) For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification

1.46G 1020

University of Edinburgh

人民日报词性标注语料数据（199801）人民日报语料，分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)资源为1998年人民日报1-6月份...OCR/Text Detection Classification

3.37M 1140

robot

心灵鸡汤文本数据集来自github的一个毒鸡汤文本数据集，该数据是网站 http://www.nows.fun/ 的站点数据。数据量：1232条。文件格式为sql...OCR/Text Detection Classification

125K 1278

robot

20万英语笑话文本数据集发布时间： 2016年这个数据库中有大约208000个笑话。文件目前数据集包含来自三个来源的笑话。---------------------------------...OCR/Text Detection Classification

24.57M 988

robot

手语数字图片数据集手语（也称为手语）是使用手动交流传达含义的语言。这可以包括同时采用手势，运动，手指，手臂或身体的方向以及面部表情来传达讲...OCR/Text Detection Classification

16.4M 989

robot

自然图像中文本定位的合成数据集，包含80万张图像这是一个综合生成的数据集，其中单词实例被放置在自然场景图像中，同时考虑到了场景布局。该数据集由80万张图像组成，其中有大约...Image Search Classification

73.5G 1622

robot

美国手语中字母的图像数据集数据集是来自美国手语的字母图像的集合，分为29个文件夹，代表各个类别。训练数据集包含87,000张200x200像素的图像。有29个...NLP,Image Search Classification

1.03G 1221

robot

处理单词和物体时的fMRI图像数据 OpenfMRI数据库（Poldrack等人，2013年；Poldrack和Gorgolewski，2015年）是一个使用MRI和EEG技术收集的人脑成像数据库。它从201...Image Search Classification

3.14G 885

robot

腾讯AI Lab开源大规模高质量中文词向量数据腾讯AI Lab此次公开的中文词向量数据包含800多万中文词汇，其中每个词对应一个200维的向量。相比现有的中文词向量数据，腾讯AI L...NLP,MNIST Classification

39.4G 784

robot

Euler图学习开源数据集本数据集根据2018年10月23日多类目下采样得到的用户点击行为数据，构建得到图数据。注：列分割符为”||”节点编号：图数据包括两...MNIST Classification

243.41M 596

robot

TED平行语料库 TED平行语料库是多语言平行语料库，包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。多语言的平行...MNIST Classification

872.9M 1092

robot

SMS垃圾邮件收集数据集，标记为垃圾邮件或合法短信的集合 SMS Spam Corpus v.0.1是一组SMS短信标签消息，已收集用于SMS Spam研究。它包含两个英文短信息集合，包含1084和1319条消息，标记...MNIST Classification

503K 1312

robot

Twitter情感分析训练语料库推特情感分析数据集包含1,578,627条分类推文，每一行都被标记为1代表积极情感，0代表消极情感。我建议使用1/10的语料库来测试你...MNIST Classification

53.8M 967

robot

谷歌AI自然语言对话数据集CCPE MNIST Classification

5M 743

robot

谷歌AI自然语言对话数据集Taskmaster-1 MNIST Classification

80M 773

robot

多领域情感数据集（2.0版）多域情感数据集包含来自Amazon.com的许多产品类型（域）的产品评论。某些域（书籍和DVD）具有数十万条评论。其他（乐器）只有几...MNIST Classification

1.53G 795

robot

斯坦福大学Sentiment140情感分析数据集 Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集，数据抓取自twitter；这个流行的数据集能让你完...MNIST Classification

77.6M 1172

robot

Select Language

AI社区

今日排行

本月搜索

Dataset Category

公开数据集