Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
THUCTC 中本分类数据集 THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自...OCR/Text Detection Classification
1.1G 2599
THCHS30 中语音数据集 THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G 1070
奥卢大学多媒体团队档数据库 OCR/Text Detection Classification
953.67M 745
Jamalon 阿拉伯语书籍数据集 Jamalon是中东最大的在线书店,提供超过950万种阿拉伯语和英语书籍,以及上门送货服务。该数据集包含不同类别的不同领域中的大量...OCR/Text Detection Classification
1.2M 693
2012年综合选举推 OCR/Text Detection Classification
767.86M 644
微软ClueWeb重复新闻章数据集 OCR/Text Detection Classification
150M 955
巴黎圣母院大教堂图像重建数据集 Notre Dame 数据集是巴黎圣母院大教堂的 715 张图像重建的数据集,于 2006 年由 Photo Tourism group 发布。...Housing,Culture and Humanities Classification
1.71G 657
心灵鸡汤本数据集 来自github的一个毒鸡汤文本数据集,该数据是网站 http://www.nows.fun/ 的站点数据。数据量:1232条。文件格式为sql...OCR/Text Detection Classification
125K 1019
20万英语笑话本数据集 发布时间: 2016年这个数据库中有大约208000个笑话。文件目前数据集包含来自三个来源的笑话。---------------------------------...OCR/Text Detection Classification
24.57M 701
自然图像中本定位的合成数据集,包含80万张图像 这是一个综合生成的数据集,其中单词实例被放置在自然场景图像中,同时考虑到了场景布局。该数据集由80万张图像组成,其中有大约...Image Search Classification
73.5G 1227
糖尿病标注数据集 数据集来源于中文糖尿病领域权威期刊,数据包括基础研究、临床研究、药物使用、临床病例、诊治方法等多个方面,时间跨度达到7年...Medical Classification
6.9M 1111
心理问答数据集 Medical Classification
7.49M 1112
腾讯AI Lab开源大规模高质量中词向量数据 腾讯AI Lab此次公开的中文词向量数据包含800多万中文词汇,其中每个词对应一个200维的向量。相比现有的中文词向量数据,腾讯AI L...NLP,MNIST Classification
39.4G 581
繁体字分词数据集 UD-Chinese-GSD Universal Dependencies 是一个旨在为多种语言开发跨语言一致的树库注释的项目,其目标是促进多语言解析器的开发、跨语言学习和...MNIST Classification
400.17M 623
2.6M 651
常识问答本数据集(CommonsenseQA) CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M 1251
预训练词向量数据集 该项目提供使用不同表征(稀疏和密集)、上下文特征(单词、n-gram、字符等)以及语料库训练的中文词向量(嵌入)。在这里,你可...MNIST Classification
354K 569
科学知识图谱数据(SciKG),由概念、专家和论组成 SciKG是一个以科研为中心的大规模知识图谱,目前包含计算机科学领域,由概念、专家和论文组成。其中,科技概念及其关系是从ACM计...NLP,MNIST Classification
1.3G 957
MSR抽象本压缩数据集 MNIST Classification
17.5M 526
0M 586