相关搜索
您是不是在找?
今日排行
本周排行
本月排行
THUCTC 中文文本分类数据集
THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自...OCR/Text Detection Classification
1.1G
2599
清华大学自然语言处理与社会人文计算实验室
THCHS30 中文语音数据集
THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G
1070
清华大学语音与语言技术中心
Jamalon 阿拉伯语书籍数据集
Jamalon是中东最大的在线书店,提供超过950万种阿拉伯语和英语书籍,以及上门送货服务。该数据集包含不同类别的不同领域中的大量...OCR/Text Detection Classification
1.2M
693
robot
巴黎圣母院大教堂图像重建数据集
Notre Dame 数据集是巴黎圣母院大教堂的 715 张图像重建的数据集,于 2006 年由 Photo Tourism group 发布。...Housing,Culture and Humanities Classification
1.71G
657
robot
心灵鸡汤文本数据集
来自github的一个毒鸡汤文本数据集,该数据是网站 http://www.nows.fun/ 的站点数据。数据量:1232条。文件格式为sql...OCR/Text Detection Classification
125K
1019
robot
20万英语笑话文本数据集
发布时间: 2016年这个数据库中有大约208000个笑话。文件目前数据集包含来自三个来源的笑话。---------------------------------...OCR/Text Detection Classification
24.57M
701
robot
自然图像中文本定位的合成数据集,包含80万张图像
这是一个综合生成的数据集,其中单词实例被放置在自然场景图像中,同时考虑到了场景布局。该数据集由80万张图像组成,其中有大约...Image Search Classification
73.5G
1227
robot
6.9M
1111
robot
腾讯AI Lab开源大规模高质量中文词向量数据
腾讯AI Lab此次公开的中文词向量数据包含800多万中文词汇,其中每个词对应一个200维的向量。相比现有的中文词向量数据,腾讯AI L...NLP,MNIST Classification
39.4G
581
robot
中文繁体字分词数据集 UD-Chinese-GSD
Universal Dependencies 是一个旨在为多种语言开发跨语言一致的树库注释的项目,其目标是促进多语言解析器的开发、跨语言学习和...MNIST Classification
400.17M
623
robot
常识问答文本数据集(CommonsenseQA)
CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M
1251
Tel-Aviv University
354K
569
robot
科学知识图谱数据(SciKG),由概念、专家和论文组成
SciKG是一个以科研为中心的大规模知识图谱,目前包含计算机科学领域,由概念、专家和论文组成。其中,科技概念及其关系是从ACM计...NLP,MNIST Classification
1.3G
957
aminer