Select Language



GitHub NLP分析的标和描述 超过800万个GitHub发布了标和描述 Over 8 million GitHub issue titles and descriptions from 2017. Prepared from instructions at How To Create Data Products...NLP,Software Classification
2.85G 590
百科类问答json版,含有150万个预先过滤过的、高质量问和答案 本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G 1006
新闻类别数据集,包含20万条新闻标 该数据集包含从HuffPost获得的2012年至2018年的大约20万条新闻标题。在该数据集上训练的模型可用于识别未跟踪新闻文章的标签或识...NLP Text
25.44M 1031
斯瓦希里语翻译语音转录和主(包含 10 个半小时语音数据集) 该项任务的输入数据是来自红十字会的灾难与威胁相关信息,其中包括疾病、人身伤害和自然灾害等主题。每个类别都提供了相关信息,...Video Data Audio
42.8G 569
爱尔兰时报新闻标数据集 该新闻数据集是爱尔兰《爱尔兰时报》发布的142万条新闻标题的集合。该机构成立于159年前,可以长期鸟瞰欧洲的局势。文件格式:pu...OCR/Text Detection Classification
47M 668
印度新闻标数据集 ContextThis news dataset is a persistent historical archive of noteable events in the Indian subcontinent from start-200...OCR/Text Detection Classification
246.96M 570
0M 470
USPTO算法挑战赛,由美国宇航局哈佛竞赛实验室和TopCoder问:Pat数据集运行 -- Creator: TopCoder, Inc.-- Released under Apache License, Version 2.0 Classification
135.92M 655
德黑兰大学问数据集2016(UTQD.2016)数据集 Mohammad Razzaghnoori/Dept. of Mathematics, Statistics and Computer Science, College of Science, University of Tehran/m....N/A Classification
107K 626
SCADI数据集 自我护理问分类的数据集 --Creators: S.M.M. Fatemi Bushehri, Moslem Dehghanizadeh, Shokoofeh Kalantar, Mohsen Sardari Zarchi * S.M.M. Fatemi Bush...Life Classification
4.8K 800
NYSK数据集,用于文本挖掘任务中的主提取、情绪分析 Data Set Information:Documents are first obtained via a Web search using AMIEI: an integrated platform for delivering en...NLP,Social Clustering
17.5M 475
建模 #数据集该数据集由Harshit Joshi#Contents创建,其中包含以下文件:...Psychology Classification
114.5M 727
遗传算法:n -皇后问的结果 Biology Classification
0.17M 322
数据集用于NBV问 Computer Science,Biology,Image Data,Classification,Deep Learning Classification
3363.85M 317
津巴布韦标准新闻标和预告(NLP) News,Linguistics Classification
0M 304
不真诚的问预测 Others Classification
118.45M 322
SVHN数据集,以最高性能解决SVHN问 SVHN数据集,以最高性能解决SVHN问题...Earth and Nature Classification
1.5G 490
CoNLL003 命名实体识别(NER)问的注释数据集 This is an annotated dataset for Named Entity Recognition (NER) problemContentThis dataset is divided into train.txt, te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification
4.63M 415
客户问 Others Classification
230.41M 284
对数据集 Software,Linguistics,Languages,Artificial Intelligence Classification
57.93M 247