百科类问答json版,含有150万个预先过滤过的、高质量问题和答案
本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G
1401
Thomas-yanxin
squad数据集
SQuAD(The Stanford Question Answering Dataset)是一组阅读数据集,该数据集基于群众在维基百科中提出的问题,其中每个问题的...Action/Event Detection Text
34M
940
斯坦福大学
Visual Question Answering V2.0 一个针对图像内容进行自然语言问答的数据集
Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容...NLP Text
30.7G
1136
VQA
MSParS (V1.0):用于基于知识的问答的多视角语义解析数据集
MSParS是一个用于开放领域语义解析任务的大规模数据集。整个数据集由81,826个样本组成,这些样本由以英语为母语的人注释。我们对...MNIST Classification
4.94M
703
robot
常识问答文本数据集(CommonsenseQA)
CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M
1507
Tel-Aviv University
Quora 问答数据集
Quora 是一个获取和分享知识的问答平台,它能够促进人们互相学习,以更好地认识这个世界。每个月有超过 1 亿的人访问 Quora,所...NLP,MNIST Classification
381.2M
943
robot
3.2G
940
microsoft
用户分析和滥用语言检测数据集数据集
Abubakar Umar, abubakar.pg715673 '@' st.futminna.edu.ng, Federal University of Technology Minna, Nigeria,Data Se...Computer Classification
3.2M
874
University of California, Irvine
COVID19相关常见问题,此数据包含与新冠肺炎相关的问答集19
What is this?This data contains collection of question and answers related to COVID19.Where does this come from?Thi...NLP,Health,Coronavirus,Psychology,Diseases Classification
0.1M
318
Deepan.N
Stack Overflow 2018 问题数据集
In this dataset, we explore StackOverflow questions and try to use unsupervised algorithms to extract tags, then train c...NLP,Earth and Nature,Computer Science,Multiclass Classification Classification
230.27M
459
Réda