相关搜索
您是不是在找?
今日排行
本周排行
本月排行
GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述
Over 8 million GitHub issue titles and descriptions from 2017. Prepared from instructions at How To Create Data Products...NLP,Software Classification
2.85G
638
David Shinn
百科类问答json版,含有150万个预先过滤过的、高质量问题和答案
本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G
1083
Thomas-yanxin
25.44M
1126
Rishabh Misra
斯瓦希里语翻译语音转录和主题(包含 10 个半小时语音数据集)
该项任务的输入数据是来自红十字会的灾难与威胁相关信息,其中包括疾病、人身伤害和自然灾害等主题。每个类别都提供了相关信息,...Video Data Audio
42.8G
610
appen
爱尔兰时报新闻标题数据集
该新闻数据集是爱尔兰《爱尔兰时报》发布的142万条新闻标题的集合。该机构成立于159年前,可以长期鸟瞰欧洲的局势。文件格式:pu...OCR/Text Detection Classification
47M
697
爱尔兰时报
印度新闻标题数据集
ContextThis news dataset is a persistent historical archive of noteable events in the Indian subcontinent from start-200...OCR/Text Detection Classification
246.96M
610
Rohit Kulkarni
USPTO算法挑战赛,由美国宇航局哈佛竞赛实验室和TopCoder问题:Pat数据集运行
-- Creator: TopCoder, Inc.-- Released under Apache License, Version 2.0http://www.apache.org/licenses/LICENSE-2.0.htmlDa...N/A Classification
135.92M
708
University of California, Irvine
德黑兰大学问题数据集2016(UTQD.2016)数据集
Mohammad Razzaghnoori/Dept. of Mathematics, Statistics and Computer Science, College of Science, University of Tehran/m....N/A Classification
107K
677
University of California, Irvine
SCADI数据集 自我护理问题分类的数据集
--Creators: S.M.M. Fatemi Bushehri, Moslem Dehghanizadeh, Shokoofeh Kalantar, Mohsen Sardari Zarchi * S.M.M. Fatemi Bush...Life Classification
4.8K
875
University of California, Irvine
NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析
Data Set Information:Documents are first obtained via a Web search using AMIEI: an integrated platform for delivering en...NLP,Social Clustering
17.5M
517
University of California, Irvine
114.5M
833
Harshit Joshi
数据集用于NBV问题
Computer Science,Biology,Image Data,Classification,Deep Learning Classification
3363.85M
345
miguelmg
CoNLL003 命名实体识别(NER)问题的注释数据集
This is an annotated dataset for Named Entity Recognition (NER) problemContentThis dataset is divided into train.txt, te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification
4.63M
461
AlaaKhaled