相关搜索
您是不是在找?
今日排行
本周排行
本月排行
百科类问答json版,含有150万个预先过滤过的、高质量问题和答案
本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G
1054
Thomas-yanxin
DARPA TIMIT声学语音连续语音语料库
TIMIT(英语:The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus),是由德州仪器、麻省理工学院和SRI International...Music Analysis Audio
812.64M
837
robot
Wisesight 情感语料库数据集
对于 wisesight-160 和 wisesight-1000,它们是从这个语料库中以标记化形式的样本,有关数据探索和分类示例,请参阅泰语文本分类...Mental Health Text
4.1M
793
uci-edu
文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的
Data Set Information:The original data were formatted by Thorsten Joachims in the “bag-of-words” representation. There...NLP Classification
1.21M
754
University of California, Irvine
9.83M
575
Bianchini, Francesco,Gazzard, Katherine
僧伽罗语数字词汇(2.0版),字母A到M
Digital Glossary of Sinhala Prakrit (version 2.0), letters A to M...NLP Classification
9.88M
657
Bianchini, Francesco,Gazzard, Katherine
Primewords 中文普通话语料库,包含100小时的语音数据
This free Chinese Mandarin speech corpus set is released by Shanghai Primewords Information Technology Co., Ltd.The corp...Music Analysis Audio
9G
1369
primewords
免费 ST 美国英语语料库
Thiscorpuswererecordedinsilencein-doorenvironmentusingcellphone.Ithas10speakers.Eachspeakerhasabout350utterances.Allutte...Music Analysis Audio
351M
675
surfing.ai
免费 ST 中文普通话语料库
Thiscorpuswererecordedinsilencein-doorenvironmentusingcellphone.Ithas855speakers.Eachspeakerhas120utterances.Allutteranc...Music Analysis Audio
8.2G
898
surfing.ai
Deeply Korean read speech corpus 深度韩语阅读语料库
about this resource:Recording environment: Studio apartment(moderate reverb), Dance studio(high reverb), Anechoic chambe...Music Analysis Audio
281M
661
Deeply Inc
Kazakh Speech Corpus (KSC) 哈萨克语语料库(KSC)
A crowdsourced open-source speech corpus for the Kazakh language. The KSC contains around 332 hoursof transcribed audio...Music Analysis Audio
19G
1182
NET
人工智能语料库-Ubuntu对话语料库 包含2600万次对话数据
建立对话系统(人类可以与虚拟代理进行自然对话)是自然语言处理中的一项艰巨任务,也是许多正在进行的研究的重点。一些挑战包括...NLP Text
2.7G
2961
Rachael Tatman
人工智能语料库-欧洲议会议事平行语料库,包括21种欧洲语言
Europarl平行语料库摘自欧洲议会的议事程序。它包括21种欧洲语言的版本:罗马语(法语,意大利语,西班牙语,葡萄牙语,罗马尼亚...NLP Classification,Text
3.75G
1024
Philipp Koehn
人民日报词性标注语料数据(199801)
人民日报语料,分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)资源为1998年人民日报1-6月份...NLP Text
2.81M
994
人民日报
TED-LIUM 英语语音识别训练语料库
TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自美国...Video Games Audio
19.82G
577
University of Pennsylvania
8.2G
545
openslr
LibriTTS语料库
LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英...Video Data Audio
1.2G
1537
openslr
351M
523
openslr
Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本)
For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification
1.46G
763
University of Edinburgh