荷兰语单声道语音数据集,CSS10 荷兰语:单声道语音数据集
CSS10 is a collection of single speaker speech datasets for 10 languages. Each of them consists of audio files recorded...Data Cleaning,Universities and Colleges Classification
2.01G
515
Kyubyong Park
Primewords 中文普通话语料库,包含100小时的语音数据
This free Chinese Mandarin speech corpus set is released by Shanghai Primewords Information Technology Co., Ltd.The corp...Music Analysis Audio
9G
1451
primewords
高质量古吉拉特语(女性)多说话者语音数据集
This data set contains transcribed high-quality audio of Gujarati sentencesrecorded by volunteers. The data set consists...Music Analysis Audio
917M
674
Google, Inc.
高质量古吉拉特语(男性)多说话者语音数据集
This data set contains transcribed high-quality audio of Gujarati sentencesrecorded by volunteers. The data set consists...Music Analysis Audio
825M
684
Google, Inc
高质量约鲁巴语语音数据集(女性语音)
This data set contains transcribed high-quality audio of Yorubasentencesrecorded by volunteers. The data set consists of...Music Analysis Audio
462M
674
Google, Inc.
高质量约鲁巴语语音数据集(男性语音)
This data set contains transcribed high-quality audio of Yorubasentencesrecorded by volunteers. The data set consists of...Music Analysis Audio
445M
824
Google, Inc.
LibriSpeech ASR corpus 语音数据
LibriSpeech ASR corpus 是一个语音数据,包括 1000小时 的英文发音和对应文字。标识符:SLR12摘要:大规模(1000小时)阅读英语...NLP Audio
8.14G
1237
Vassil Panayotov
THUYG-20 维吾尔语语音数据
摘要:免费的维吾尔语言数据库由CSLT @清华大学和新疆大学发布类别:演讲许可证:Apache License v.2.0介绍THUGY20是由语音和语...NLP Audio
6.12G
1452
清华大学
ALFFA 非洲语音数据
收集撒哈拉以南非洲语言资源进行自动语音识别:Wolof案例研究。Elodie Gauthier,Laurent Besacier,Sylvie Voisin,Michael Mel...NLP Audio
3.81G
741
ALFFA
数千种有关常见医学症状语音数据集,超过8.5小时录音
该数据包含数千种有关常见医学症状(如“膝盖疼痛”或“头痛”)的语音,总计超过 8 个小时。每种语音都是由个体人类贡献者基于...Audio Data Audio
2.63G
1000
appen
斯瓦希里语翻译语音转录和主题(包含 10 个半小时语音数据集)
该项任务的输入数据是来自红十字会的灾难与威胁相关信息,其中包括疾病、人身伤害和自然灾害等主题。每个类别都提供了相关信息,...Video Data Audio
42.8G
652
appen
THCHS30 中文语音数据集
THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G
1118
清华大学语音与语言技术中心
呼吸声音数据集,包括920条带注释语音数据
呼吸音是呼吸健康和呼吸系统疾病的重要指标。人呼吸时发出的声音与空气流动,肺组织内的变化以及肺内分泌物的位置直接相关。例如...Medical Classification
3.69G
1058
robot
AISHELL-家居环境近远讲同步语音数据库
AISHELL-2019A-EVAL 随机抽取 50 个发音人。每人从位置 A(高保真 44.1kHz,16bit)与位置 F(Android 系统手机 16kHz,16bit)中,...Music Analysis Audio
15G
571
robot
帕金森病(PD)生物医学语音数据集
该数据集是由牛津大学的Max Little与丹佛科罗拉多语音和语音中心合作录制的。最初的研究发表了针对一般语音障碍的特征提取方法。...Life Classification
278K
1201
University of California, Irvine
具有多种录音数据集的帕金森语音数据集
Data Set Information:PD数据库由培训和测试文件组成。培训数据属于20名PWP(6名女性,14名男性)和20名健康人(10名女性,10名...Medical Classification
92.1K
944
University of California, Irvine