人类语音的大规模视听数据集 (VoxCeleb2)
VoxCeleb2 包含从上传到 YouTube 的视频中提取的 6,112 位名人的超过 100 万条话语。 VoxCeleb2 的开发集与 VoxCeleb1 或 SITW...Music Analysis Audio
1.47G
1844
robot
大型说话人识别数据集(VoxCeleb1)
VoxCeleb1 包含从上传到 YouTube 的视频中提取的 1,251 位名人的超过 100,000 条话语。...Music Analysis Audio
136M
833
robot
LibriSpeech ASR 语料库,大规模英语语料库
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自...Music Analysis Audio
148.59G
859
openslr
AISHELL-家居环境近远讲同步语音数据库
AISHELL-2019A-EVAL 随机抽取 50 个发音人。每人从位置 A(高保真 44.1kHz,16bit)与位置 F(Android 系统手机 16kHz,16bit)中,...Music Analysis Audio
15G
668
robot
固有唤醒词数据库 HI-MIA
The data is used in AISHELL Speaker Verification Challenge 2019. It is extracted from a larger database called AISHELL-W...Music Analysis Audio
45.8G
843
robot
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发行版包含泰卢固语、泰米尔语和古吉拉特语的会话和短语语音训练和测试数据。数据包包括音...Music Analysis Audio
0M
1188
robot