语音识别_公开数据集帕依提提-人工智能高质量数据集开放平台

Hi-Fi 多扬声器英语 TTS 数据集 (Hi-Fi TTS) 用于训练文本到语音模型的多说话者英语数据集about this resource:Hi-Fi Multi-Speaker English TTS Dataset (Hi-Fi TTS) is a m...Music Analysis Audio

41G 961

LibriVox

Nonverbal Vocalization Dataset 深度非言语发声数据集 about this resource:Volume(full set): ~0.6(~57) hours, ~800(~70,000) utterances, ~500(~1500) speakersFormat: 16kHz, 16-b...Music Analysis Audio

43.7M 916

Deeply Inc

LibriSpeech ASR corpus 语音数据 LibriSpeech ASR corpus 是一个语音数据，包括 1000小时的英文发音和对应文字。标识符：SLR12摘要：大规模（1000小时）阅读英语...NLP Audio

8.14G 1543

Vassil Panayotov

Google Audioset 音频数据集 AudioSet 包含了 632 类的音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段（片段来自 YouTube 视频）。音频本体...NLP Audio

2.41G 1944

Google

TIMIT语音识别数据 TIMIT语音读取语料库旨在为声学语音研究以及自动语音识别系统的开发和评估提供语音数据。TIMIT包含由八种主要美国英语方言组成的...NLP Audio

419.81M 1179

宾夕法尼亚大学

THUYG-20 维吾尔语语音数据摘要：免费的维吾尔语言数据库由CSLT @清华大学和新疆大学发布类别：演讲许可证：Apache License v.2.0介绍THUGY20是由语音和语...NLP Audio

6.12G 1916

清华大学

ALFFA 非洲语音数据收集撒哈拉以南非洲语言资源进行自动语音识别：Wolof案例研究。Elodie Gauthier，Laurent Besacier，Sylvie Voisin，Michael Mel...NLP Audio

3.81G 903

ALFFA

THCHS-30 汉语语音识别数据 THCHS-30标识符：SLR18摘要：CSLT @清华大学发布免费汉语语音语料库类别：演讲许可证：Apache License v.2.0THCHS30是由清华大学...NLP Audio

13.4G 1717

Tsinghua University

Sinhala TTS 语音识别数据僧伽罗语TTS标识符：SLR30摘要：僧伽罗语多音箱TTS语料库类别：演讲许可：署名 - ShareAlike 4.0国际（CC BY-SA 4.0）关于此资源...CNN Audio

247.96M 1199

Google

呼吸声音数据集，用于检测呼吸系统疾病呼吸声音数据库，使用录音来检测呼吸系统疾病。呼吸音是呼吸健康和呼吸系统疾病的重要指标。人呼吸时发出的声音与空气流动，肺组...Medical Audio

3.69G 1697

voltamax

心跳声音数据集该数据集最初是针对机器学习挑战来对心跳声音进行分类的。数据是从两个来源收集的：（A）通过iStethoscope Pro iPhone应用程序从...Medical Audio

110M 901

Ed King

TED-LIUM 英语语音识别训练语料库 TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音，其中包括630位来自美国...Video Games Audio

19.82G 760

University of Pennsylvania

免费ST中文普通话语料库使用手机在室内静音环境下记录了该语料库。它具有855个扬声器。每个扬声器有120声。所有话语都经过仔细记录，并由人工检查。转录...Music Analysis Audio

8.2G 717

openslr

LibriTTS语料库 LibriTTS是一个多语种英语语料库，由Heiga Zen在Google Speech和Google Brain团队的协助下编写，以24kHz采样率大约585小时阅读英...Video Data Audio

1.2G 2025

openslr

免费ST美国英语语料库使用手机在室内静音环境下记录了该语料库。它有10个扬声器。每个说话者大约有350种话语。所有话语都经过仔细记录，并由人工检查...Video Games Audio

351M 689

openslr

THCHS30 中文语音数据集 THCHS30是一个开放的中文语音数据库，由清华大学语音与语言技术中心（CSLT）发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio

6.4G 1289

清华大学语音与语言技术中心

人类语音的大规模视听数据集（VoxCeleb2） VoxCeleb2 包含从上传到 YouTube 的视频中提取的 6,112 位名人的超过 100 万条话语。 VoxCeleb2 的开发集与 VoxCeleb1 或 SITW...Music Analysis Audio

1.47G 1897

robot

大型说话人识别数据集（VoxCeleb1） VoxCeleb1 包含从上传到 YouTube 的视频中提取的 1,251 位名人的超过 100,000 条话语。...Music Analysis Audio

136M 877

robot

FMA大型音乐分析数据集 Music Analysis Audio

1000G 840

robot

LibriSpeech ASR 语料库，大规模英语语料库 LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库，由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自...Music Analysis Audio

148.59G 919

openslr

Select Language

AI社区

今日排行

本月搜索

Dataset Category

公开数据集