公开数据集
数据结构 ? 85G
README.md
WSJ0 Hipster环境混合(WHAM!)数据集将WSJ0-2mix数据集中的每两种扬声器混合与独特的噪声背景场景配对。我们还创建了WHAMR!,除了背景噪声之外,将人工混响添加到语音信号的扩展。
2018年末,在旧金山湾区的各个城市地点收集了噪音音频。环境主要包括餐馆、咖啡馆、酒吧和公园。音频是使用Apogee Sennheiser双耳麦克风在距离地面1.0至1.5米的三脚架上录制的。
这里提供了一组噪声样本,称为“WHAM!噪声数据集”,以及构建WHAM!还有WHAMR!来自噪声数据和WSJ0数据集的数据集。我们还提供了“WHAM!48kHz噪声数据集”,由原始采样率的噪声记录组成,而不将剪辑分割到WSJ0剪辑的持续时间。两个WHAM!噪声数据集和WHAM!48kHz噪声数据集已被处理以去除包含可理解语音的任何片段。因为WHAM!48kHz噪声数据集尚未进一步分割到WSJ0剪辑的持续时间,它具有广泛的剪辑持续时间分布。
Dataset Structure
The WHAM! noise dataset is split into training, validation, and test sets following the wsj0-2mix dataset.
Split | Directory | Duration (hr) | No. of files |
---|---|---|---|
Training | tr | 58.03 | 20,000 |
Validation | cv | 14.65 | 5000 |
Test | tt | 9.00 | 3000 |
The clips are in 32-bit floating point WAV format with 2 channels and a sampling rate of 16 kHz. The average clip duration is 10 seconds with the shortest clip being 3.5 seconds and the longest 47.7 seconds.
Citation
WHAM! is a joint effort between Mitsubishi Electronics Research Laboratories (MERL) and Whisper. If you use WHAM! or WHAM!48kHz please cite our paper describing the dataset:
@inproceedings{Wichern2019WHAM, title = {WHAM!: Extending Speech Separation to Noisy Environments}, author = {Wichern, Gordon and Antognini, Joe and Flynn, Michael and Zhu, Licheng Richard and McQuinn, Emmett and Crow, Dwight and Manilow, Ethan and Le Roux, Jonathan}, booktitle = {Proc. Interspeech}, year = {2019}, month = sep }
If you use WHAMR! please citeour paper describing the dataset:
@inproceedings{Maciejewski2020WHAMR, title = {WHAMR!: Noisy and Reverberant Single-Channel Speech Separation}, author = {Maciejewski, Matthew and Wichern, Gordon and Le Roux, Jonathan}, booktitle = {Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)}, year = {2020}, month = may }
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。