Select Language

AI社区

人工智能数据集交易平台

131小时重口音普通话手机采集语音数据【数据堂】

131小时重口音普通话手机采集语音数据【数据堂】

208 浏览
0 喜欢
0 条评论
131小时 音频 语音识别;声纹识别

格式16kHz,16bit,未压缩wav,单声道录音环境1,605人录制于相对安静的室内;963人录制于普通环境,包含不影响语音识别的噪声录......

README.md

  • 格式

  • 16kHz,16bit,未压缩wav,单声道

  • 录音环境

  • 1,605人录制于相对安静的室内;963人录制于普通环境,包含不影响语音识别的噪声

  • 录音内容

  • 智能家居、智能车载、语音助手

  • 人员

  • 2,568人;约64句/人;女性占比53%;21岁-30岁占比最多达51%;录音人员来自河南、陕西、四川、湖南、福建、黑龙江、贵州等28个省

  • 设备

  • 苹果手机、安卓手机

  • 语言

  • 带严重方言口音的普通话

  • 应用场景

  • 语音识别,声纹识别

  • 准确率

  • 句准确率不低于98%


0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司