Select Language

AI社区

人工智能数据集交易平台

240小时印地语手机采集语音数据_朗读【数据堂】

240小时印地语手机采集语音数据_朗读【数据堂】

164 浏览
0 喜欢
0 条评论
240小时 音频 语音识别;声纹识别

格式16kHz,16bit,未压缩wav,单声道录音环境304人录制于相对安静的室内,无回声;97人录制于普通环境,包含不影响语音辨识的噪......

README.md

  • 格式

  • 16kHz,16bit,未压缩wav,单声道

  • 录音环境

  • 304人录制于相对安静的室内,无回声;97人录制于普通环境,包含不影响语音辨识的噪音

  • 录音内容

  • 财经,娱乐,新闻,口语,数字,字母

  • 人员

  • 401名印度人,其中男性占比61%

  • 设备

  • 安卓手机、苹果手机

  • 语言

  • 印地语

  • 转写内容

  • 文本转写;时间戳;5种噪音符号;标识符

  • 准确率

  • 句准确率95%(噪音符号和其他标识符的准确率不计入在内)

  • 应用场景

  • 语音识别;声纹识别


0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司