Select Language

AI社区

人工智能数据集交易平台

505小时客家话自然对话手机采集语音数据

505小时客家话自然对话手机采集语音数据

17 浏览
0 喜欢
0 条评论
505小时 音频 语音识别、声纹识别

数据名称:505小时客家话自然对话手机采集语音数据格式:16kHz,16bit,未压缩wav,单声道录音环境:相对安静的室内,无回声录音......

README.md

数据名称:505小时客家话自然对话手机采集语音数据

格式:16kHz,16bit,未压缩wav,单声道

录音环境:相对安静的室内,无回声

录音内容:给出话题列表,录音人从中挑选多个自己熟悉的话题以确保对话的流畅自然,围绕每个话题展开一段对话并录制

人员:894名录音人,录音人来自广东地区使用客家话的县市,男女比例均衡,覆盖多个年龄段 标注特点:标注文本内容、普通话释义、有效句子的起止时间点、说话人标识

设备:安卓手机、苹果手机

语言:客家话

准确率:字准确率98%;普通话注释准确率90%

应用场景:语音识别,声纹识别

0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司