Select Language

AI社区

人工智能数据集交易平台

254小时天津话自然对话手机采集语音数据

254小时天津话自然对话手机采集语音数据

30 浏览
0 喜欢
0 条评论
254小时 音频 语音识别

数据名称:254小时天津话自然对话手机采集语音数据格式:16kHz,16bit,未压缩wav,单声道录音环境:相对安静的室内,无回声录音......

README.md

数据名称:254小时天津话自然对话手机采集语音数据

格式:16kHz,16bit,未压缩wav,单声道

录音环境:相对安静的室内,无回声

录音内容:给出话题列表,录音人从中挑选多个自己熟悉的话题以确保对话的流畅自然,围绕每个话题展开一段对话并录制

人员:共330人,性别比例均衡;录音人年龄分布在18-60岁

标注特点:截取有效单句进行标注, 标注结果包括有效单句的起止时间点、说话人标识、文本内容;噪音标注

设备:安卓手机、苹果手机

语言:天津话

准确率:句准确率95%

0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司