Select Language

AI社区

人工智能数据集交易平台

500小时闽南语自然对话手机采集语音数据【数据堂】

500小时闽南语自然对话手机采集语音数据【数据堂】

170 浏览
0 喜欢
0 条评论
500小时 音频 语音识别;声纹识别

格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个自己熟悉的话题......

README.md

  • 格式

  • 16kHz,16bit,未压缩wav,单声道

  • 录音环境

  • 相对安静的室内,无回声

  • 录音内容

  • 给出话题列表,录音人从中挑选多个自己熟悉的话题以确保对话的流畅自然,围绕每个话题展开一段对话并录制

  • 人员

  • 约1,000名录音人,录音人来自泉州、漳州、厦门地区,男女比例均衡,覆盖多个年龄段,均为闽南语使用者

    设备

  • 安卓手机、苹果手机

  • 标注内容

  • 标注文本内容、有效句子的起止时间点、说话人标识

  • 准确率

  • 句准确率95%

  • 应用场景

  • 语音识别;声纹识别






0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司