Select Language

AI社区

人工智能数据集交易平台

607小时粤语自然对话语音数据【数据堂】

607小时粤语自然对话语音数据【数据堂】

379 浏览
0 喜欢
0 条评论
607小时 音频 语音识别;声纹识别

格式16kHz/44.1kHz,16bit,未压缩wav,单声道/双声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个......

README.md

  • 格式

  • 16kHz/44.1kHz,16bit,未压缩wav,单声道/双声道

  • 录音环境

  • 相对安静的室内,无回声

  • 录音内容

  • 给出话题列表,录音人从中挑选多个自己熟悉的话题以确保对话的流畅自然,围绕每个话题展开一段对话并录制

  • 人员

  • 共995名广州人,其中两人组504人,三人组195人,四人组196,五人组100人;总体男性占比51%;录音人年龄主要分布在26-45岁,占比45%

  • 设备

  • 手机和录音笔

  • 标注内容

  • 标注文本内容、有效句子的起止时间点、说话人标识

  • 应用场景

  • 语音识别;声纹识别






0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司