返回主站|会员中心|保存桌面 手机浏览
MoreOpen Dataset
More成品数据集
1,000万道英文试题文本数据结构化解析处理数据
应用场景:大模型学科知识增强
规模:1,000万道 格式:文本
500万条中文专利解析数据
应用场景:中文专利
规模:500万条 格式:文本
700万组高质量视频描述数据
应用场景:视频识别
规模:700万组 格式:视频
3亿组高质量图像描述数据
应用场景:图像识别
规模:3亿组 格式:图像
90,356条印地语发音词典
应用场景:语音识别
规模:90,356条 格式:文本
2人韩语平均音色合成库
应用场景:语音合成
规模:4小时 格式:音频
209小时粤语语音数据_车载领域朗读(麦克风)
应用场景:语音识别
规模:209小时 格式:音频
217小时西班牙语金融领域实体标注语音数据_口语化
应用场景:金融领域
规模:217小时 格式:音频
2人日语平均音色合成库
应用场景:语音合成
规模:20小时 格式:音频
203小时德国德语金融领域实体标注语音数据_口语化
应用场景:金融领域
规模:203小时 格式:音频
206小时英语金融领域实体标注语音数据_口语化
应用场景:金融领域
规模:206小时 格式:音频
19小时公交场景噪音数据(录音笔)
应用场景:公交场景
规模:19小时 格式:音频
105小时意大利意大利语游戏领域语音数据_口语化
应用场景:游戏
规模:105小时 格式:音频
254小时天津话自然对话手机采集语音数据
应用场景:语音识别
规模:254小时 格式:音频
505小时客家话自然对话手机采集语音数据
应用场景:语音识别、声纹识别
规模:505小时 格式:音频
509小时潮汕话自然对话手机采集语音数据
应用场景:语音识别、声纹识别
规模:509小时 格式:音频
839小时罗马尼亚罗马尼亚语口语化语音数据
应用场景:语音识别
规模:839小时 格式:音频
411小时英语模拟医疗语音数据_朗读
应用场景:医疗
规模:411小时 格式:音频
180人9,000张驾驶员手势21关键点标注数据
应用场景:驾驶员手势识别、手势关键点检测和识别
规模:9,000张 格式:图像
4人东北方言平均音色合成库
应用场景:语音合成
规模:200小时 格式:音频