返回主站|会员中心|保存桌面 手机浏览
MoreOpen Dataset
More成品数据集
大模型内容安全类文本数据【数据堂】
应用场景:可用于自然语言理解等任务
规模:50万条 格式:文本
10万对中文大模型通用领域指令跟随SFT文本数据集【数据堂】
应用场景:用于训练提升大模型的指令跟随性
规模:10万 格式:文本
2,608段减肥前后对比视频数据【数据堂】
应用场景:人体行为检测;减肥前后对比
规模:2,608段 格式:视频
114万组中希伯来语平行语料数据【数据堂】
应用场景:机器翻译
规模:114万对中希伯来平行语料数据,中文平均句长19.4个字符 格式:文本
501万组汉藏平行语料数据【数据堂】
应用场景:机器翻译
规模:501万对汉藏平行语料数据,汉语平均句长20.8个字符 格式:文本
98万组中文-乌尔都语平行语料数据【数据堂】
应用场景:机器翻译
规模:98万组中文-乌尔都语平行语料数据,中文平均句长19.9个字符 格式:文本
199万组中文-捷克语平行语料数据【数据堂】
应用场景:机器翻译
规模:199万组中文-捷克语平行语料数据 格式:文本
198万组中文-波兰语平行语料数据【数据堂】
应用场景:机器翻译
规模:198万组中文-波兰语平行语料数据 格式:文本
10万组汉维平行语料数据【数据堂】
应用场景:机器翻译
规模:10万对汉维平行语料 格式:文本
38万日英平行语料数据【数据堂】
应用场景:机器翻译
规模:38万对日英平行语料数据 格式:文本
134万组英韩平行语料数据【数据堂】
应用场景:机器翻译
规模:134万对英韩平行语料数据 格式:文本
100万组中俄平行语料数据【数据堂】
应用场景:机器翻译
规模:100万对中俄平行语料数据,中文句长平均14.6个字符 格式:文本
108万条英俄平行语料数据【数据堂】
应用场景:机器翻译
规模:108万对英俄平行语料数据 格式:文本
744万条中印地平行语料数据【数据堂】
应用场景:机器翻译
规模:744万对中印地平行语料数据 格式:文本
531万中德平行语料数据【数据堂】
应用场景:机器翻译
规模:531万对中德平行语料数据 格式:文本
6.78小时中文女声模仿童声合成库【数据堂】
应用场景:TTS
规模:6.78小时 格式:音频
10.1小时中文女声客服合成库【数据堂】
应用场景:语音合成
规模:10.1小时 格式:音频
19.46小时美国英语女声合成库【数据堂】
应用场景:语音合成
规模:19.46小时 格式:音频
26.1小时中文女声客服合成库【数据堂】
应用场景:语音合成
规模:26.1小时 格式:音频
150人中文客服平均音色合成库【数据堂】
应用场景:语音合成
规模:150人 格式:音频