应用场景:可用于自然语言理解等任务
规模:50万条 格式:文本
|
应用场景:用于训练提升大模型的指令跟随性
规模:10万 格式:文本
|
应用场景:人体行为检测;减肥前后对比
规模:2,608段 格式:视频
|
应用场景:机器翻译
规模:114万对中希伯来平行语料数据,中文平均句长19.4个字符 格式:文本
|
应用场景:机器翻译
规模:501万对汉藏平行语料数据,汉语平均句长20.8个字符 格式:文本
|
应用场景:机器翻译
规模:98万组中文-乌尔都语平行语料数据,中文平均句长19.9个字符 格式:文本
|
应用场景:机器翻译
规模:199万组中文-捷克语平行语料数据 格式:文本
|
应用场景:机器翻译
规模:198万组中文-波兰语平行语料数据 格式:文本
|
应用场景:机器翻译
规模:10万对汉维平行语料 格式:文本
|
应用场景:机器翻译
规模:38万对日英平行语料数据 格式:文本
|
应用场景:机器翻译
规模:134万对英韩平行语料数据 格式:文本
|
应用场景:机器翻译
规模:100万对中俄平行语料数据,中文句长平均14.6个字符 格式:文本
|
应用场景:机器翻译
规模:108万对英俄平行语料数据 格式:文本
|
应用场景:机器翻译
规模:744万对中印地平行语料数据 格式:文本
|
应用场景:机器翻译
规模:531万对中德平行语料数据 格式:文本
|
应用场景:TTS
规模:6.78小时 格式:音频
|
应用场景:语音合成
规模:10.1小时 格式:音频
|
应用场景:语音合成
规模:19.46小时 格式:音频
|
应用场景:语音合成
规模:26.1小时 格式:音频
|
应用场景:语音合成
规模:150人 格式:音频
|