相关搜索
您是不是在找?
今日排行
本周排行
本月排行
KDC-4007 库尔德语新闻和文章的数据集
这个数据集最重要的特点是使用简单,并且有很好的记录,可以广泛用于有关库尔德索拉尼新闻和文章的各种文本分析研究。这些文件包...NLP Classification
853K
621
uci-edu
WikiLinks 一个大型跨文档指代消解英语语料数据
Wikilinks 是一个大型跨文档指代消解英语语料数据,从 Wikipedia 网站中的 300 万个实体中提取 4000 万的指代关系。从自由文本中...NLP,Languages Text
1.7G
780
马萨诸塞大学
Stanford Sentiment Treebank 英文语义词表数据
StanfordSentimentTreebank 是一个由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。...NLP Text
12.56M
991
Stanford University
人工智能语料库-欧洲议会议事平行语料库,包括21种欧洲语言
Europarl平行语料库摘自欧洲议会的议事程序。它包括21种欧洲语言的版本:罗马语(法语,意大利语,西班牙语,葡萄牙语,罗马尼亚...NLP Classification,Text
3.75G
1123
Philipp Koehn
Visual Genome 图像及图像内容语义信息的数据集
Visual Genome是一个数据集,一个知识库,一个将结构化图像概念连接到语言的持续努力。VisualGenome数据集是Stanford大学维护的...CNN 2D Box
14.94G
866
Stanford University
WMT 2011 News Crawl 机器翻译数据
WMT2011NewsCrawldata 是一个自然语言翻译数据,从 Europarlcorpus 语料中提取得到,包括:French-English、Spanish-English、Ge...NLP Text
25.01G
816
Europarl
斯瓦希里语翻译语音转录和主题(包含 10 个半小时语音数据集)
该项任务的输入数据是来自红十字会的灾难与威胁相关信息,其中包括疾病、人身伤害和自然灾害等主题。每个类别都提供了相关信息,...Video Data Audio
42.8G
649
appen
Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本)
For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification
1.46G
819
University of Edinburgh
16.12M
475
Data Science
中国机器翻译研讨会,语料数据集
# DatasetThis dataset was created by Liling TanReleased under Other (specified in description)# ContentsIt contains the...Deep Learning,Computer Science Classification
6.6G
437
Warmth
Hearthstone Hearthstone卡名称和描述的翻译数据
Translation of Hearthstone card names and descriptions.Languages: German, English, Spanish, French, Italian, Japanese, K...NLP,Arts and Entertainment,Video Games,Games,Comics and Animation,Card Games Classification
54.7M
488
Liling Tan