KDC-4007 库尔德语新闻和文章的数据集
这个数据集最重要的特点是使用简单,并且有很好的记录,可以广泛用于有关库尔德索拉尼新闻和文章的各种文本分析研究。这些文件包...NLP Classification
853K
618
uci-edu
WikiLinks 一个大型跨文档指代消解英语语料数据
Wikilinks 是一个大型跨文档指代消解英语语料数据,从 Wikipedia 网站中的 300 万个实体中提取 4000 万的指代关系。从自由文本中...NLP,Languages Text
1.7G
779
马萨诸塞大学
Stanford Sentiment Treebank 英文语义词表数据
StanfordSentimentTreebank 是一个由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。...NLP Text
12.56M
990
Stanford University
人工智能语料库-欧洲议会议事平行语料库,包括21种欧洲语言
Europarl平行语料库摘自欧洲议会的议事程序。它包括21种欧洲语言的版本:罗马语(法语,意大利语,西班牙语,葡萄牙语,罗马尼亚...NLP Classification,Text
3.75G
1121
Philipp Koehn
Visual Genome 图像及图像内容语义信息的数据集
Visual Genome是一个数据集,一个知识库,一个将结构化图像概念连接到语言的持续努力。VisualGenome数据集是Stanford大学维护的...CNN 2D Box
14.94G
864
Stanford University
WMT 2011 News Crawl 机器翻译数据
WMT2011NewsCrawldata 是一个自然语言翻译数据,从 Europarlcorpus 语料中提取得到,包括:French-English、Spanish-English、Ge...NLP Text
25.01G
815
Europarl
Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本)
For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification
1.46G
817
University of Edinburgh
16.12M
474
Data Science
中国机器翻译研讨会,语料数据集
# DatasetThis dataset was created by Liling TanReleased under Other (specified in description)# ContentsIt contains the...Deep Learning,Computer Science Classification
6.6G
437
Warmth