Select Language

AI社区

数据集网站导航

上海外国语大学语料库

SISU+Aligner+2.0.0由上海外国语大学语料库研究院胡开宝教授领衔的团队研发,可用于双语或多语文本的平行对齐,实现“一对一”、“一对二”或“一对多”平行文本
436 浏览
0 喜欢
0 不喜欢

搜文解字

包含「搜词寻字」、「文学之美」、「游戏解惑」、「古文字的世界」四个单元,可由部件、部首、字、音、词互查,并可查询在四书、老、庄、唐诗中的出处,及直接连
415 浏览
0 喜欢
0 不喜欢

中文语言资源联盟

(Chinese+Linguistic+Data+Consortium,简称ChineseLDC)的建立。ChineseLDC是吸收国内高等院校,科研机构和公司参加的开放式语言资源联盟。其目的是建成能
433 浏览
0 喜欢
0 不喜欢

语言资讯科学中心

自1995年开始,以「共时」方式处理了超常的大量汉语语料,通过精密的技术,累积众多精确的统计数据,建立了LIVAC+(Linguistic+Variation+in+Chinese+Speech+Co
382 浏览
0 喜欢
0 不喜欢

在线分词标注系统

主要功能包括中文分词;英文分词;词性标注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。NLPIR系统支持多种编码、多种操作系统、多种开
279 浏览
0 喜欢
0 不喜欢

清华TH语料库

清华TH语料库于1994年6月建成,其总库根据对语料加工深度的不同采用分级管理的原则,分成了生语料和熟语料两大类,其中0级生语料分库涵盖了一般书、报纸、论文、
511 浏览
0 喜欢
0 不喜欢

清华大学中英平行语料库

由清华大学自然语言处理与社会人文计算实验室在国家“863+计划”+项目“+互联网语言翻译系统研制”+的支持下,利用自身研发的互联网平行网页获取软件和双语句子
509 浏览
0 喜欢
0 不喜欢

人民日报标注语料库

该语料库是我国第一个大型的现代汉语标注语料库,以《人民日报》1998年的纯文本语料为基础,完成词语切分、词性标注、专有名词标注、语素子类标注、动词和形容词
440 浏览
0 喜欢
0 不喜欢

北京大学CCL语料库

包含现代汉语语料、古代汉语语料两类单语语料,涉及的文献时间从公元前11
442 浏览
0 喜欢
0 不喜欢

BCC汉语语料库

BCC汉语语料库,总字数约+95+亿字,包括:报刊(20+亿)、文学(30+亿)、综合(19+亿)、古汉语(20+亿)和对话(6+亿,来自微博和影视字幕)等多领域语料,是
426 浏览
0 喜欢
0 不喜欢