语料库
  • 新闻分类数据集sample(thu)

    12M

    1140

    0

    NLP

    新闻分类数据集sample(thu)
    Text
    飞桨PaddleHub
  • 百科类问答json版,含有150万个预先过滤过的、高质量问题和答案

    1.5G

    1477

    5

    NLP

    百科类问答json版,含有150万个预先过滤过的、高质量问题和答案
    Text
    Thomas-yanxin
  • 文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的

    1.21M

    1103

    4

    NLP

    文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的
    Classification
    University of California, Irvine
  • 僧伽罗语数字词汇(2.0版),字母A到M

    9.88M

    883

    1

    NLP

    僧伽罗语数字词汇(2.0版),字母A到M
    Classification
    Bianchini, Francesco,Gazzard, Katherine
  • 僧伽罗语数字词汇(1.0版),字母A到M 数据集

    9.83M

    827

    1

    NLP

    僧伽罗语数字词汇(1.0版),字母A到M 数据集
    Classification
    Bianchini, Francesco,Gazzard, Katherine
  • 人民日报词性标注语料数据(199801)

    2.81M

    1254

    15

    NLP

    人民日报词性标注语料数据(199801)
    Text
    人民日报
  • Twitter情感分析训练语料库

    53.8M

    1010

    12

    MNIST

    Twitter情感分析训练语料库
    Classification
    robot
  • 20万英语笑话文本数据集

    24.57M

    1039

    0

    OCR/Text Detection

    20万英语笑话文本数据集
    Classification
    robot
  • 人民日报词性标注语料数据(199801)

    3.37M

    1209

    8

    OCR/Text Detection

    人民日报词性标注语料数据(199801)
    Classification
    robot
  • Nettalk语料库数据集 包括20008个带重音的对齐字母和语音表示法

    175K

    989

    1

    N/A

    Nettalk语料库数据集 包括20008个带重音的对齐字母和语音表示法
    N/A
    University of California, Irvine
  • 语法面部表情数据集,A-Z语法面部表情的名称和规格(目标或数据点)

    19.2M

    814

    1

    NLP

    语法面部表情数据集,A-Z语法面部表情的名称和规格(目标或数据点)
    Classification
    University of California, Irvine
  • 斯坦福大学的GloVe预训练的单词向量

    989.9M

    551

    0

    Computer Science,Sports,Retail and Shopping

    斯坦福大学的GloVe预训练的单词向量
    Classification
    Mohamed Atef Khalaf
  • 中国字符 20950,utf-8中的所有汉字及其发音数据集

    1.2M

    499

    1

    NLP,Comics and Animation

    中国字符 20950,utf-8中的所有汉字及其发音数据集
    Classification
    -T.K.-
  • 情绪相关文本数据集

    11.3M

    480

    3

    Movies and TV Shows

    情绪相关文本数据集
    Classification
    Abhishek Poojary
  • 中国机器翻译研讨会,语料数据集

    6.6G

    600

    0

    Deep Learning,Computer Science

    中国机器翻译研讨会,语料数据集
    Classification
    Warmth
  • DBpedia语义网应用范例,提供42782篇维基百科文章提供了分类、分层类别

    443.28M

    561

    0

    Education,Text Data,Multiclass Classification,Text Mining

    DBpedia语义网应用范例,提供42782篇维基百科文章提供了分类、分层类别
    Classification
    Dan Ofer
  • Mac Morpho,带有词性标签的巴西葡萄牙语新闻文本

    10.43M

    1007

    1

    Earth and Nature

    Mac Morpho,带有词性标签的巴西葡萄牙语新闻文本
    Classification
    NLTK Data
  • 斯坦福自然语言推理 (SNLI) 语料库的 Jsonl 格式

    483.45M

    642

    0

    Languages

    斯坦福自然语言推理 (SNLI) 语料库的 Jsonl 格式
    Classification
    John S. Hudzina
  • Google News vectors negative

    3.64G

    530

    0

    Clothing and Accessories

    Google News vectors negative
    Classification
    ymtoo