NLP
  • SMS垃圾邮件收集数据集,标记为垃圾邮件或合法短信的集合

    503K

    1376

    16

    MNIST

    SMS垃圾邮件收集数据集,标记为垃圾邮件或合法短信的集合
    Classification
    robot
  • TED平行语料库

    872.9M

    1138

    1

    MNIST

    TED平行语料库
    Classification
    robot
  • Euler图学习开源数据集

    243.41M

    610

    0

    MNIST

    Euler图学习开源数据集
    Classification
    robot
  • 腾讯AI Lab开源大规模高质量中文词向量数据

    39.4G

    826

    8

    NLP,MNIST

    腾讯AI Lab开源大规模高质量中文词向量数据
    Classification
    robot
  • KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)

    853K

    740

    2

    Computer

    KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)
    Classification
    University of California, Irvine
  • 26个大写字母识别数据集

    366K

    1066

    2

    NLP

    26个大写字母识别数据集
    Classification
    University of California, Irvine
  • 荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集

    4.93M

    1329

    2

    Computer

    荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集
    Classification
    University of California, Irvine
  • NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析

    17.5M

    730

    5

    NLP,Social

    NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析
    Clustering
    University of California, Irvine
  • 54个不同的文档分类数据集

    103K

    784

    3

    Computer

    54个不同的文档分类数据集
    Classification
    University of California, Irvine
  • 手写数字数据集的笔式识别

    1.58M

    904

    4

    NLP

    手写数字数据集的笔式识别
    Classification
    University of California, Irvine
  • 路透社21578文本分类收集数据集

    7.8M

    3093

    40

    Agriculture

    路透社21578文本分类收集数据集
    Classification
    University of California, Irvine
  • 句子分类数据集

    2.9M

    931

    0

    N/A

    句子分类数据集
    Classification
    University of California, Irvine
  • TTC-3600:土耳其文本分类数据集的基准数据集

    2.5M

    1079

    0

    Computer

    TTC-3600:土耳其文本分类数据集的基准数据集
    Classification
    University of California, Irvine
  • curationCorpus 策展语料库

    123.13M

    536

    10

    NLP

    curationCorpus 策展语料库
    Text
    Henry Dashwood
  • 电子邮件垃圾邮件

    12.08M

    342

    1

    NLP,Classification,Software,Email and Messaging

    电子邮件垃圾邮件
    Classification
    Wessel van Lit
  • ACL论文选集,论文数据来自ACL选集

    1.14M

    325

    0

    NLP,Education,Literature

    ACL论文选集,论文数据来自ACL选集
    Classification
    Takahiro Kubo
  • 普莱诺斯总督  埃里总统2018年

    16.5M

    648

    0

    NLP,Brazil

    普莱诺斯总督 埃里总统2018年
    Classification
    Luiz Amaral
  • 数以千计的关于爱情的问题,该数据集包含来自QA服务的爱情类问题和答案

    176.23M

    314

    1

    NLP,Education,Text Data,Languages

    数以千计的关于爱情的问题,该数据集包含来自QA服务的爱情类问题和答案
    Classification
    Boris Zubarev
  • 圣诞节的食谱

    2.51M

    691

    0

    Religion and Belief Systems,NLP,Cooking and Recipes,Holidays and Cultural Events

    圣诞节的食谱
    Classification
    Gary Broughton
  • 实体提取从Pitchfork评论

    14.49M

    775

    0

    Business,Arts and Entertainment,Music,Retail and Shopping,NLP,Popular Culture

    实体提取从Pitchfork评论
    Classification
    Justin K