NLP
  • Medium Articles 包含标记为AI、机器学习、数据科学或人工智能的帖子,以及用户信息

    1.8G

    438

    2

    NLP,Text Data,Literature

    Medium Articles 包含标记为AI、机器学习、数据科学或人工智能的帖子,以及用户信息
    Classification
    AiswaryaRamachandran
  • 科学流行评论删除

    74.17M

    320

    1

    Business,NLP,Text Data,Binary Classification,Bigquery

    科学流行评论删除
    Classification
    areeves87
  • Strongbad邮件

    0.11M

    340

    0

    Business,NLP,Text Data

    Strongbad邮件
    Classification
    Nolan Conaway
  • FakeNewsNet 假新闻研究数据收集,假新闻、虚假信息、数据挖掘

    72.61M

    1228

    210

    NLP,News,Social Science,Social Networks

    FakeNewsNet 假新闻研究数据收集,假新闻、虚假信息、数据挖掘
    Classification
    Deepak Mahudeswaran
  • 医学成绩单,从mtsamples获取的医学转录数据

    16.22M

    337

    0

    NLP,Health,Medicine

    医学成绩单,从mtsamples获取的医学转录数据
    Classification
    Tara Boyle
  • reddit自我发布分类任务,包含1000 多个精心挑选的类别

    839.37M

    386

    0

    NLP,Classification,Computer Science,Multiclass Classification

    reddit自我发布分类任务,包含1000 多个精心挑选的类别
    Classification
    Mike Swarbrick Jones
  • NLTK路透社新闻文件,NLTK路透社语料库中的所有文件

    3.3M

    818

    1

    NLP,Computer Science,News,Text Data,Text Mining

    NLTK路透社新闻文件,NLTK路透社语料库中的所有文件
    Classification
    Brad Boldenow
  • SComedy

    2.99M

    471

    0

    Earth and Nature,NLP,Text Data,Text Mining

    SComedy
    Classification
    Eduardo Reis
  • 印度政治新闻2018

    57.35M

    308

    0

    Politics,NLP,Text Data,Linguistics,India

    印度政治新闻2018
    Classification
    Xen.m.rph
  • 阿拉伯ULMFiT模型,基于Ar Wikipedia语料库的阿拉伯语模型

    160.13M

    769

    0

    NLP,Transfer Learning,Languages

    阿拉伯ULMFiT模型,基于Ar Wikipedia语料库的阿拉伯语模型
    Classification
    Abed Khooli
  • Kaggle工作

    0.27M

    326

    0

    Computer Science,Education,NLP,Recommender Systems,Search Engines

    Kaggle工作
    Classification
    AbdullahAli
  • 韩国极端主义网站Womad仇恨言论数据

    0.16M

    359

    3

    NLP,Classification

    韩国极端主义网站Womad仇恨言论数据
    Classification
    Yoo Beyoung Woo(???)
  • Allennlp包

    715.44M

    389

    0

    Computer Science,NLP

    Allennlp包
    Classification
    bilal2vec
  • 假新闻分类

    142.92M

    757

    0

    News,NLP

    假新闻分类
    Classification
    Bytedance WSDM Cup 2019
  • ConceptNet Numberbatch 向量,来自 ConceptNet 的词向量

    899.91M

    380

    0

    NLP

    ConceptNet Numberbatch 向量,来自 ConceptNet 的词向量
    Classification
    Nohman
  • 带注释的GMB语料库,GMB文本语料库的注释子集

    1.52M

    394

    0

    NLP,Exploratory Data Analysis,Classification,Random Forest

    带注释的GMB语料库,GMB文本语料库的注释子集
    Classification
    Shoumik
  • 《辛普森一家》的台词

    8.94M

    662

    0

    Arts and Entertainment,NLP,Text Data,Text Mining,Comics and Animation

    《辛普森一家》的台词
    Classification
    Pierre Megret
  • 维基百科的句子,英语维基百科转储中收集了780万个句子

    891.28M

    417

    0

    NLP,Text Mining

    维基百科的句子,英语维基百科转储中收集了780万个句子
    Classification
    Mike Ortman
  • Reddit 评论分数预测,使用 NLP 预测评论分数

    1.8G

    358

    0

    NLP,Computer Science,Social Science

    Reddit 评论分数预测,使用 NLP 预测评论分数
    Classification
    Evan Hallmark
  • 确定代词解析数据集

    143K

    408

    0

    NLP

    确定代词解析数据集
    Classification
    Ariba Siddiqui