Select Language

AI社区

公开数据集

大型电影评论数据集  一个用于二元情感分类的数据集

大型电影评论数据集 一个用于二元情感分类的数据集

80.2M
833 浏览
0 喜欢
2 次下载
0 条讨论
Music Analysis,Game Classification

这是一个用于二元情感分类的数据集,包含比以前的基准数据集更多的数据。我们提供了一组 25,000 条极地电影评论用于训练,以及 2......

数据结构 ? 80.2M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    这是一个用于二元情感分类的数据集,包含比以前的基准数据集更多的数据。我们提供了一组 25,000 条极地电影评论用于训练,以及 25,000 条用于测试。还有其他未标记的数据可供使用。提供原始文本和已处理的词袋格式。

    核心数据集包含50,000个评论,均匀分为25k训练集和25k测试集。标签的整体分布是平衡的(25k pos和25k neg)。我们还包括另外50,000个未标记文档,用于无监督学习。在整个系列中,任何给定的电影都不允许超过30条评论,因为对同一部电影的评论往往具有相关评级。此外,训练集和测试集包含一组不相交的电影,因此通过记忆电影唯一的术语及其与观察到的标签相关联,不会获得显着的性能。在标记的训练/测试集中,负面评论的评分

    数据引用

      author    = {Maas, Andrew L.  and  Daly, Raymond E.  and  Pham, Peter T.  and  Huang, Dan  and  Ng, Andrew Y.  and  Potts, Christopher},
      title     = {Learning Word Vectors for Sentiment Analysis},
      booktitle = {Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies},
      month     = {June},
      year      = {2011},
      address   = {Portland, Oregon, USA},
      publisher = {Association for Computational Linguistics},
      pages     = {142--150},
      url       = {http://www.aclweb.org/anthology/P11-1015}
    }
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:6 去赚积分?
    • 833浏览
    • 2下载
    • 0点赞
    • 收藏
    • 分享