Select Language

AI社区

公开数据集

GOSU。AI Dota 2游戏聊天数据集

GOSU。AI Dota 2游戏聊天数据集

295M
805 浏览
1 喜欢
0 次下载
0 条讨论
Text Data,Video Games Classification

##数据集此数据集包含来自[Dota 2][1]的聊天信息-Valve视频游戏,最流行的电子竞技学科之一。该数据集用于训练[罗夫兰机器人][2]......

数据结构 ? 295M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    ##数据集此数据集包含来自[Dota 2][1]的聊天信息-Valve视频游戏,最流行的电子竞技学科之一。该数据集用于训练[罗夫兰机器人][2]。它包含了近100万场公开配对赛的聊天记录(当玩家被游戏服务器随机挑选出来时,技能水平大致相同)。#注意事项和免责声明**重要信息,请阅读。**此数据集对于工作而言完全不安全。在《Dota 2》中,玩家以一种非常特殊的方式相互交流。例如,您可能会发现许多缩写和特定于游戏的术语。对于Dota 2玩家来说,通常会将游戏中的失败归咎于队友和对手。不幸的是,许多信息可能包含粗鲁的侮辱、对其他玩家家人的侮辱、种族主义的表达和其他可怕的事情。我们按“原样”提供信息,没有任何过滤和审查,我们不对数据中的冒犯性内容负责。我们的目标是让研究人员有机会深入到真实的对话中来探索玩家社区。我们想提请大家注意大多数Dota 2玩家的显著毒性问题,我们认为玩家的这种行为是不健康的数据集1的使用。请参阅关于如何[学习Roplan机器人][4]以反映典型玩家的聊天行为的粗略解释。您可以在此数据集上应用自己的语言模型,并创建其他聊天机器人,或者只是比较学习性能。2、通过对电子竞技观众聊天的分析,查看[这篇arXiv论文][3]。您可以对游戏参与者的聊天进行类似的分析。[1]: https://en.wikipedia.org/wiki/Dota_2 [2]: https://roflan.gosu.ai [3]: https://arxiv.org/pdf/1801.02862.pdf [4]: https://www.reddit.com/r/DotA2/comments/7xs8q6/how_we_trained_dota_2_chat_simulator_why_he_is_so/


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:13 去赚积分?
    • 805浏览
    • 0下载
    • 1点赞
    • 收藏
    • 分享