公开数据集
数据结构 ? 4.1M
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
对于 wisesight-160 和 wisesight-1000,它们是从这个语料库中以标记化形式的样本,
有关数据探索和分类示例,请参阅泰语文本分类基准。
个人资料
- 我们试图从该数据集中排除任何已知的个人身份信息。
- 删除用户名和非公众人物名称- 电话号码被屏蔽(例如 088-888-8888、09-9999-9999、0-2222-2222)
- 如果您看到任何个人数据仍然保留在集合中,请告诉我们
- 我们可以删除它们。
情感值注释方法
- 情感值是由人类注释者分配的。
- 人类注释者尽最大努力为一条信息分配三个标签中的一个。
- 一条信息可能是含糊不清的。在可能的情况下,判断将完全基于文本本身。
- 在某些情况下,比如上下文缺失时,注释者可能不得不依靠他/她自己的世界知识,只是猜测。
- 在某些情况下,人类注释者可能有机会接触到信息的上下文,比如一张图片。这些额外的信息并不包括在这个语料库中。
- 同意、享受和满意是积极的。不同意、悲伤和失望是负面的。
- 对某一主题或某一产品表现出的兴趣被算作是积极的。
- 在这个意义上,如果一个关于特定产品的问题显示了对该产品的兴趣,那么它就会有一个积极的情感值。- 说其他产品或服务更好则被认为是负面的。
- 一般的信息或新闻标题往往被算作是中性的。
属性信息。
一条信息只能有一个标签。问题、消极、中立、积极所有信息都保存在明文文件中。
所有文件都是UTF-8编码的。
每行有一条信息。原始信息中的换行符将被替换成空格。
每个文件有一个标签。
q.txt 问题 (575条信息)
neg.txt 负面情绪的信息(6,823条)
neu.txt 带有中性情绪的信息(14,561)
pos.txt 有正面情绪的信息(4,778)
Citation Request:
Arthit Suriyawongkul, Ekapol Chuangsuwanich,
Pattarawat Chormai, and Charin Polpanumas. 2019.
PyThaiNLP/wisesight-sentiment: First release. September.
BibTeX:
@software{bact_2019_3457447,
author = {Suriyawongkul, Arthit and
Chuangsuwanich, Ekapol and
Chormai, Pattarawat and
Polpanumas, Charin},
title = {PyThaiNLP/wisesight-sentiment: First release},
month = sep,
year = 2019,
publisher = {Zenodo},
version = {v1.0},
doi = {10.5281/zenodo.3457447},
url = {[Web link]}
}
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。