公开数据集
数据结构 ? 45M
README.md
这些数据来自[ Booking.com ][1]。文件中的所有数据已经对所有人公开。数据最初由[ Booking.com ][2]拥有。如果你想在其他地方使用这个数据集,请通过我的[个人资料][3]与我联系。数据背景这个数据集包含了515,000个客户评论和对欧洲1493家豪华酒店的评分。同时,还提供了酒店的地理位置,以供进一步分析。数据内容 csv 文件包含17个字段。每个字段的描述如下:-Hotel _ Address: Hotel 的地址。Review _ Date: 评论者发表相应评论的日期。- Average _ Score: 酒店的平均分,根据去年的最新评论计算。- 酒店名称: 酒店名称-评论者-国籍: 评论者国籍-否定评论: 评论者给酒店的否定评论。如果评论者没有给出负面评价,那么应该是: “没有负面评价”——评论总词数: 负面评价中的总词数。积极评价: 评价者给酒店的积极评价。如果评论者没有给出负面评价,那么应该是: “无正面评价”——评论总数 _ 正面 _ 单词计数: 正面评价中的单词总数。- Reviewer _ Score: 评论者根据他/她的经验给酒店打分-Total _ Number _ of _ Reviews _ Reviewer _ Have _ Give: 评论者过去给出的评论数量。- Total _ Number _ of _ Reviews: 酒店拥有的有效评论总数。- 标签: 标签评论家给酒店。- days _ since _ review: 审查日期和刮除日期之间的持续时间。- 附加 _ Number _ of _ Score: 也有一些客人只是对服务进行了评分,而不是评论。这个数字表明有多少有效的分数没有审查在那里。- lat: 酒店的纬度-lng: 酒店的经度 * 为了保持文本数据的清晰,我删除了文本 d 中的 Unicode 和标点符号
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。