公开数据集
数据结构 ? 7.35G
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
Data Set Information:
在高能物理实验中,机器学习被用来寻找奇异粒子的特征。这些特征是通过蒙特卡罗模拟产生这些粒子的碰撞以及由此产生的衰变产物而获得的。在这里的三个数据集中,每个数据集的目标都是将产生粒子的碰撞与背景源分离。
新粒子的质量未知,因此提供了三个独立的数据集。在每个数据集中,50%的数据来自信号处理,而50%来自背景处理。数据分为700万个示例的训练集和350万个示例的测试集。
1) 在“1000”数据集中,信号粒子的质量为1000。(注意:此数据集不包括质量特征,因为所有信号示例都具有相同的质量。)
2) 在“not1000”数据集中,信号粒子的质量从集合{50075012501500}中均匀绘制。质量作为输入特征包括在内;对于背景示例,质量是从同一集中随机选择的。
3) 在“all”数据集中,信号粒子的质量从集合{500、750、1000、1250、1500}中均匀绘制。质量作为输入特征包括在内;对于背景示例,质量是从同一集中随机选择的。
Attribute Information:
The first column is the class label (1 for signal, 0 for background), followed by the 27 normalized features (22 low-level features then 5 high-level features), and a 28th mass feature for datasets 2 and 3. See the original paper for more detailed information.
There is a header line in each file.
Relevant Papers:
Pierre Baldi, Kyle Cranmer, Taylor Faucett, Peter Sadowski, and Daniel Whiteson. 'Parameterized Machine Learning for High-Energy Physics.' In submission.
Citation Request:
If you have no special citation requests, please leave this field blank.
Daniel Whiteson daniel '@' uci.edu, Assistant Professor, Physics & Astronomy, Univ. of California Irvine
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。