公开数据集
数据结构 ? 17M
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
测属性:蛋白质定位位点。(非数字)。
下面的参考文献描述了该数据集的前身及其开发。它们还提供基于规则的专家系统使用该版本数据集进行分类的结果(非交叉验证)。
参考文献:“预测革兰氏阴性细菌蛋白质定位位点的专家系统”,Kenta Nakai&Minoru Kanehisa,《蛋白质:结构、功能和遗传学》11:95-1101991。
参考文献:“预测真核细胞蛋白质定位位点的知识库”,Kenta Nakai&Minoru Kanehisa,基因组学14:897-911,1992。
Attribute Information:
1.序列名称:SWISS-PROT数据库的登录号
2.mcg:McGeoch的信号序列识别方法。
3.gvh:von Heijne的信号序列识别方法。
4.alm:ALOM膜跨越区域预测程序的得分。
5.mit:线粒体和非线粒体蛋白质N端区(20个残基长)氨基酸含量的判别分析得分。
6.erl:存在“HDEL”亚串(被认为是内质网内腔滞留的信号)。二进制属性。
7.pox:C末端的过氧化物酶体靶向信号。
8.vac:液泡蛋白和细胞外蛋白氨基酸含量的判别分析得分。
9nuc:核蛋白和非核蛋白的核定位信号判别分析得分。
Relevant Papers:
Paul Horton & Kenta Nakai, "A Probablistic Classification System for Predicting the Cellular Localization Sites of Proteins", Intelligent Systems in Molecular Biology, 109-115. St. Louis, USA 1996.
[Web link]
The references below describe a predecessor to this dataset and its development. They also give results (not cross-validated) for classification by a rule-based expert system with that version of the dataset:
Kenta Nakai & Minoru Kanehisa, "Expert Sytem for Predicting Protein Localization Sites in Gram-Negative Bacteria", PROTEINS: Structure, Function, and Genetics 11:95-110, 1991.
Kenta Nakai & Minoru Kanehisa, "A Knowledge base for Predicting Protein Localization Sites in Eukaryotic Cells", Genomics 14:897-911, 1992.
[Web link]
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。