摘要
在这研究,被尝试了从他们的氨基酸序列预言克否定的细菌的蛋白质的主要功能。使用训练并且测试的数据集由670非冗余的克否定的细菌的蛋白质(255细胞的过程,60个信息分子,285新陈代谢,和70个毒力因素)组成。首先,我们开发了使用氨基酸和dipeptide作文的一个基于SVM的方法并且分别地完成了52.39%和47.01%的全面精确性。我们基于tetrapeptides,我们在识别了显著地在蛋白质的一个班上发现的唯一的tetrapeptides为蛋白质的分类介绍了一个新概念。这些tetrapeptides作为输入特征被使用预言蛋白质的功能并且完成了68.66%的全面精确性。我们也开发了tetrapeptide信息与氨基酸作文在被使用并且完成了70.75%的全面精确性的一个混合方法。五倍的生气确认被用来评估这些方法的表演。网服务器VICMpred为预言克否定的细菌的蛋白质(http://www.imtech.res.in/raghava/vicmpred/)的函数被开发了。
出版日期
2006年01月11日(中国期刊网平台首次上网日期,不代表论文的发表时间)