Research Article

基于深林的蛋白质亚细胞定位预测

卷 18, 期 5, 2018

页: [268 - 274] 页: 7

弟呕挨: 10.2174/1566523218666180913110949

价格: $65

摘要

动机:了解正确的蛋白质亚细胞定位对于了解蛋白质的功能和揭示蛋白质亚细胞错误定位引起的许多人类疾病的机制是必要的,这是在进行基因治疗疾病之前所必需的。此外,众所周知,基因治疗是一种有效的方法,通过将基因治疗产品定位于特定的亚细胞室来克服疾病。蛋白质功能预测的深层神经网络由于其在非线性分类能力方面的强大优势,使得现有基因组数据的大量增加而日益受到人们的青睐。然而,它们仍然存在着一些缺点,如超量参数过多和有足够数量的标记数据。结果:提出了一种基于序列信息的深层森林蛋白质定位算法.预测模型使用具有多层结构的随机森林网络来识别蛋白质的亚细胞区域。该模型是在最新的uniprot发布的蛋白质数据集上进行训练和测试的,我们证明,我们的深森林预测蛋白质的亚细胞位置仅给出了高精度的蛋白质序列,超过了目前最先进的算法。同时,与深层神经网络不同的是,它的参数数目要少得多,训练起来也容易得多。

关键词: 蛋白质亚细胞定位,机器学习,深林,序列信息,UniProt,算法的。


Rights & Permissions Print Cite
© 2024 Bentham Science Publishers | Privacy Policy