摘要
背景:大量的实验研究表明,长的非编码RNA(LncRNA)在各种复杂的人类疾病的发生和发展过程中起着至关重要的作用。但是,目前只有一小部分LncRNA与疾病的关联已通过实验验证。基于计算模型自动预测LncRNA与疾病的关联可以节省湿实验室实验的巨额成本。 方法和结果:为了建立有效的计算模型以整合各种异质生物学数据以鉴定潜在疾病-LncRNA,我们提出了基于布尔矩阵的LncRNA-疾病关联预测模型(HEBLDA)的层次扩展。 HEBLDA根据来自各种关系源的布尔矩阵的属性发现内在的层次相关性。然后,HEBLDA通过融合权重将这些层次关联的矩阵进行集成。最后,HEBLDA使用分层关联矩阵通过分层扩展来重建LncRNA-疾病关联矩阵。没有已知的关联数据,HEBLDA能够治疗潜在的疾病或LncRNA。在5倍交叉验证实验中,HEBLDA在接收器工作特性曲线(AUC)下获得了0.8913的面积,从而改进了以前的经典方法。此外,案例研究表明,HEBLDA可以准确预测几种LncRNA的候选疾病。 结论:基于其发现各种数据源更丰富的关联结构的能力,我们可以预期HEBLDA是一种潜在的方法,可以在广阔的领域获得更全面的关联预测。
关键词: LncRNA,疾病,关联预测,布尔矩阵,分层扩展,关联矩阵。
[http://dx.doi.org/10.1038/nature08975] [PMID: 20393566]
[http://dx.doi.org/10.1038/onc.2017.184] [PMID: 28604750]
[http://dx.doi.org/10.1111/febs.12737] [PMID: 24495014]
[http://dx.doi.org/10.1093/nar/gkr1175] [PMID: 22135294]
[http://dx.doi.org/10.1093/nar/gks915] [PMID: 23042674]
[http://dx.doi.org/10.1038/onc.2011.621] [PMID: 22266873]
[PMID: 27573194]
[PMID: 27345524]
[http://dx.doi.org/10.1093/bioinformatics/btt426] [PMID: 24002109]
[http://dx.doi.org/10.1039/C3MB70608G] [PMID: 24850297]
[http://dx.doi.org/10.1109/TCBB.2018.2827373] [PMID: 29993639]
[http://dx.doi.org/10.1039/C4MB00511B] [PMID: 25502053]
[http://dx.doi.org/10.1093/bioinformatics/bty327] [PMID: 29718113]
[http://dx.doi.org/10.1039/C4MB00478G] [PMID: 25354589]
[http://dx.doi.org/10.18632/oncotarget.11141] [PMID: 27517318]
[http://dx.doi.org/10.1038/srep16840] [PMID: 26577439]
[PMID: 28172495]
[http://dx.doi.org/10.1093/bioinformatics/btx794] [PMID: 29228285]
[http://dx.doi.org/10.1109/DSAA.2015.7344813]
[http://dx.doi.org/10.1145/3132847.3133054]
[PMID: 23175614]
[http://dx.doi.org/10.1093/nar/gkt1248] [PMID: 24297251]
[http://dx.doi.org/10.1093/nar/gku1173] [PMID: 25399422]
[http://dx.doi.org/10.1093/nar/gkv1094] [PMID: 26481356]
[http://dx.doi.org/10.1089/cmb.2012.0273] [PMID: 23509857]
[PMID: 28338194]
[http://dx.doi.org/10.3233/CBM-160376] [PMID: 28269753]
[http://dx.doi.org/10.1159/000443038] [PMID: 26906068]