摘要
病人。随着测序技术的发展,从表达数据中鉴定出了大量的差异表达基因。然而,机器学习的方法只能识别局部最优解作为签名。 目的:通过遗传获得的突变信息能更好地反映基因与疾病之间的关系。因此,我们需要整合突变信息来更准确地识别签名。 为此,我们整合Genome-Wide Association Study (GWAS)数据和表达数据,并结合表达定量性状位点(expression Quantitative Trait Loci, eQTL)技术,得到T2DM预测特征(t2dmsg -10)。首先,我们利用GWAS数据得到T2DM易感基因座列表。然后,利用eQTL技术获取风险单核苷酸多态性(SNPs),并结合胰腺β-细胞基因表达数据获得10个蛋白编码基因。接下来,我们将这些基因以相同的重量组合在一起。 结果:采用受试者工作特征(Receiver Operating Characteristic, ROC)、单基因去除与增加法、基因本体论功能富集法和蛋白-蛋白相互作用网络验证结果显示,t2dmsg -10对T2DM具有良好的预测效果(AUC=0.99),且具有较高的鲁棒性。 结论:总之,我们获得了T2DM的预测特征,并进一步进行了验证。
关键词: 2型糖尿病,全基因组关联研究,表达定量性状位点,预测特征,AUC=0.99, ROC。
图形摘要
[http://dx.doi.org/10.2174/1570161117666190502103733] [PMID: 31057114]
[http://dx.doi.org/10.1093/nar/gkz843] [PMID: 31584099]
[http://dx.doi.org/10.1016/S2213-8587(20)30272-2] [PMID: 32798472]
[http://dx.doi.org/10.3389/fgene.2019.00094] [PMID: 30891058]
[http://dx.doi.org/10.1038/s41591-018-0231-3] [PMID: 30297896]
[http://dx.doi.org/10.3389/fgene.2018.00515] [PMID: 30459809]
[http://dx.doi.org/10.1038/nature15393] [PMID: 26432245]
[http://dx.doi.org/10.1038/nature06258] [PMID: 17943122]
[http://dx.doi.org/10.3892/mmr.2019.10522] [PMID: 31524257]
[http://dx.doi.org/10.2174/1566523218666181010101114] [PMID: 30306867]
[PMID: 26134276]
[http://dx.doi.org/10.1016/j.omtn.2019.09.019] [PMID: 31678735]
[http://dx.doi.org/10.2174/156652321904191022113307] [PMID: 31762421]
[http://dx.doi.org/10.1109/TCBB.2017.2776280] [PMID: 29990255]
[http://dx.doi.org/10.1093/database/baaa050] [PMID: 32588040]
[http://dx.doi.org/10.1038/ng.2383] [PMID: 22885922]
[http://dx.doi.org/10.1186/1471-2164-16-S8-S4] [PMID: 26110739]
[http://dx.doi.org/10.1093/nar/29.1.308] [PMID: 11125122]
[http://dx.doi.org/10.3389/fbioe.2020.00254] [PMID: 32292778]
[http://dx.doi.org/10.1093/bib/bbaa017] [PMID: 32065211]
[http://dx.doi.org/10.1038/s41574-020-0325-0] [PMID: 32099086]
[http://dx.doi.org/10.1093/nar/gkv007] [PMID: 25605792]
[http://dx.doi.org/10.1055/s-0042-109607] [PMID: 29933462]
[http://dx.doi.org/10.18632/aging.101375] [PMID: 29410390]
[http://dx.doi.org/10.1186/1471-2105-12-77] [PMID: 21414208]
[http://dx.doi.org/10.1002/dmrr.2894] [PMID: 28303682]
[http://dx.doi.org/10.1111/1753-0407.12778] [PMID: 29726111]
[http://dx.doi.org/10.1093/nar/gkn923]
[http://dx.doi.org/10.1093/nar/gky1131] [PMID: 30476243]
[http://dx.doi.org/10.1038/s41467-018-04918-x] [PMID: 29992946]
[PMID: 31324086]
[http://dx.doi.org/10.1038/s41588-019-0513-9] [PMID: 31676859]
[http://dx.doi.org/10.1590/1806-9282.64.07.586]
[http://dx.doi.org/10.1016/j.isci.2020.100991]
[http://dx.doi.org/10.1089/cmb.2018.0004] [PMID: 30113871]
[http://dx.doi.org/10.1093/bioinformatics/btz254] [PMID: 30977780]
[http://dx.doi.org/10.1093/bib/bbaa036] [PMID: 32249297]