摘要
药物发现以及(纳米)材料设计项目要求对具有相应性质/活性的化合物的大型数据集进行计算机分析,并需要对更多结构进行检索和虚拟筛选,以识别出新的有效药物。这是一个苛刻的过程,必须将各种工具与不同的输入和输出格式结合使用。为了自动化所需的数据分析,我们开发了必要的工具来促进各种重要任务来构建工作流,这些工作流将简化化学信息学数据的处理,处理和建模,并提供可重复且易于维护的省时,低成本的解决方案。因此,我们开发并展示了一个包含25个以上处理模块的工具箱,即Enalos +节点,该工具箱可在KNIME平台内为对化学和生物学数据的纳米信息学和化学信息学分析感兴趣的用户提供非常有用的操作。通过用户友好的界面,Enalos +节点提供了广泛的重要功能,包括数据挖掘以及从大型可用数据库中检索以及用于健壮和预测性模型开发和验证的工具。 Enalos +节点可通过KNIME作为附件使用,并提供了宝贵的工具,可用于提取有用的信息以及在化学或纳米信息学框架中分析实验和虚拟筛选结果。最重要的是,为了:(i)通过Enalos + KNIME节点进行大数据分析,(ii)加速在Enalos + KNIME节点内执行的耗时计算,以及(iii)提出集成在Enalos +工具箱中的新的具有时间和成本效益的节点,我们已经研究并验证了Enalos +节点中GPU计算的优势。演示数据集,教程和教学视频使用户可以轻松理解可用于计算机数据分析的节点功能。
关键词: Enalos + KNIME节点,化学信息学辅助的材料设计,纳米信息学,Enalos Suite,化学数据库,KINME,高效数据挖掘,PubChem。
[http://dx.doi.org/10.1145/1656274.1656280]
[http://dx.doi.org/10.1093/nar/gkv951 ] [PMID: 26400175]
[http://dx.doi.org/10.1016/j.chemolab.2013.02.003]
[http://dx.doi.org/10.1186/1758-2946-5-3 ] [PMID: 23317286]
[http://dx.doi.org/10.1021/ci025584y ] [PMID: 12653513]
[http://dx.doi.org/10.1021/acs.jcim.6b00686 ] [PMID: 28125221]
[http://dx.doi.org/10.1186/1758-2946-4-7 ] [PMID: 22424447]
[http://dx.doi.org/10.2174/1568026615666150506144536 ] [PMID: 26002591]
[http://dx.doi.org/10.1021/ci800038f ] [PMID: 18564836]
[http://dx.doi.org/10.1186/s13321-017-0220-4] [PMID: 29086040]
[http://dx.doi.org/10.1186/s13321-014-0043-5] [PMID: 25221628]
[http://dx.doi.org/10.1002/minf.201000061 ] [PMID: 27463326]
[http://dx.doi.org/10.1080/00401706.1969.10490666]
[http://dx.doi.org/10.1002/qsar.19960150402]
[http://dx.doi.org/10.1002/qsar.200730083]
[http://dx.doi.org/10.1080/17435390.2018.1504998 ] [PMID: 30182778]
[http://dx.doi.org/10.1002/smll.201906588 ] [PMID: 32174008]
[http://dx.doi.org/10.2174/138620732301200316112000 ] [PMID: 32189589]
[http://dx.doi.org/10.1007/978-1-0716-0150-1_3]
[http://dx.doi.org/10.1007/978-1-4939-7899-1_14 ] [PMID: 29934899]
[http://dx.doi.org/10.1016/j.csbj.2020.02.023 ] [PMID: 32226594]