1.Application of Artificial Intelligence in COVID-19 drug repurposing. Diabetes & metabolic syndrome. 2020.7: DOI:10.1016/j.dsx.2020.06.068
2. Rethinking drug design in the artificial intelligence era. NATURE REVIEWS DRUG DISCOVERY. 2020.6: DOI: 10.1038/s41573-019-0050-3
3. Artificial intelligence in chemistry and drug design.JOURNAL OF COMPUTER-AIDED MOLECULAR DESIGN. 2020.7
4. The power of deep learning to ligand-based novel drug discovery. EXPERT OPINION ON DRUG DISCOVERY. 2020.5 : DOI: 10.1080/17460441.2020.1745183
5. AI-aided design of novel targeted covalent inhibitors against SARS-CoV-2. bioRxiv : the preprint server for biology: DOI:10.1101/2020.03.03.972133
6.6 Deep Learning in Drug Discovery. MOLECULAR INFORMATICS.2016.1: DOI: 10.1002/minf.201501008
7. The rise of deep learning in drug discovery. DRUG DISCOVERY TODAY. 2018.6: DOI: 10.1016/j.drudis.2018.01.039
8. Deep Docking: A Deep Learning Platform for Augmentation of Structure Based Drug Discovery. ACS CENTRAL SCIENCE. 2020.6:
9. Deep Learning Based Drug Screening for Novel Coronavirus 2019-nCov. INTERDISCIPLINARY SCIENCES-COMPUTATIONAL LIFE SCIENCES. 2020.6
10. Graph convolutional networks for computational drug development and discovery. BRIEFINGS IN BIOINFORMATICS.
11. Machine learning in chemoinformatics and drug discovery. DRUG DISCOVERY TODAY. 2018.8:
12. Exploiting machine learning for end-to-end drug discovery and development. NATURE MATERIALS. 2019.5: DOI: 10.1038/s41563-019-0338-z
13. Applications of machine learning in drug discovery and development. NATURE REVIEWS DRUG DISCOVERY. 2019.6: DOI: 10.1038/s41573-019-0024-5
14. Deep learning in drug discovery: opportunities, challenges and future prospects. DRUG DISCOVERY TODAY. 2019.10: DOI: 10.1016/j.drudis.2019.07.006
15. SyntaLinker: automatic fragment linking with deep conditional transformer neural networks. Chemical Science. 2020.7.
16. Structure-Based Virtual Screening: From Classical to Artificial Intelligence. 2020.4
17. Machine learning models for drug-target interactions: current knowledge and future directions . DRUG DISCOVERY TODAY . 2020.4
18. Old drug repositioning and new drug discovery through similarity learning from drug-target joint feature spaces. BMC BIOINFORMATICS.2020
19. Comparison of Target Features for Predicting Drug-Target Interactions by Deep Neural Network Based on Large-Scale Drug-Induced Transcriptome Data.PHARMACEUTICS.2019.8
20. Exploiting machine learning for end-to-end drug discovery and development. NATURE MATERIALS. 2019.5
21. Deep Learning Based Drug Screening for Novel Coronavirus 2019-nCov. INTERDISCIPLINARY SCIENCES-COMPUTATIONAL LIFE SCIENCES. 2020.6
22. DeepScreening: a deep learning-based screening web server for accelerating drug discovery. DATABASE-THE JOURNAL OF BIOLOGICAL DATABASES AND CURATION. 2019.10
深度学习对生物科学研究和药物发现有重要贡献。以往的研究表明,深度学习技术在虚拟筛选中表现出优于其他机器学习算法的性能,这是加速药物发现的关键步骤。然而,由于数据的可用性、数据的进一步处理以及用户友好的深度学习工具和界面的缺乏,阻碍了深度学习技术在药物发现和化学生物学中的应用。因此,我们开发了一个用户友好的web服务器,它集成了最先进的深度学习算法,利用公共或用户提供的数据集,帮助生物学家或化学家对特定目标进行化学探针或药物的虚拟筛选。通过深度筛选,用户可以方便地构建一个深度学习模型,生成面向目标的从头库。所构建的分类和回归模型可用于虚拟筛选生成的从头库或库存的不同化学库。从深层模型训练到虚拟筛选,再到以目标为中心的从头库生成,所有这些任务都可以通过深度筛选来完成。我们相信这种基于深度学习的网络服务器将有利于生物学家和化学家进行探针或药物发现。
23. DeepBindRG: a deep learning based method for estimating effective protein-ligand affinity.PEERJ. 2019.7
蛋白质与小分子相互作用来调节一些重要的细胞功能。许多急性疾病都是通过抑制或激活蛋白质活性部位的小分子结合来治愈的。目前,有许多对接程序来估计蛋白质-配体复合物的结合位置和结合方向。许多评分函数被开发用来估计结合强度和预测有效的蛋白质-配体结合。传统的机器学习方法在很大程度上忽略了溶剂效应、熵效应和多体效应等因素对当前评分函数精度的限制。本文提出了一种新的基于深度神经网络的蛋白质-配体复合物结合亲和力预测模型DeepBindRG,该模型通过从一个大的蛋白质-配体数据集中学习蛋白质-配体界面的接触信息,隐式地学习所有的作用、结合方式和特异性。在初始数据处理步骤中,关键接口信息被保留,以确保输入适合所提出的深度学习模型。在三个独立的数据集上验证模型时,DeepBindRG得到了pKa(-logK(d)或-logK(i))的均方根误差(RMSE)约为1.6-1.8,R值为0.5-0.6,优于RMSE约为2.2-2.4、R值为0.42-0.57的autodock-vina。我们还探讨了DeepBindRG性能的详细原因,特别是针对vina的几个失败案例。此外,DeepBindRG在DUD.E数据库的四个具有挑战性的数据集上表现更好,没有实验性的蛋白配体复合物。DeepBindRG比autodock-vina在预测蛋白质配体结合亲和力方面的表现更好,这表明深度学习方法对药物发现过程有很大帮助。我们还比较了DeepBindRG与基于4D的深度学习方法pafnucy的性能,这两种方法的优缺点为进一步完善基于深度学习的蛋白质配体预测模型提供了线索。
24. K-DEEP: Protein-Ligand Absolute Binding Affinity Prediction via 3D-Convolutional Neural Networks. JOURNAL OF CHEMICAL INFORMATION AND MODELING. 2018.2
准确预测蛋白质配体结合亲和力是计算化学中的一个重要问题,因为它可以大大加快药物的发现,从而实现虚拟筛选和先导优化。我们在这里提出了一种使用最先进的3D卷积神经网络预测结合亲和力的快速机器学习方法,并将该方法与其他使用不同数据集的机器学习和评分方法进行了比较。标准PDBbind(v.2016)核心测试集的结果是最先进的,实验亲和力和预测亲和力之间的Pearson相关系数为0.82,RMSE为1.27,但精确度对所使用的特定蛋白质仍然非常敏感。K-DEEP通过playmole.org网站用户可以很容易地测试他们自己的蛋白质配体复合物,每次预测只需几秒钟。我们相信,K-DEEP的速度、性能和易用性使得它已经成为现代计算化学管道的一个有吸引力的评分函数。
25. Deep Learning Applications for Predicting Pharmacological Properties of Drugs and Drug Repurposing Using Transcriptomic Data. MOLECULAR PHARMACEUTICS. 2016.7
26. Low Data Drug Discovery with One-Shot Learning. ACS CENTRAL SCIENCE. 2017.2
机器学习的最新进展为药物发现做出了重大贡献。在推断小分子化合物的性质和活性时,深神经网络尤其被证明能显著提高预测能力(Ma,J.et al。J、 化学。信息模型。2015年,55263-274)。然而,由于需要大量的训练数据,这些技术的适用性受到了限制。在这项工作中,我们展示了如何使用一次性学习来显著降低在药物发现应用中做出有意义预测所需的数据量。我们引入了一种新的结构,迭代求精长短期记忆,当与图卷积神经网络相结合时,可以显著改善小分子上有意义距离度量的学习。我们将这项工作中引入的所有模型作为DeepChem的一部分进行开源,DeepChem是一个用于药物发现的深度学习的开源框架。
27. The rise of deep learning in drug discovery. DRUG DISCOVERY TODAY. 2018.6
近十年来,深度学习在人工智能的各个研究领域都取得了令人瞩目的成就。这项技术从先前人工神经网络的研究发展而来,在图像和语音识别、自然语言处理等领域显示出优于其他机器学习算法的性能。近年来,在药物研究中应用深度学习的第一波浪潮已经出现,它的效用已经超出了生物活性的预测,在解决药物发现的各种问题方面显示出了希望。将讨论生物活性预测、从头分子设计、合成预测和生物图像分析等实例。
28. 6 Deep Learning in Drug Discovery. MOLECULAR INFORMATICS. 2016.1
大约20年前,人工神经网络在分子信息学和药物发现方面迎来了第一个全盛时期。目前,我们看到人们对借鉴深度学习领域的先进神经网络结构进行药物研究的兴趣正在重新升温。与其他一些生命科学相比,它们在药物发现中的应用还很有限。在这里,我们对分子信息学这一新兴领域进行了概述,介绍了突出的深度学习方法的基本概念,并为探索这些技术在计算机辅助药物发现和设计中的有用性提供了动力。我们特别强调深层神经网络,限制玻尔兹曼机器网络和卷积网络。
29. Protein-Ligand Scoring with Convolutional Neural Networks. JOURNAL OF CHEMICAL INFORMATION AND MODELING. 2017.4
药物发现的计算方法可以减少与实验分析相关的时间和成本,并能够筛选新的化学类型。基于结构的药物设计方法依赖于评分函数来排序和预测结合亲和力和姿势。不断增长的蛋白质配体结合和结构数据的数量使得使用深层机器学习技术来进行蛋白质配体评分。我们描述了卷积神经网络(CNN)评分函数,它将蛋白质-配体相互作用的全面三维(3D)表示作为输入。CNN评分功能自动学习与结合相关的蛋白质-配体相互作用的关键特征。我们训练和优化我们的CNN评分函数,以区分正确和错误的绑定姿势和已知的绑定和非绑定。我们发现,我们的CNN评分功能优于AutoDock Vina评分函数,当排名姿势预测和虚拟筛选。
30. Deep Docking: A Deep Learning Platform for Augmentation of Structure Based Drug Discovery. ACS CENTRAL SCIENCE. 2020.6
药物发现是一个严格的过程,需要数十亿美元的投资和几十年的研究才能将一个分子“从长凳上带到床边”。虽然虚拟对接可以显著加快药物发现的进程,但它最终落后于目前化学数据库的扩展速度,后者已经超过数十亿个分子记录。近年来,小分子药物的大量使用给药物的发现带来了巨大的机遇,但也需要更快的筛选方案。为了应对这一挑战,我们在这里介绍了一种新型的深度对接(DD),这是一种新型的深度学习平台,适用于以快速、准确的方式对接数十亿个分子结构。DD方法利用定量结构-活性关系(QSAR)深度模型对化学库子集的对接分数进行训练,以近似尚未处理的条目的对接结果,从而以迭代的方式去除不利分子。将DD方法与FRED对接程序结合使用,可以快速准确地计算ZINC15文库中13.6亿个分子与12种突出目标蛋白质的对接得分,并证明高得分分子的数据缩减率高达100倍,富集率高达6000倍(没有明显的有利损失)对接实体)。DD协议可以很容易地与任何对接程序一起使用,并且已经公开了。
31. Segler, M.H.S., Kogej, T., Tyrchan, C. and Waller, M.P. Generating Focused Molecule Libraries for Drug Discovery with Recurrent Neural Networks.
ACS Cent Sci, 4, 120-131. (2018)
在从头药物设计中,计算策略被用来产生与所期望的生物靶点有良好亲和力的新分子。在这项工作中,我们证明递归神经网络可以训练成分子结构的生成模型,类似于自然语言处理中的统计语言模型。我们证明生成的分子的性质与用来训练模型的分子的性质有很好的关联。为了丰富具有针对特定生物靶点活性的分子库,我们建议使用已知对该靶点具有活性的小分子集合来微调模型。针对金黄色葡萄球菌,该模型复制了6051中14%的测试分子,而针对恶性疟原虫(疟疾),它复制了1240个测试分子中的28%。当与计分函数相结合时,我们的模型可以执行完整的从头药物设计循环,以产生大量新的药物发现分子。
32. Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism. Journal of Medicinal Chemistry. 2020 63 (16), 8749-8760.
33. Chenjing Cai, Shiwei Wang, Youjun Xu, Weilin Zhang, Ke Tang, Qi Ouyang, Luhua Lai, Jianfeng Pei. Transfer Learning for Drug Discovery. Journal of Medicinal Chemistry 2020, 63 (16) , 8683-8694. https://doi.org/10.1021/acs.jmedchem.9b02147
34. Weiyi Gong, Qimin Yan. Graph-based deep learning frameworks for molecules and solid-state materials. Computational Materials Science 2021, 195 , 110332. https://doi.org/10.1016/j.commatsci.2021.110332
35. Maksym Druchok, Dzvenymyra Yarish, Sofiya Garkot, Tymofii Nikolaienko, Oleksandr Gurbych. Ensembling machine learning models to boost molecular affinity prediction. Computational Biology and Chemistry 2021, 6 , 107529. https://doi.org/10.1016/j.compbiolchem.2021.107529
36. Jiacheng Xiong, Zhaoping Xiong, Kaixian Chen, Hualiang Jiang, Mingyue Zheng. Graph neural networks for automated de novo drug design. Drug Discovery Today 2021, 26 (6) , 1382-1393. https://doi.org/10.1016/j.drudis.2021.02.011
37. Jike Wang, Dongsheng Cao, Cunchen Tang, Lei Xu, Qiaojun He, Bo Yang, Xi Chen, Huiyong Sun, Tingjun Hou. DeepAtomicCharge: a new graph convolutional network-based architecture for accurate prediction of atomic charges. Briefings in Bioinformatics 2021, 22 (3) https://doi.org/10.1093/bib/bbaa183
38. Mateus Sá Magalhães Serafim, Valtair Severino dos Santos Júnior, Jadson Castro Gertrudes, Vinícius Gonçalves Maltarollo, Kathia Maria Honorio. Machine learning techniques applied to the drug design and discovery of new antivirals: a brief look over the past decade. Expert Opinion on Drug Discovery 2021, 11 , 1-15. https://doi.org/10.1080/17460441.2021.1918098
39. Xiao-Chen Zhang, Cheng-Kun Wu, Zhi-Jiang Yang, Zhen-Xing Wu, Jia-Cai Yi, Chang-Yu Hsieh, Ting-Jun Hou, Dong-Sheng Cao. MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction. Briefings in Bioinformatics 2021, 27 https://doi.org/10.1093/bib/bbab152
40. Zhenxing Wu, Dejun Jiang, Chang-Yu Hsieh, Guangyong Chen, Ben Liao, Dongsheng Cao, Tingjun Hou. Hyperbolic relational graph convolution networks plus: a simple but highly efficient QSAR-modeling method. Briefings in Bioinformatics 2021, 194 https://doi.org/10.1093/bib/bbab112
41. Wan Xiang Shen, Xian Zeng, Feng Zhu, Ya li Wang, Chu Qin, Ying Tan, Yu Yang Jiang, Yu Zong Chen. Out-of-the-box deep learning prediction of pharmaceutical properties by broadly learned knowledge-based molecular representations. Nature Machine Intelligence 2021, 3 (4) , 334-343. https://doi.org/10.1038/s42256-021-00301-6
42. Ziqiao Zhang, Jihong Guan, Shuigeng Zhou, . FraGAT: a fragment-oriented multi-scale graph attention model for molecular property prediction. Bioinformatics 2021, 57 https://doi.org/10.1093/bioinformatics/btab195
43. An effective self-supervised framework for learning expressive molecular global representations to drug discovery. Briefings In Bioinformatics 2021,,https://doi.org/10.1093/bib/bbab109
44. SMILES Pair Encoding: A Data-Driven Substructure Tokenization Algorithm for Deep Learning.journal of chemical information and modeling.2021 Apr 26;61(4):1560-1569. doi: 10.1021/acs.jcim.0c01127
45. Jie Zhu, et al. Prediction of drug efficacy from transcriptional profiles with deep learning.nature biotechnology . 2021.6.17