智源社区 09月01日
DiffGui:AI驱动的3D分子生成新框架
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章介绍了DiffGui这一创新的3D分子生成模型,它通过“原子-键协同扩散”和“多属性引导”的双机制,解决了传统药物研发中虚拟筛选效率低下和新一代3D分子生成模型面临的挑战。DiffGui能够生成结构合理、结合亲和力高、兼具良好药物属性和可合成性的分子。模型在全新药物设计和先导化合物优化任务中均表现出色,并通过湿实验验证了其在实际药物发现中的巨大潜力,为AI驱动的药物研发提供了新的解决方案。

🎯 **DiffGui的创新双机制框架**:DiffGui模型核心在于其融合了原子-键协同扩散与多属性引导的双机制。通过将正向扩散过程分为两个阶段,首先在原子间施加微量噪声并扩散键型至先验分布,从而使模型能基于原子间动态距离推断键型,解决键型与键长不一致问题;随后再对原子类型与坐标进行扰动。这种分步扩散确保了模型能精确学习键型与真实键长间的内在规律。同时,E(3)-等变图神经网络确保了生成过程的旋转、平移与排列不变性,保证了生成构象的几何合理性。模型还引入了无分类器引导策略,将结合亲和力、类药性(QED)、合成可及性(SA)等多种分子属性融入训练与生成过程,引导生成兼具高亲和力与优良药物属性的分子。

🧬 **卓越的结构与性质评估**:DiffGui在分子结构合理性方面表现突出,生成的分子在键长、键角、二面角分布上与真实分子高度相似,全原子对距离的Jensen-Shannon (JS)散度远低于其他模型,特别是在PDBbind数据集上,C-C键距离JS散度仅为0.1815,全原子对距离JS散度低至0.0486。生成的分子五、六元环占比超过95%,与真实药物分子高度吻合。构象准确性方面,生成的分子构象与RDKit优化/预测构象的均方根偏差(RMSD)稳定在1.0 Å左右。在分子性质评估上,DiffGui在原子稳定性、分子稳定性、PB-validity和RDKit-validity等基础指标上均优于其他方法,并在蛋白质-配体相互作用指纹相似度上获得最高分(0.6383),同时在Vina Score、Vina Min和Vina Dock等多项结合亲和力评价中获得最低分值,显示出优异的结合能力,并在QED指标上超越所有其他模型,生成具有更理想类药特性的分子。

🚀 **广泛的应用潜力与湿实验验证**:DiffGui在全新药物设计任务中展现出优异的跨靶点泛化能力,能够为多种蛋白靶点生成占据结合口袋、具有合理三维空间匹配的分子,且对接评分和综合性质优于活性分子及其他对比方法。在先导化合物优化任务中,通过“片段去噪”和“片段条件”策略,支持片段生长、连接和合并,能够生成结构多样且性质优于参考配体的分子。更重要的是,在针对未参与训练的RSK4和DHODH靶点的湿实验验证中,DiffGui生成的化合物均表现出强效抑制活性,IC₅₀值显著提升,证明了该模型在实际药物发现中的巨大潜力,为AI驱动的药物设计提供了强有力的工具。

🧪 **关键数据与技术亮点**:DiffGui生成的分子在PDBbind数据集上的全原子对距离JS散度低至0.0486,C-C键距离JS散度为0.1815。在结合亲和力方面,Vina Score、Vina Min和Vina Dock得分分别为-6.700、-7.655和-8.448。类药性(QED)得分高达0.631。在全新药物设计中,其多样性指数达到0.7256。湿实验验证显示,对RSK4靶点生成的化合物IC₅₀值分别达到215.0 nM和111.1 nM;对DHODH靶点优化的化合物IC₅₀从8.02 μM降低至4.27 μM,或从32.20 nM优化至10.45 nM。该模型采用了E(3)-等变图神经网络,并融合了结合亲和力、QED、SA、LogP、TPSA等多属性引导。

💡 **AI驱动药物研发的未来方向**:DiffGui模型代表了AI在药物设计领域的重要进展,其“原子-键协同扩散”和“多属性引导”的创新性结合,有效解决了3D分子生成中的关键挑战,包括结构准确性、性质优化和多样性。通过精确控制分子生成过程中的几何约束和理化性质,DiffGui能够加速从靶点识别到先导化合物优化的全过程,为新药研发提供更高效、更智能的解决方案,预示着AI在药物发现领域的光明前景。

研究背景

1. 

传统药物研发的瓶颈

在传统的药物研发中,寻找能够与疾病靶点结合的先导化合物是决定项目成败的关键。目前主流的先导化合物发现方法包括:

(1). 基于靶标结构的药物设计 (SBDD)SBDD包含虚拟筛选和分子生成。其中,虚拟筛选依赖打分函数来评估靶标和配体之间的结合亲和力。然而,该方法需在极大规模的化学空间中进行,计算成本高昂,且易因评分函数的局限性产生大量假阳性结果,效率低下。

(2). 基于已知配体的药物设计 (LBDD)LBDD是根据已知活性配体的结构信息进行分子优化,但由于未充分利用靶蛋白的三维结构信息,难以应用于缺乏已知配体的新型靶点。

2. 

新一代3D分子生成模型的挑战

近年来,基于深度学习的3D分子生成模型在SBDD中展现出巨大潜力,但仍面临以下挑战:

(1). 自回归模型:需按顺序生成原子,易忽略分子的全局结构信息,导致生成分子的结构不完整或存在累积误差。

(2). 扩散模型:虽避免了自回归的局限性,但多数仅模拟原子扩散,未显式建模键的生成过程,导致键型推断依赖静态键长,对原子坐标偏差敏感,易产生不合理结构。此外,生成过程缺乏对亲和力、类药性、可合成性等关键属性的显式引导,限制了其实际应用价值。

研究内容

1. 

DiffGui模型的创新框架

DiffGui提出了一种融合原子-键协同扩散多属性引导的双机制生成框架(图1)。

(1). 双阶段正向扩散过程: DiffGui的独特之处在于其将正向扩散过程分成了两个阶段:

第一阶段:仅对原子施加微量噪声,同时将键型逐渐扩散到无键的先验分布。这使得模型能够基于原子间的动态距离来推断键型,从根本上解决键型-键长不一致问题。

第二阶段:对原子类型与坐标进行扰动,逐步扩散至先验分布。两阶段的分步扩散确保了模型在整个过程中都能准确地学习到键型与真实键长之间的内在规律。

(2). E(3)-等变图神经网络 (GNN) DiffGui采用E(3)-等变图神经网络同时更新原子与键的表征,确保生成过程具有旋转、平移与排列不变性,保证生成构象的几何合理性。

(3). 多属性引导: DiffGui 采用了无分类器的引导策略,在训练与生成过程中融入了多种重要的分子属性。模型引入分子的结合亲和力、类药性 (QED)、合成可及性 (SA)、脂水分配系数 (LogP) 以及极性表面积 (TPSA) 等多属性条件,引导生成兼具高亲和力与优良药物属性的分子。

图1 

DiffGui模型框架及扩散-生成过程示意[1]

2. 

DiffGui生成分子的结构评估

DiffGui 模型在多项评估中都展现出卓越的性能,超越了现有SOTA (State-of-the-Art) 模型。在分子结构合理性方面,DiffGui 生成的分子与真实分子的键长、键角和二面角分布高度相似(表1),其全原子对距离的 Jensen-Shannon (JS) 散度也远低于其他模型。特别是在PDBbind数据集上,DiffGui C-C键距离JS散度仅为0.1815,全原子对距离JS散度更是低至0.0486(图2),显示出极高的结构准确性。此外,DiffGui生成的分子中五、六元环占比超过95%,与真实药物分子的环系分布高度吻合。在分子构象准确性方面,DiffGui 生成的分子构象与RDKit优化/预测构象的均方根偏差 (RMSD) 值稳定在1.0 Å左右,这避免了因产生片段化分子或计算简化而导致的伪低RMSD值(分子结构不完整)的问题(图3)。

表1 

生成分子与参考分子间的平均JS散度[1]

图2 

生成分子与参考分子的全原子对距离分布对比[1]

图3 

生成分子与优化/预测构象的RMSD分布[1]

3. 

DiffGui生成分子的性质评估

DiffGui 在生成分子的性质方面表现优异,这一点在多项评估指标中得到了充分验证。在PDBbind数据集上,DiffGui在原子稳定性 (0.9509)、分子稳定性 (0.4069)PB-validity (0.9537) RDKit-validity (0.8722) 等基础分子指标上均优于其他方法(表2)。同时,该模型在蛋白质-配体相互作用指纹相似度方面取得最高得分 (0.6383),而2D结构相似度最低 (0.3261),表明DiffGui不仅能够有效维持与靶点关键残基的相互作用模式,还能够生成具有新颖骨架结构的分子。此外,DiffGui生成的分子在Vina ScoreVina MinVina Dock三项结合亲和力评价中均获得最低分值(分别为-6.700-7.655-8.448),显示出优异的结合能力。在类药性方面,DiffGui在定量药物相似性评估 (QED0.631) 指标上超越所有其他模型,说明其生成的分子具有更理想的类药特性。尽管在可合成性 (SA) 指标上略逊于部分自回归模型,其SA得分 (0.678) 在扩散模型中仍保持最高水平,且其生成的分子还表现出合理的极性表面积 (TPSA100.49) 和脂水分配系数(LogP1.977,处于1~3的理想范围内)。

表2 

不同方法在PDBbind数据集上生成分子的基本属性[1]

表3 不同方法在PDBbind数据集上生成分子的药物属性

[1]

4. 

DiffGui在全新药物设计与先导化合物优化中的应用

DiffGui已成功应用于全新药物设计与先导化合物优化任务,展现出优异的通用性与实用价值。

(1). 全新药物设计

在全新药物设计任务中,DiffGui 展现出优异的跨靶点泛化能力。针对包括β-分泌酶1 (1w51)、酪氨酸激酶 (3ctj)G蛋白偶联受体 (7ew4) 及离子通道 (8ju6) 在内的多种蛋白靶点,该模型均能生成充分占据结合口袋、且具有合理三维空间匹配的分子(图45)。生成分子不仅结构明确,其对接评分和综合性质也优于活性分子及其他对比方法所产生的分子。特别地,除3ctj外,DiffGui 所生成分子的结合自由能 (ΔG) 均低于参考配体,表明其其能够设计出具有更高亲和力的候选分子。此外,在1w513ctj两个靶点中,DiffGui 生成分子与参考配体在三维药效团重叠方面表现最优,凸显其准确模拟关键相互作用的能力。为进一步评估生成分子的多样性,作者在其他靶点(如4b5d5ni75ywy)上也进行了测试,结果表明DiffGui能够生成与不同形状口袋精确匹配的多样化分子,其多样性指数达到0.7256,且对接评分和性质均优于参考配体。

图4 

针对靶点1w51和3ctj的生成分子展示[1]

图5 

针对靶点7ew4和8ju6的生成分子展示[1]

(2). 先导化合物优化

在先导化合物优化任务中,DiffGui 采用片段去噪” (fragment denoising) 片段条件” (fragment conditioning) 两种采样策略,支持片段生长 (fragment growing)、片段连接 (fragment linking) 和片段合并 (fragment merging) 等多种优化方法(图6)。以PI3K (3l13) 为例,模型以噻吩并嘧啶为初始片段,通过片段生长生成的新分子不仅保持了与关键残基(包括Lys802Ala805Asp841Tyr867Val882Asp964)的相互作用,还将原结构中的吗啉环替换为呋喃、吡唑等基团,以及将哌嗪磺酰基替换为吡咯烷磺酰基、环化哌嗪磺酰基和哌嗪羰基等不同结构单元,体现出其对蛋白-配体相互作用模式的深刻理解与多样化学空间的探索能力。此外,当提供两个或三个片段时,DiffGui还能分别通过片段连接和片段合并策略进行骨架跃迁,将活性配体的核心支架转化为具有类似功能的新结构。生成分子在Vina评分、类药性 (QED) 和可合成性 (SA) 等方面均优于或至少与参考配体竞争力相当,表明DiffGui可有效推进先导化合物优化进程。

图6 

基于片段的先导化合物优化示例[1]

更重要的是,湿实验验证进一步证明了 DiffGui 在药物发现实际应用中的潜力。针对未参与训练的 RSK4(核糖体 S6 激酶 4)靶点,DiffGui 所生成的两个化合物(化合物 1  2)在 HTRF 实验中均表现出强效抑制活性,IC₅₀ 值分别达到 215.0 nM  111.1 nM,显示出进一步开发的潜力。结合模式分析表明,这两个化合物均能够与 RSK4 结合口袋中的关键残基(K105D153L155  K221)发生相互作用。

在对非激酶靶点二氢乳清酸脱氢酶(DHODH)进行先导化合物优化时,DiffGui 在固定片段(图7中橙色标注)基础上生成的分子(化合物 3  4)对 DHODH 的抑制活性显著提升:其中一个化合物的IC₅₀ 8.02 μM 降低至 4.27 μM,另一个则从 32.20 nM 进一步优化至 10.45 nM。化合物 3 在噻唑环上同时引入羧基和甲基取代基,其中羧基与 R136 形成盐桥,甲基则插入由 V134V143  Y356 残基形成的疏水子口袋中。与原始配体相比,化合物 4 将羧酸转换为异羟肟酸,扩展了氢键网络,新增了与 Q47  T360 的相互作用;苯环上引入的氟原子占据了此前已识别的疏水子口袋,连接子上增加的甲基则填充了由 L46A55  L58 构成的另一个疏水空腔。这些精细的结构修饰显著增强了配体与靶蛋白之间的相互作用,从而大幅提升了结合亲和力(图7)。

图7 

 DiffGui生成分子的湿实验验证结果[1]

总结

本研究提出的DiffGui模型通过原子-键协同扩散+性质引导策略,显著提升了分子生成的结构合理性、结合亲和力、药物属性与可合成性。在多个数据集和靶点任务中,该模型优于现有方法,并在湿实验验证中展现实际应用潜力。DiffGui不仅可用于de novo药物设计,也能辅助先导化合物的优化研究,为人工智能驱动的药物设计和发现提供了新的解决方案。

华东师范大学药学院/人工智能新药创智中心胡乔宇副研究员、上海临港实验室孙长志博士、华东师范大学药学院/人工智能新药创智中心贺欢副研究员、华东师范大学计算机科学与技术学院博士生徐嘉政、华东师范大学药学院/人工智能新药创智中心刘旦麟博士后为本文共同第一作者,华东师范大学药学院/人工智能新药创智中心李洪林教授为本文的最后通讯作者。该工作得到了国家重点研发计划(2022YFC3400501)、国家自然科学基金(82425104/82404518)、上海市科委“计算生物学”专项(24JS2830200)和上海市教委“人工智能促进科研范式改革赋能学科跃升计划项目”(2024AI01014)的资助。



参考文献 
[1] Hu, Q., Sun, C., He, H, J. et al. Target-aware 3D molecular generation based on guided equivariant diffusion. Nature Communications. 2025, 16: 7928.
该文章代码已开源:
https://github.com/QiaoyuHu89/DiffGui

供稿:胡乔宇/徐嘉政
校稿:汤荣凡
华东师范大学药学院/人工智能新药创智中心/李洪林教授课题组
招聘博后
华东师范大学李洪林教授团队诚聘博士后
Li's Lab
地址:上海市中山北路3663号 
电话:021-54836386
课题组网站:http://www.lilab-ecust.cn

长按扫码可关注

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DiffGui 3D分子生成 AI药物设计 扩散模型 药物研发 分子结构 结合亲和力 类药性 可合成性 人工智能 Deep Learning Drug Discovery Molecular Generation Diffusion Models AI in Pharma Binding Affinity Drug-likeness Synthesizability
相关文章