免化所白芳课题组开发基于深度生成模型的PROTAC分子生成新方法

发布者:冯明静发布时间:2024-08-13浏览次数:77

近日,上海科技大学免疫化学研究所/生命科学与技术学院白芳课题组在国际学术期刊《生物信息学简报》(Briefings in Bioinformatics)上发表题为“DiffPROTACs is a deep learning-based generator for Proteolysis Targeting Chimeras”的研究论文。该工作开发了一个名为DiffPROTACs的蛋白水解靶向嵌合体分子(PROteolysis TArgeting Chimera,PROTAC)的生成和设计新计算方法。

PROTAC分子是一种新型的双功能药物分子实体,由三个部分组成,分别是与靶标和E3水解酶结合的配体,以及调控靶蛋白与E3互作稳定性的链接子(Linker)。该类分子一方面可以保持靶标配体原有的调控功能,另外一方面可以直接降解疾病靶标。与传统小分子抑制剂相比,PROTAC显示出多种优越性,例如能够靶向不可成药的蛋白、可有效地缓解药物耐药性进展、对靶标蛋白的亲和力要求低等。然而,由于PROTAC构效关系不明确,其理性设计计算方法尤为或缺。目前较为普遍的做法仍依赖于药物化学家根据经验,在两端配体已知的前提下,从长度、分子物理化学性质等多个方面出发,随机替换链接子获得PROTAC分子,进一步合成后进行药效评估,这对药物研发成本投入具有较高的要求,同时,化合物本身的结构新颖性也较为受限。

白芳课题组长期以来致力于PROTAC分子设计与药效评价等开发新工具、新方法,目前已经开发了PROTAC降解药效评价方法DeepPROTACs (Nat. Commun., 2022)等,用户遍布全球17个国家。本项目在前期工作的基础上,针对PROTAC分子设计目前存在的上述局限性问题,引入人工智能生成算法,以决定PROTAC药效的因素——靶蛋白-E3互作稳定性作为生成模型的空间约束条件,发展了PROTAC链接子的智能化生成新方法。该方法可以生成化学结构多样性丰富的PROTAC新分子。

“生成式人工智能”的兴起为药物研发领域带来新的曙光。其中,扩散模型和Transformers是重要生成式代表算法。基于这两个算法,本文针对PROTAC分子链接子任务设计并发展了一种新的扩散生成模型DiffPROTACs(模型架构如图1所示)。该模型利用Transformer来学习并生成基于给定配体的新的PROTAC的连接子。同时,为了将分子的空间结构性质引入到该模型中,本文设计了O(3)等变图Transformer(O(3) Equivariant Graph Transformer,OEGT)模块,并分别使用Transformer和图神经网络更新连接子节点的特征与坐标,从而保证了模型相对于旋转的等变性,提高数据学习性能。

1. PROTAC分子生成模型DiffPROTACs算法框架示意图。

经过系统测试与评价表明:DiffPROTACs生成的PROTAC分子的有效性、结构独特性分别可达93.86%和68.7%。在如2所示的测试案例中(复合物结构PDB编号:8BDT),DiffPROTACs可生成多种结构多样性丰富的链接子,同时,不仅可有效生成出已报导的PROTAC真实的分子结构,且生成分子与实验解析构象间的平均均方根偏差(Root Mean Square Deviation,RMSD)仅为0.53 Å。

2. PROTAC分子生成实例。

a)针对靶标BRD4E3水解酶VHL生成的PROTAC链接子二维图及三维构象示例;b)Diff PORTAC可生成已报道真实PROTACPDB编号:8BDT,黄色)的连接子及天然活性构象(灰色)。

为了进一步帮助业界进行PROTAC分子的设计或者筛选,本文使用DiffPROTACs生成了一系列新的PROTAC分子,为设计者提供PROTAC虚拟筛选库,该数据库可以通过以下链接下载 https://bailab.siais.shanghaitech.edu.cn/service/DiffPROTACs-generated.tgz。此外,本文发展的DiffPROTACs也开发了网络服务器为业界提供非商业用途的免费使用(网址:https://bailab.siais.shanghaitech.edu.cn/services/diffprotacs/)。源代码也已同时发布,供业届深入研究提供基础(https://github.com/fenglei104/DiffPROTACs)。

本项目工作中,上海科技大学信息科学与技术学院2021级硕士研究生李风雷和华东师范大学医学与健康研究院副研究员胡乔宇原白芳课题组博士后)为本文共同第一作者。上海科技大学生命学院助理教授、免疫化学研究所白芳研究员为通讯作者。上海科技大学为第一完成单位。

文章链接:

https://academic.oup.com/bib/article/25/5/bbae358/7727300