爱奇飞网

网站首页健康养生 >正文

新模型提供了一种加速药物发现的方法

开心的月饼 2023-06-09 08:48:03 健康养生

庞大的药物化合物库可能包含对多种疾病(例如癌症或心脏病)的潜在治疗方法。理想情况下,科学家们希望针对所有可能的目标对这些化合物中的每一种进行实验测试,但进行这种筛选非常耗时。

新模型提供了一种加速药物发现的方法

近年来,研究人员已开始使用计算方法筛选这些库,以期加快药物发现。然而,其中许多方法也需要很长时间,因为它们中的大多数都是根据每个目标蛋白的氨基酸序列计算其三维结构,然后使用这些结构来预测它将与哪些药物分子相互作用。

麻省理工学院和塔夫茨大学的研究人员现已设计出一种替代计算方法,该方法基于一种称为大型语言模型的人工智能算法。这些模型——一个著名的例子是ChatGPT——可以分析大量文本并找出哪些词(或者,在这种情况下,氨基酸)最有可能一起出现。这种称为ConPLex的新模型可以将目标蛋白质与潜在的药物分子相匹配,而无需执行计算分子结构的计算密集型步骤。

使用这种方法,研究人员可以在一天内筛选超过1亿种化合物——远远超过任何现有模型。

“这项工作解决了对潜在候选药物进行有效和准确的计算机筛选的需求,并且该模型的可扩展性使大规模筛选能够评估脱靶效应、药物再利用以及确定突变对药物结合的影响,”麻省理工学院计算机科学与人工智能实验室(CSAIL)计算与生物学组组长、新研究的资深作者之一、西蒙斯数学教授BonnieBerger说。

塔夫茨大学计算机科学教授LenoreCowen也是该论文的资深作者,该论文本周发表在美国国家科学院院刊上。CSAIL研究科学家RohitSingh和麻省理工学院研究生SamuelSledzieski是该论文的主要作者,麻省理工学院生物工程副教授、麻省理工学院Ragon研究所成员BryanBryson和哈佛,也是一位作家。除了这篇论文之外,研究人员还在线提供了他们的模型供其他科学家使用。

做出预测

近年来,计算科学家在开发可以根据氨基酸序列预测蛋白质结构的模型方面取得了巨大进步。然而,例如,使用这些模型来预测大型潜在药物库如何与致癌蛋白质相互作用已被证明具有挑战性,主要是因为计算蛋白质的三维结构需要大量时间和计算能力。

另一个障碍是,这类模型在消除被称为诱饵的化合物方面没有良好的记录,诱饵与成功的药物非常相似,但实际上与目标相互作用不佳。

“该领域长期存在的挑战之一是这些方法很脆弱,也就是说,如果我给模型一种药物或一种小分子,看起来几乎像真的东西,但它在某种微妙的方式上略有不同,该模型可能仍然预测它们会相互作用,即使它不应该,”辛格说。

研究人员设计了可以克服这种脆弱性的模型,但它们通常只针对一类药物分子量身定制,而且它们不太适合大规模屏幕,因为计算时间太长。

麻省理工学院团队决定基于他们于2019年首次开发的蛋白质模型采取替代方法。该语言模型使用包含20,000多种蛋白质的数据库,将此信息编码为每个氨基酸序列的有意义的数字表示形式,以捕获关联序列和结构之间。

“有了这些语言模型,即使是具有非常不同序列但可能具有相似结构或相似功能的蛋白质也可以在这个语言空间中以相似的方式表示,我们能够利用它来做出我们的预测,”Sledzieski说。

在他们的新研究中,研究人员将蛋白质模型应用于确定哪些蛋白质序列将与特定药物分子相互作用的任务,这两种药物分子都具有通过神经网络转换为共同共享空间的数字表示。他们用已知的蛋白质-药物相互作用对网络进行训练,使其能够学习将蛋白质的特定特征与药物结合能力联系起来,而无需计算任何分子的3D结构。

“通过这种高质量的数字表示,该模型可以完全短路原子表示,并根据这些数字预测这种药物是否会结合,”辛格说。“这样做的好处是你不需要通过原子表示,但数字仍然包含你需要的所有信息。”

这种方法的另一个优点是它考虑了蛋白质结构的灵活性,当与药物分子相互作用时,蛋白质结构可以“摇摆不定”并呈现出略微不同的形状。

高亲和力

为了使他们的模型不太可能被诱饵药物分子愚弄,研究人员还纳入了一个基于对比学习概念的训练阶段。在这种方法下,研究人员给出了“真实”药物和冒名顶替者的模型示例,并教它区分它们。

然后,研究人员通过筛选包含约4,700种候选药物分子的库来测试他们的模型,以确定它们与一组51种称为蛋白激酶的酶结合的能力。

从热门结果中,研究人员选择了19对药物-蛋白质对进行实验测试。实验表明,在19次命中中,12次具有很强的结合亲和力(在纳摩尔范围内),而几乎所有其他可能的药物-蛋白质对都没有亲和力。其中四对以极高的亚纳摩尔亲和力结合(强到十亿分之一的微小药物浓度就会抑制蛋白质)。

虽然研究人员在这项研究中主要关注筛选小分子药物,但他们现在正致力于将这种方法应用于其他类型的药物,例如治疗性抗体。这种建模还可以证明对运行潜在药物化合物的毒性筛选有用,以确保它们在动物模型中进行测试之前没有任何不需要的副作用。

“药物发现如此昂贵的部分原因是因为它的失败率很高。如果我们可以通过预先说明这种药物不太可能奏效来降低失败率,那将大大降低研发成本药物发现,”辛格说。

美国国家癌症研究所癌症数据科学实验室主任EytanRuppin(未参与)说,这种新方法“代表了药物-靶点相互作用预测方面的重大突破,并为未来的研究开辟了更多机会,以进一步增强其能力”在研究中。“例如,将结构信息纳入潜在空间或探索用于生成诱饵的分子生成方法可以进一步改进预测。”


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行