网站首页生活常识 >正文
庞大的药物化合物库可能包含治疗多种疾病的潜在药物,例如癌症或心脏病。理想情况下,科学家们希望针对所有可能的目标对这些化合物中的每一种进行实验测试,但进行这种筛选非常耗时。
近年来,研究人员已开始使用计算方法筛选这些库,以期加快药物发现。然而,其中许多方法也需要很长时间,因为它们中的大多数都是根据每个目标蛋白的氨基酸序列计算其三维结构,然后使用这些结构来预测它将与哪些药物分子相互作用。
麻省理工学院和塔夫茨大学的研究人员现已设计出一种替代计算方法,该方法基于一种称为大型语言模型的人工智能算法。这些模型——一个著名的例子是 ChatGPT——可以分析大量文本并找出哪些词(或者,在这种情况下,氨基酸)最有可能一起出现。这种称为 ConPLex 的新模型可以将目标蛋白质与潜在的药物分子相匹配,而无需执行计算分子结构的计算密集型步骤。
使用这种方法,研究人员可以在一天内筛选超过 1 亿种化合物——比任何现有模型都要多得多。
“这项工作解决了对潜在候选药物进行有效和准确的计算机筛选的需求,并且该模型的可扩展性使大规模筛选能够评估脱靶效应、药物再利用以及确定突变对药物结合的影响,”西蒙斯数学教授、麻省理工学院计算机科学与人工智能实验室 (CSAIL) 计算与生物学组组长、新研究的资深作者之一邦妮·伯杰 (Bonnie Berger) 说。
塔夫茨大学计算机科学教授 Lenore Cowen 也是该论文的资深作者,该论文本周发表在国家科学院院刊上。CSAIL 研究科学家 Rohit Singh 和麻省理工学院研究生 Samuel Sledzieski 是该论文的主要作者,麻省理工学院生物工程副教授、麻省理工学院 Ragon 研究所成员 Bryan Bryson 和哈佛,也是一位作家。除了这篇论文之外,研究人员还在线提供了他们的模型供其他科学家使用。
做出预测
近年来,计算科学家在开发可以根据氨基酸序列预测蛋白质结构的模型方面取得了巨大进步。然而,例如,使用这些模型来预测大型潜在药物库如何与致癌蛋白质相互作用已被证明具有挑战性,主要是因为计算蛋白质的三维结构需要大量时间和计算能力。
另一个障碍是,这类模型在消除被称为诱饵的化合物方面没有良好的记录,诱饵与成功的药物非常相似,但实际上与目标相互作用不佳。
“该领域长期存在的挑战之一是这些方法很脆弱,如果我给模型一种药物或小分子,看起来几乎像真的东西,但它在某种微妙的方式上略有不同,该模型可能仍然预测它们会相互作用,即使它不应该,”Singh 说。
研究人员设计了可以克服这种脆弱性的模型,但它们通常只针对一类药物分子量身定制,而且它们不太适合大规模屏幕,因为计算时间太长。
麻省理工学院团队决定基于他们于 2019 年首次开发的蛋白质模型采取替代方法。该语言模型使用包含 20,000 多种蛋白质的数据库,将此信息编码为每个氨基酸序列的有意义的数字表示形式,以捕获关联序列和结构之间。
“有了这些语言模型,即使是序列非常不同但可能具有相似结构或相似功能的蛋白质也可以在这个语言空间中以相似的方式表示,我们能够利用它来做出我们的预测,”Sledzieski说。
在他们的新研究中,研究人员将蛋白质模型应用于确定哪些蛋白质序列将与特定药物分子相互作用的任务,这两种药物分子都具有通过神经网络转换为共同共享空间的数字表示。他们用已知的蛋白质-药物相互作用对网络进行训练,使其能够学习将蛋白质的特定特征与药物结合能力联系起来,而无需计算任何分子的 3D 结构。
“通过这种高质量的数字表示,该模型可以完全短路原子表示,并根据这些数字预测这种药物是否会结合,”辛格说。“这样做的好处是你不需要通过原子表示,但数字仍然包含你需要的所有信息。”
这种方法的另一个优点是它考虑了蛋白质结构的灵活性,当与药物分子相互作用时,蛋白质结构可以“摇摆不定”并呈现出略微不同的形状。
高亲和力
为了使他们的模型不太可能被诱饵药物分子愚弄,研究人员还纳入了一个基于对比学习概念的训练阶段。在这种方法下,研究人员向模型提供“真实”药物和冒名顶替者的示例,并教它区分它们。
然后,研究人员通过筛选包含约 4,700 种候选药物分子的库来测试他们的模型,以确定它们与一组 51 种称为蛋白激酶的酶结合的能力。
从热门结果中,研究人员选择了 19 对药物-蛋白质对进行实验测试。实验表明,在 19 次命中中,12 次具有很强的结合亲和力(在纳摩尔范围内),而几乎所有其他可能的药物-蛋白质对都没有亲和力。其中四对以极高的亚纳摩尔亲和力结合(强到十亿分之一的微小药物浓度就会抑制蛋白质)。
虽然研究人员在这项研究中主要关注筛选小分子药物,但他们现在正致力于将这种方法应用于其他类型的药物,例如治疗性抗体。这种建模也可用于运行潜在药物化合物的毒性筛选,以确保它们在动物模型中进行测试之前没有任何不良副作用。
“药物研发如此昂贵的部分原因是它的失败率很高。如果我们可以通过预先说明这种药物不太可能奏效来降低失败率,那将大大降低药物发现的成本,”Singh 说。
版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们
相关文章:
- 2023-11-26研究表明南极臭氧层空洞在仲春时更深
- 2023-11-24机器人假肢脚踝改善自然运动和稳定性
- 2023-11-24球形机器人来救援
- 2023-11-24解释人工智能的方法可能并不那么容易解释
- 2023-11-24描述开放系统中量子信息加扰的通用框架
- 2023-11-24研究为抗生素耐药性和健身景观提供了新的见解
- 2023-11-24物理学家发现量子材料中奇异电荷传输的证据
- 2023-11-23一种高效去除水产养殖废水中磷酸盐的方法
- 2023-11-23研究人员在防止钒电池容量损失方面获得了有希望的结果
- 2023-11-23了解化学处理沙土的强度发展机制
- 站长推荐
- 栏目推荐
- 阅读排行
- 健康和教育密切相关新西兰需要将其更多地融入小学
- Steam现已全面支持DualShock和DualSense控制器无需购买新的Xbox控制器
- DistrictTaco希望扩大其在罗利地区的业务
- Humane的AiPin–您的新型可穿戴人工智能助手
- Microsoft365CopilotAI如何提高您的工作效率
- MicrosoftRadius云开源应用程序平台
- 生产目的FiskerPear具有透明A柱因为移动头部太困难
- 索尼Xperia5V马来西亚发布Snapdragon8Gen2SoC 8GBRAM 256GB储存空间起价RM4999
- Nissan的模块化PulsarSportbak集轿跑车 旅行车和皮卡于一体
- 新奥尔良烤肉店将在中央市场推出