网站首页健康养生 >正文
形式服从功能,对于生命的构成要素——蛋白质来说尤其如此。分子蛋白质的折叠和形状揭示了它们在支持生命中的作用。
科学家开发了一种名为OpenFold的新型开源软件工具,该工具利用人工智能(AI)并利用超级计算机的强大功能来预测蛋白质结构。
这项研究有助于开发新药物,并更好地了解与帕金森氏症和阿尔茨海默氏症等神经退行性疾病相关的畸形蛋白质。
OpenFold以GoogleDeepMind开发的AlphaFold2的成功为基础,自2021年以来已被超过200万研究人员用于疫苗开发、癌症治疗等领域的蛋白质预测。
“AlphaFold2是科学上的一次突破,”哈佛医学院高级研究员、从事人工智能和生物学交叉领域的研究的纳齐姆·博阿塔(NazimBouatta)表示。“我们开发了一个完全开源的版本——OpenFold——现在它正在帮助学术界和工业界推动该领域的发展。”
Bouatta在《自然方法》杂志上合作撰写了一项研究,宣布了OpenFold,一种快速、内存高效且可训练的AlphaFold2实现。
他与同事穆罕默德·库雷西(MohammedAlQuraishi,原哈佛大学教授,现哥伦比亚大学教授)共同启动了该项目。该项目发展成为OpenFold联盟,这是一个由初创公司组成的联合体,与学术界合作开展工作。
“哈佛大学和哥伦比亚大学的优秀学生也为这项工作做出了贡献,其中古斯塔夫·阿德里茨的表现非常出色。他们在实施代码方面都做得非常出色,”布瓦塔说。
人工智能的一个核心方面是大型语言模型(LLM),它可以获取大量文本并从中生成新的有意义的文本,例如ChatGPT具有类似人类的能力,可以根据大量文本数据回答查询。
“我们需要大约100个图形处理单元(GPU)来训练像OpenFold这样的系统。具体来说,要训练最新的ChatGPT,你需要成千上万个GPU,”Bouatta说。
OpenFold的首批应用之一来自MetaAI(前身为Facebook)。MetaAI最近发布了一张图谱,其中包含来自细菌、病毒和其他尚未鉴定的微生物的6亿多种蛋白质。
“他们使用OpenFold整合了一种‘蛋白质语言模型’,与ChatGPT非常相似,但其中的语言是构成蛋白质的氨基酸,”Bouatta说。
“从某种意义上说,生物体中的信息是以语言组织起来的,”Bouatta解释道,他以字母ACGT为例,ACGT代表DNA的四种碱基——腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶。“这是大自然为构建这些复杂的生物体而选择的语言。”
更进一步说,蛋白质还有第二层语言,这些字母代表了构成人体所有蛋白质的20种氨基酸,并描述了蛋白质的作用。
基因组测序已经生成了大量关于生命字母的数据,但直到现在还缺少一本“字典”,它可以从这些字母中得出蛋白质的三维形状,并模拟小分子与其结合的位点。
“机器学习使我们能够获取一串字母,即描述您能想到的任何类型蛋白质的氨基酸,运行复杂的算法,并返回精致的三维结构,该结构与我们通过实验获得的结构非常接近。OpenFold算法非常复杂,使用了我们熟悉的ChatGPT和其他算法的新开发成果,”Bouatta表示,他指的是GoogleTransformers开发的概念和主要ChatGPT算法的元素。
OpenFold的一个关键优势在于它能够使用科学家自己的数据来训练模型,而这是AlphaFold2的公开版本无法实现的。Bouatta说:“能够使用OpenFold训练系统为学术界和工业界的研究开辟了重要途径。”
在未来的几个月里,Bouatta预计将发布一种OpenFold模式,该模式能够表征蛋白质-配体复合物,即与蛋白质结合的小分子的复杂取向。
“这就是药物实现其作用机制的方式。了解这一点尤为重要,”他解释道。
TACC为OpenFold团队提供了Frontera和Lonestar6超级计算机的分配,特别是在推动全球AI应用发展方面发挥了重要作用的GPU节点。
“TACC一直是一个非常好的合作伙伴,”Bouatta说道。“我要感谢TACC允许我们访问这些资源,这使我们能够在所需的规模上部署机器学习和人工智能。”
“超级计算机与人工智能的结合正在彻底改变我们研究生物学的方式。超级计算机的强大之处在于,它让我们能够在短短几个月内预测1亿个结构。一旦系统经过训练,我们就能在几秒钟内获得结构。然而,它们不会取代实验,因为我们需要回到实验室来测试我们的想法。”
OpenFold等人工智能系统与更传统的基于物理的系统的结合,正在帮助科学家从最基本的层面上理解生命,并为治疗神经退行性疾病开辟途径。
“超级计算机是现代生物学和药物发现的显微镜,”Bouatta总结道。“如果我们继续投入更多资源,将人工智能/计算方法应用于超级计算机,我们就能增强我们理解生命和治疗疾病的能力。”
版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们
相关文章:
- 2024-08-14乳制品营养引领可持续发展
- 2024-08-13用钙钛矿量子线制成的全彩光纤LED为先进的可穿戴显示器铺平了道路
- 2024-08-13化学家合成具有药物潜力的植物衍生分子
- 2024-08-13研究团队利用可调谐激光器开发出具有赫兹级精度的简单宽带光谱方法
- 2024-08-12二维磷五聚体层在银表面表现出半导体特性
- 2024-08-09轻度干旱预处理促进多年生黑麦草分蘖生长和恢复力
- 2024-08-09新型X射线成像技术可解析三维融合相关纳米泡沫
- 2024-08-08细胞中的核糖体如何实现蛋白质折叠
- 2024-08-08多种因素促使猫头鹰猴离开父母
- 站长推荐
- 栏目推荐