爱奇飞网

网站首页生活常识 >正文

使用大型语言模型进行自主化学研究

开心的月饼 2023-12-27 17:34:29 生活常识

基于Transformer的大语言模型在各个领域取得了重大进展,例如自然语言处理1,2,3,4,5,生物学6,7,化学8,9,10和计算机编程11,12。在这里,我们展示了Coscientist的开发和功能,这是一个由GPT-4驱动的人工智能系统,通过整合由互联网和文档搜索、代码执行和实验自动化等工具支持的大型语言模型,自主设计、计划和执行复杂的实验。Coscientist展示了其加速六种不同任务研究的潜力,包括钯催化交叉偶联的成功反应优化,同时展示了(半)自主实验设计和执行的先进能力。我们的研究结果证明了像Coscientist这样的人工智能系统在推进研究方面的多功能性、有效性和可解释性。

使用大型语言模型进行自主化学研究

大型语言模型(LLM),特别是基于Transformer的模型,近年来正在经历快速发展。这些模型已成功应用于各个领域,包括自然语言1,2,3,4,5,生物学6,7和化学研究8,9,10以及代码生成11,12。_正如OpenAI所证明的,模型13的极端扩展已经在该领域取得了重大突破1,14。此外,诸如根据人类反馈进行强化学习等技术15可以显着提高生成文本的质量以及模型在推理其决策时执行各种任务的能力16。

2023年3月14日,OpenAI发布了迄今为止最强大的法学硕士GPT-414。尽管GPT-4的技术报告中有关模型训练、大小和使用的数据的具体细节有限,但OpenAI研究人员已经提供了该模型卓越的解决问题能力的实质性证据。这些包括但不限于SAT和BAR考试的高百分位数、LeetCode挑战以及图像的上下文解释,包括小众笑话14。此外,技术报告还提供了如何使用该模型解决化学相关问题的示例。

与此同时,化学研究的自动化也取得了实质性进展。示例范围从有机反应的自主发现17、18和优化19到自动流动系统20、21和移动平台22的开发。

实验室自动化技术与强大的法学硕士的结合为开发广受欢迎的自主设计和执行科学实验的系统打开了大门。为了实现这一目标,我们打算解决以下问题。法学硕士在科学过程中的能力是什么?我们可以实现什么程度的自治?我们如何理解自主代理做出的决策?

在这项工作中,我们提出了一种基于多法学硕士的智能代理(以下简称Coscientist),能够自主设计、规划和执行复杂的科学实验。Coscientist可以使用工具浏览互联网和相关文档、使用机器人实验应用程序编程接口(API)并利用其他法学硕士来完成各种任务。这项工作是独立完成的,并与自主代理23、24、25上的其他工作并行进行,ChemCrow26是化学领域的另一个例子。在本文中,我们在六项任务中展示了Coscientist的多功能性和性能:(1)使用公开数据规划已知化合物的化学合成;(2)有效地搜索和浏览大量的硬件文档;(3)使用文档在云实验室中执行高级命令;(4)用低级指令精确控制液体处理仪器;(5)解决需要同时使用多个硬件模块和集成不同数据源的复杂科学任务;(6)解决需要分析先前收集的实验数据的优化问题。

联合科学家系统架构

Coscientist通过与多个模块(网络和文档搜索、代码执行)交互以及进行实验,获得解决复杂问题所需的知识。主模块(“规划器”)的目标是通过调用下面定义的命令基于用户输入进行规划。Planner是一个GPT-4聊天完成实例,充当助手的角色。初始用户输入以及命令输出被视为发送给规划器的用户消息。Planner的系统提示(定义LLM目标的静态输入)以模块化方式设计1,27,描述为定义操作空间的四个命令:“GOOGLE”、“PYTHON”、“DOCUMENTATION”和“EXPERIMENT”。规划器根据需要调用每个命令来收集知识。GOOGLE命令负责使用“Web搜索器”模块搜索互联网,该模块本身就是另一个LLM。PYTHON命令允许Planner使用“代码执行”模块执行计算以准备实验。EXPERIMENT命令通过DOCUMENTATION模块描述的API实现“自动化”。与GOOGLE一样,DOCUMENTATION命令从源向主模块提供信息,在本例中是有关所需API的文档。在这项研究中,我们展示了与OpentronsPythonAPI和EmeraldCloudLab(ECL)符号实验室语言(SLL)的兼容性。这些模块共同组成了Coscientist,它接收来自用户的简单纯文本输入提示(例如,“执行多个铃木反应”)。该架构如图1所示。


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行