网站首页生活常识 >正文
剑桥大学领导的一项研究发现,GPT-4的临床知识和推理能力正在接近专科眼科医生的水平。GPT-4——一种“大语言模型”——针对不同职业阶段的医生进行了测试,包括非专业初级医生、实习医生和专家眼科医生。每个人都会看到一系列涉及特定眼部问题的87个患者场景,并被要求从四个选项中进行选择来给出诊断或治疗建议。
GPT-4在测试中的得分明显优于非专业初级医生,后者的眼科专业知识水平与全科医生相当。
GPT-4的得分与见习眼科医生和专家眼科医生相似,尽管表现最好的医生得分更高。
研究人员表示,大型语言模型不太可能取代医疗保健专业人员,但作为临床工作流程的一部分,有可能改善医疗保健。
他们表示,像GPT-4这样最先进的大型语言模型可能有助于在控制良好的环境中提供与眼睛相关的建议、诊断和管理建议,例如对患者进行分类,或者在接触专业医疗保健专业人员的机会有限的情况下。
ArunThirunavukarasu博士说:“我们可以实际部署人工智能来对有眼部问题的患者进行分类,以决定哪些病例属于紧急情况,需要立即由专家看诊,哪些病例可以由全科医生看诊,哪些不需要治疗。”该研究的主要作者是他在剑桥大学临床医学院就读时进行的。
他补充道:“这些模型可以遵循已经使用的清晰算法,我们发现GPT-4在处理眼部症状和体征以回答更复杂的问题方面与专业临床医生一样出色。
“随着进一步发展,大型语言模型还可以为那些难以从眼科医生那里获得及时建议的全科医生提供建议。英国人等待眼科护理的时间比以往任何时候都长。
需要大量的临床文本来帮助微调和开发这些模型,世界各地正在开展工作以促进这一目标。
研究人员表示,他们的研究优于之前的类似研究,因为他们将人工智能的能力与执业医生进行比较,而不是与一组检查结果进行比较。
“医生不会在整个职业生涯中复习考试。我们希望了解人工智能在与执业医生的现场知识和能力进行比较时的表现,以便提供公平的比较。”Thirunavukarasu说道,他现在是牛津大学医院NHS基金会信托基金的学术基础医生。
他补充道:“我们还需要描述商用模型的功能和局限性,因为患者可能已经在使用它们而不是互联网来寻求建议。”
该测试包括有关大量眼部问题的问题,包括极端光敏感度、视力下降、病变、眼睛发痒和疼痛,这些问题取自用于测试见习眼科医生的教科书。这本教科书无法在互联网上免费获取,因此其内容不太可能包含在GPT-4的训练数据集中。
“即使考虑到人工智能未来的使用,我认为医生仍将继续负责病人的护理。最重要的是让患者能够决定是否希望计算机系统参与其中。这将是每个患者做出的个人决定,”Thirunavukarasu说。
GPT-4和GPT-3.5(或“生成式预训练Transformer”)是在包含来自文章、书籍和其他互联网资源的数千亿单词的数据集上进行训练的。这是大型语言模型的两个例子;其他广泛使用的模型包括PathwaysLanguageModel2(PaLM2)和LargeLanguageModelMetaAI2(LLaMA2)。
该研究还使用同一组问题测试了GPT-3.5、PaLM2和LLaMA。GPT-4给出的响应比所有这些都更准确。
GPT-4为在线聊天机器人ChatGPT提供支持,为人类查询提供定制响应。近几个月来,ChatGPT在医学界引起了极大关注,因为它在医学院考试中取得了及格成绩,并在回答患者询问时提供了比人类医生更准确、更有同理心的信息。
人工智能大语言模型领域发展非常迅速。自这项研究进行以来,更先进的模型已经发布——可能更接近专家眼科医生的水平。
版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们
相关文章:
- 2024-04-29南极洲上空持续时间较长的臭氧空洞使海豹幼崽和企鹅幼崽暴露在更多的紫外线下
- 2024-04-28紧密共生的物种比你想象的要古老得多 也普遍得多
- 2024-04-27光学条形码扩大了高分辨率传感器的范围
- 2024-04-26冷冻铸造创建分层结构材料的指南
- 2024-04-26新的实验证据解开了血管组织工程的难题
- 2024-04-26科学家在恢复的斯诺夸尔米河栖息地限制和研究奇努克
- 2024-04-26K2中通过间隙阴离子电子的准二维自旋Peierls跃迁
- 2024-04-26研究人员建立了热障涂层热应力的高通量多尺度评估方法
- 2024-04-26新型有前景的钙钛矿型铁电材料铌酸铷的高压合成
- 站长推荐
- 栏目推荐