爱奇飞网

网站首页教育知识 >正文

研究引文的机器学习分析凸显了联邦资助基础科学研究的重要性

开心的月饼 2023-09-20 09:57:37 教育知识

根据人工智能推动的一项新分析,旨在改善人类健康的生物医学研究尤其依赖于公共资助的基础科学。“我们发现,尽管美国国立卫生研究院资助的研究占已发表科学文献的10%,但这些已发表的论文约占实质性研究的30%——支持更多新科学发现的重要贡献——引用威斯康星大学麦迪逊分校信息学院(计算机、数据与信息科学学院的一部分)的教授B.IanHutchins说道。“这是一个相当大的过度代表性。”

研究引文的机器学习分析凸显了联邦资助基础科学研究的重要性

哈钦斯和合著者特拉维斯·霍普(现为疾病控制与预防中心的数据科学家)和威斯康辛大学麦迪逊分校研究生萨尔萨比尔·阿拉比最近在《美国国家科学院院刊》上发表了他们的发现。

发表的研究论文通常包括冗长的部分,引用所有先前支持或在研究中引用的工作。您现在正在阅读的哈钦斯和霍普撰写的论文“在没有全文的情况下预测实质性生物医学引用”在其“参考文献”部分引用了不少于64项其他研究和来源。

引用代表了知识从一位科学家(或一组科学家)向另一位科学家的转移。引文被广泛编目和跟踪,以衡量个别研究和进行这些研究的个人的重要性,但并非任何特定论文中包含的所有引文都对它们所描述的研究做出同样重要的贡献。

“我们被教导,作为科学家,当我们提出事实主张时,我们应该用某种经验证据来支持它,”哈钦斯说。“就像在维基百科条目中一样,你不能有‘此处需要引用’的小标志。你必须添加该引用。但如果你引用的事实实际上并没有描述你所建立的关键先前工作,那么它并不真正支持这样的解释,即引用代表了获得结果的必要的早期步骤。”

哈钦斯和他的合作者认为,在出版过程后期添加的引文,比如应同行评审员(评估提交给期刊的科学论文的主题专家)要求出现的引文,不太可能对作者的研究真正重要。

哈钦斯说:“如果你是在其他人的工作基础上进行构建,你可能会在研究过程的早期就确定这项工作。”“这并不意味着手稿早期版本中的所有参考文献都是重要的,但重要的参考文献可能更集中在早期版本中。”

为了区分早期和晚期,研究人员训练了一种机器学习算法,通过从38,000多篇学术论文中提供引用信息来判断引用的重要性。每篇论文的引文数据都有两个版本:预印本版本,在同行评审之前公开发布,以及经过同行评审的最终发布版本。

该算法找到了一些模式来帮助识别对每篇已发表的科学论文更可能重要的引文。这些结果显示,美国国立卫生研究院资助的基础生物科学出现在较重要的引用中的比例是其在所有已发表研究中所占份额的三倍。

哈钦斯说:“联邦对基础研究的资助一直受到公众和国会领导层的严格审查。”“这给我们提供了一些证据,而不仅仅是轶事,表明这种基础研究资金对于刺激临床研究(对人们的治疗和治愈)确实很重要,而国会往往更容易接受资金。”


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行