爱奇飞网

网站首页健康养生 >正文

研究团队开发植物性状遗传改良的快速流程

开心的月饼 2024-05-07 08:47:14 健康养生

对改善植物特定性状感兴趣的研究人员现在无需进行任何实验即可识别调节该性状表达的基因。

研究团队开发植物性状遗传改良的快速流程

普渡大学的KranthiVarala和10位合著者在《美国国家科学院院刊》上发表了新的基于网络的调控基因发现工具的详细信息。Varala正在申请一项专利,该专利与经济上重要的种子油生物合成相关。

普渡大学-美国农业部团队试图建立一个资源,从大量公开数据中学习,快速识别哪些称为转录因子的特殊基因调节各种植物物种中给定性状的表达。

“每项研究都集中在其中的少数几个,”园艺和景观建筑学助理教授瓦拉拉说。“我们的前提是,如果我们能够将所有数据放入单一分析中,那么我们就可以使用这些数据来构建全球性的东西。”

拟南芥作为PNAS研究的模型植物,“但这种方法与拟南芥没有任何特异性,”瓦拉拉说。“这种方法足够通用,你可以从玉米数据集开始。你可以用水稻、番茄,无论你正在种植的任何作物,只要你有人们已经完成的数千个基因表达测量。现在我们对十多个物种进行了数以万计的基因表达研究。”

为了证明该系统有效,该团队专注于调节植物如何在种子中制造和储存油的遗传途径。研究小组之所以选择这种性状,是因为它在食品和生物燃料生产中的重要性,而且涉及的300多个基因已经为人所知。

通过基因操纵植物的转录因子,研究人员可以增加或减少其种子中产生的油量。

与其他研究人员一样,瓦拉拉多年来开展了许多项目,他的目标是确定解决一个问题所涉及的基因和调节因子。这意味着要进行仔细、耗时的实验。但生成的数据未能提供他寻求的所有答案。他将其比作只知道所涉及的10个因素中的3个的方程式。

“你无法解出这个方程,”他说。同样,瓦拉拉经常想提出比数据所能回答的更多的问题。这促使他建立了一个框架,使用所有可能的数据来提出这些问题,而无需进行所有相关实验来获得需要基因验证的候选者列表。

“我正试图缩短最初的数据收集阶段,”瓦拉拉说,这样科学家就可以专注于进行基因验证。但要做到这一点,他的团队必须从基于18,000项个人研究的数据集开始。

瓦拉拉和他的团队使用普渡大学罗森高级计算中心的贝尔和现已退役的布朗超级计算机分析了这个庞大的数据集。该团队构建了一个机器学习框架来加快其他人的流程。

一个人手动完成这一任务是不可能的。团队可以做到这一点,但这会在团队成员处理数据的方式上引入偏差。机器学习分类器的运行没有偏见。

该方法的新颖之处在于,它不是提取与所有器官相关的数据,而是专注于特定器官的数据集。独立的基因网络调节这些器官——叶、根、芽、花和种子。

“我们说,在人们多年来所做的种子实验中,我们可以不使用所有器官,而是使用所有数据来了解种子中发生的事情,而不一定是根、叶或花吗?这改善了我们的方法很多,”瓦拉拉说。

该团队使用一种称为推理方法的计算方法来预测哪些转录因子将调节拟南芥中的种子油生物合成过程。

“我们所知道的那些帮助我们验证我们的方法是否正确工作。我们不知道的那些是寻找新生物学的良好候选者,”瓦拉拉说。“这种纯粹的计算方法对种子或石油或类似的东西一无所知。我们给它一个基因列表,它能够在不知道任何生物学背景的情况下重新发现已知的基因。”

主要作者、普渡大学园艺与景观建筑系博士后研究员RajeevRanjan选取了前20名中的另外12名,并询问这些预测是否属实。“我们能够为这十二个中的十一个产生突变系。这十一个中的五个确实改变了种子油含量,”他说。“此外,我们还表明,一种因子的过度表达可以使种子油含量增加高达12%。”

八个已知的调控基因加上八个新的调控基因表明,推理方法准确地识别了前20个候选基因中的13个。该方法的优点在于,仅根据基因列表工作,它就可以高精度预测哪些基因将调节感兴趣的性状。

“这花了很长时间来做,因为这是一个漫长而复杂的过程,而且不能保证它会起作用,”瓦拉拉在谈到这个为期四年的项目时说。“以前从未尝试过如此规模的事情。”


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行