爱奇飞网

网站首页健康养生 >正文

研究人员发布了原生生物基因组项目的初始数据集

开心的月饼 2024-01-04 14:27:02 健康养生

原生生物是包括单细胞藻类和原生动物的单细胞真核生物,栖息在水生环境中。它们作为初级生产者和氧气发生器,在碳循环中发挥着至关重要的作用,是人类营养、生物能源和水生动物食物的重要来源。然而,它们也可能带来挑战,导致有害的藻华和赤潮,在共生关系中既是病原体,又是有益的伙伴。

研究人员发布了原生生物基因组项目的初始数据集

NCBI 分类系统已记录了超过 60,000 个已识别的原生生物物种。2019年12月,中国科学院水生生物研究所(IHB)牵头的科学家团队启动了原生生物万基因组计划(P10K)。该项目的主要目的是为原生生物创建一个综合遗传资源数据库。

近日,我所苗圩教授团队和中国科学院北京基因组研究所张章教授团队发布了P10K项目的初始数据集,现已可用,并发表了相关论文在核酸研究中。

P10K 发布的首批数据包括一整套 2,959 个原生生物数据集,其中包括 1,601 个基因组和 1,358 个转录组。在这些数据集中,有 1,858 个数据集来自公共数据库。P10K 团队对 1,101 个数据集进行了新的测序,主要关注纤毛虫。新测序的数据使原生生物数据集的总体规模扩大了 37%。

为了克服大规模单细胞组学数据带来的分析挑战,P10K团队开发了针对原生生物单细胞测序数据量身定制的标准化分析流程。该流程包括组装、净化、物种鉴定、基因注释和评估过程。

质量评估显示,与公共数据库中可用的数据相比,通过该管道注释的基因组显示出相似比例的中等和高质量数据。

研究人员相信,P10K数据库将促进真核起源、多样性和微生物相互作用的研究,以及原生生物遗传资源在生态保护、污染物降解、营养、健康和疾病预防方面的应用。此外,该数据库还将支持基于环境DNA(eDNA)的浮游生物识别,促进水生生态健康评估。


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行