爱奇飞网

网站首页健康养生 >正文

AI通过液体活检中的DNA重复检测癌症

开心的月饼 2024-03-18 08:39:23 健康养生

约翰·霍普金斯大学金梅尔癌症中心的研究人员开发了一种机器学习策略,该策略显示出通过检测癌组织和细胞基因组中的重复基因序列​​来预测人类早期肺癌或肝癌病例的潜力。-游离DNA(cfDNA)。研究小组认为,这种新方法可以提供一种非侵入性的方法来检测和表征癌症,或监测抗癌治疗的反应。

AI通过液体活检中的DNA重复检测癌症

在实验室测试中,这种名为ARTEMIS(疾病重复元件分析)的方法检查了1,200多种类型的重复元件(占人类基因组的近一半),并发现大量以前不知道与癌症相关的重复元件发生了改变。在肿瘤形成中。研究人员还能够识别cfDNA(血液中存在的肿瘤脱落的片段)中这些元素的变化,从而提供一种检测癌症并确定其在体内起源的方法。

“当你想到现有的癌症基因和它们周围的DNA序列时,你会发现它们充满了这些重复序列,”该研究的共同领导者、肿瘤学教授兼癌症研究中心联合主任VictorE.Velculescu博士说。约翰霍普金斯金梅尔癌症中心的遗传学和表观遗传学项目。“在ARTEMIS之前,基因组的暗物质基本上被忽略了,但现在我们发现这些重复并不是随机发生的,”Velculescu说。“它们最终聚集在癌症中以各种不同方式改变的基因周围,让我们第一次看到这些序列可能是肿瘤发展的关键。”

Velculescu与同事,包括联合领导者、约翰·霍普金斯大学医学院的医学博士/博士生AkshayaAnnapragada和约翰·霍普金斯大学肿瘤学副教授RobertScharpf博士,报告了ARTEMIS的开发和测试,发表在《科学转化医学》上的一篇题为“癌症和无细胞DNA中的全基因组重复景观”的论文中。他们在报告中得出结论,他们的分析“……揭示了人类癌症重复情况的广泛变化,并提供了一种检测和表征方法,有利于患者的早期检测和疾病监测。”

作者写道,DNA序列的重复,通常被称为“垃圾DNA”或“暗物质”,存在于整个人类基因组中,并且是“癌症和其他疾病的标志”。“基因组重复序列占人类基因组的一半以上,包括一组不同的元素,这些元素在个体之间差异很大,并对基因组结构和功能产生关键影响。”然而,他们继续说,使用标准测序方法表征这些重复序列一直具有挑战性。

“由于短读比对的技术限制以及对不完整基因组组装的依赖,重复在历史上一直被忽视。”用于人类癌症检测和全基因组表征的液体活检的发展使科学家能够开始分析游离DNA(cfDNA)中的重复序列。然而,值得注意的是,“……尚未对任何人类癌症的组织或cfDNA中的重复序列进行系统分析,这主要是由于无法以全基因组方式识别和量化重复序列。”

为了解决这些现有的挑战,该团队开发了ARTEMIS,他们将其描述为一种无需比对的全基因组方法,用于分析短读长测序中的重复景观。在一系列实验室测试中,研究人员首先检查了定义独特重复的12亿kmers(DNA短序列)的分布,发现它们富含人类癌症中常见改变的基因。

例如,他们报告说,在已知驱动癌症的736个基因中,有487个基因的重复序列数量平均比预期高15倍。这些重复序列在涉及细胞信号传导途径的基因中也显着增加,而这些信号传导途径在癌症中通常失调。“……这些重复kmer定位的观察表明,在肿瘤发生过程中,可以使用重复相关的基因组变化来选择影响人类癌症致癌途径的关键基因的改变,”该团队指出。

ARTEMIS方法概述,该方法揭示了癌症患者样本中12亿个独特的kmers,涵盖1,280个不同的重复元件。

ARTEMIS方法概述,该方法揭示了癌症患者样本中12亿个独特的kmers,涵盖1,280个不同的重复元件。[Annapragada等人,科学。译。医学。16、adj9283(2024)]

利用下一代测序技术,研究人员可以快速检查整个基因组的序列,研究人员还研究了癌症中的重复序列是否被直接改变。

他们使用ARTEMIS分析了参与泛癌症全基因组分析(PCAWG)的525名患有不同癌症的患者的肿瘤和正常组织中超过1,200种不同类型的重复元件。分析发现每个肿瘤中平均有807个改变的元素。其中近三分之二的元素此前并未在人类癌症中被观察到发生改变。研究小组报告说:“与匹配的正常组织相比,肿瘤中平均有807个重复元件(范围为246至1280)的kmer计数增加或减少。”“近三分之二的改变元素(1280个中的820个)以前没有在人类癌症中观察到发生改变。”

然后,他们使用机器学习模型为每个样本生成ARTEMIS评分,以提供可预测癌症的全基因组重复元件变化的摘要。ARTEMIS评分以高性能区分525名PCAWG参与者的肿瘤和正常组织,在所有分析的癌症类型中,曲线下总面积(AUC)=0.96,其中1是满分。无论肿瘤类型如何,ARTEMIS评分的增加都与较短的总生存期和无进展生存期相关。

“尽管不同个体之间的重复元件存在种系变异,但交叉验证的ARTEMIS评分能够区分525个PCAWG肿瘤和正常组织,并且在所有分析的癌症类型中均具有高性能,无论患者的种族如何[总曲线下面积(AUC)=0.96]“他们说。“鉴于ARTEMIS评分捕获了重复景观的全基因组变化,我们的观察结果与之前的分析一致,表明癌症基因组中重复元件的重新激活和增加可能会导致免疫反应增加或基因组不稳定性增加,这两种机制都可以减少肿瘤细胞健身并改善患者的治疗效果。”

研究人员接下来评估了ARTEMIS在非侵入性癌症检测方面的潜力。他们将该工具应用于参与丹麦肺癌筛查研究(LUCAS)的287名患有和未患有肺癌的个体的血液样本。ARTEMIS对肺癌患者进行分类,总体AUC为0.82。当与另一种称为DELFI(早期拦截片段的DNA评估)的方法一起使用时,组合模型对肺癌患者进行分类,AUC为0.91。DELFI是Velculescu、Scharpf和他们小组的其他成员之前开发的一种检测方法,用于检测基因组中cfDNA片段的大小和分布的变化。

在208名有肝癌风险的个体中也观察到了类似的表现,其中ARTEMIS检测到患有肝癌的个体以及其他患有肝硬化或病毒性肝炎的个体,AUC为0.87。与DELFI联合使用时,AUC增加至0.90。

最后,研究小组评估了ARTEMIS血液测试是否可以识别癌症患者体内肿瘤的起源位置。当使用PCAWG参与者的信息进行训练时,该工具可以对12种肿瘤类型中的肿瘤组织来源进行分类,平均准确率为78%。

研究人员随后将ARTEMIS和DELFI结合起来,评估了226名患有乳腺癌、卵巢癌、肺癌、结直肠癌、胆管癌、胃癌或胰腺癌患者的血液样本。在这里,模型正确地将患者分类为不同的癌症类型,平均准确率为68%,当允许模型建议两​​种可能的肿瘤类型而不是单一癌症类型时,该准确率提高到83%……“尽管样本数量很少可用于训练时,我们发现ARTEMIS-DELFI正确地将检测到的患者分类为不同的癌症类型,对于最高或最高的两个预测,平均准确率分别为68%或83%,”他们表示。

Annapragada说:“我们的研究表明,ARTEMIS可以揭示全基因组重复景观,反映人类癌症的巨大潜在变化。”“通过阐明所谓的‘黑暗基因组’,这项工作提供了对癌症基因组的独特见解,并为全基因组重复景观作为基于组织和血液的生物标志物用于癌症检测、表征提供了概念验证。和监控。”

作者进一步写道,“对基于cfDNA的肺癌、肝癌和其他癌症检测的重复景观分析表明,单独使用ARTEMIS或与其他全基因组特征相结合,可以为无创检测、监测和组织起源确定提供途径。ARTEMIS可以通过识别全基因组变化来改善早期诊断,当未检测到突变或染色体臂变化等肿瘤特征时,这些变化在其他液体活检方法中可能不明显。”

Velculescu表示,接下来的步骤将是在更大规模的临床试验中评估该方法。论文中概述了Velculescu与其他作者的利益冲突。Velculescu评论道:“你可以想象这可以用于多种癌症类型的早期检测,而且还可以用于其他应用,例如监测治疗反应或检测复发。”这是一个全新的领域。”

作者在报告中承认他们的研究存在局限性,“鉴于基因组这些区域的大小、多样性和潜在的临床相关性,我们的研究提供了对癌症基因组的独特见解,并为癌症基因组的实用性提供了概念证明。全基因组[序列]重复景观作为组织和血液生物标志物……此外,现在可以全面识别的重复元件的扩展或收缩提供了一种新的方法来检测和检查影响癌症和其他疾病的机制。”


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行