首页>>登录,我要注册

肿瘤

深度学习模型助力发现癌症中新的基因突变!

作者:转化医学网 来源:转化医学网 日期:2022-06-19
导读

Hi-C技术已被证明是检测人类基因组结构变异(SVs)的一种有前景的方法。然而,目前严重缺乏能够使用Hi-C数据进行全范围SV检测的算法, 只能以低于最佳的分辨率识别染色体间易位和远程染色体内SVs(> 1mb)。最近,科学家们开发了一个深度学习模型,结合了深度学习和集成学习策略的框架,以高分辨率预测全范围的SVs。

关键字: 癌症 | 基因突变

Hi-C技术已被证明是检测人类基因组结构变异(SVs)的一种有前景的方法。然而,目前严重缺乏能够使用Hi-C数据进行全范围SV检测的算法, 只能以低于最佳的分辨率识别染色体间易位和远程染色体内SVs(> 1mb)。最近,科学家们开发了一个深度学习模型,结合了深度学习和集成学习策略的框架,以高分辨率预测全范围的SVs。

发表在《Science Advances》杂志上的一项研究称,一种机器学习模型已经帮助科学家发现了目前基因组测序无法检测到的数百种癌症基因突变

该研究的资深作者是Duane and Susan Burnham分子医学教授Feng Yue博士。Yue说:“这些发现为癌症分类和潜在疗法提供了新的靶点。”

Yue同时也是美国西北大学Robert H. Lurie综合癌症中心的生物化学、分子遗传学和病理学副教授,以及癌症基因组学中心主任, 他表示:“我们在癌症基因组中认识了许多先前未知的融合事件,也发掘了已知致癌基因的新型调控机制。”

在每个细胞内,DNA长链需要经过精确地折叠和编组,然后装配到直径只有几微米的细胞核内。此前,Yue和他的合作者表明,癌症基因组的结构变异,如逆转和易位,可以被Hi-C这类基因组分析工具中检测到。

这些模式能够被计算机算法识别为结构变异的指标。此外,这些巨大的结构变异通常会被全基因组测序 (WGS) ,甚至是Nanopore这样的长读测序(LRS)所忽略。Yue说:“WGS非常擅长于检测碱基对突变和短插入缺失,但很难检测更大的变异。”

在这项研究中,Yue和他的合作者从8个癌细胞系(A549,Caki2,K562,LNCaP,NCI-H460,PANC-1,SK-N-MC和T47D)中收集了一组的不同类型的高可信度结构变异。这些被用来训练一个深度学习模型—— EagleC,来学习埋藏在这些信号中的隐藏模式。EagleC的检测结果与传统基因组测序技术基本一致,WGS或Nanopore测序也发现了70~80%的基因组变异。

不同的是,EagleC发现了数百个被全基因组测序或长读测序遗漏的融合基因。根据Yue所说,这些新发现的融合基因占Hi-C所检测到的总遗传变异的10%-20%。

许多这样的融合事件引起了一个致癌基因和位于另一条染色体上的一个远端增强子之间的联系。这些事件被称为“增强子劫持”,会导致致癌基因上调。

在这项研究中,研究人员使用EagleC在100多个癌细胞系和患者样本中搜寻结构变异,发现了其他可能被全基因组测序遗漏的融合事件。Yue说,使用这个模型可以扩展对结构变异及其对癌症相关基因影响的认识。尤其对于前列腺癌和乳腺癌,这两种最常见的癌症也有很高的基因融合发生频率。

“我们能够判断具有基因融合的癌症和没有基因融合的癌症的治疗反应是否有差异。我们的发现也为癌症研究人员提供了许多控制关键致癌基因和途径的新型调控因子。”

EagleC还可用于检测数据稀少的单细胞Hi-C分析中的结构变异,这使得科学家能够检查单个癌细胞之间的异质性。在未来,Yue希望将这个模型应用到更多的癌症样本,并寻找针对当前研究中发现的新的基因融合的潜在药物。

分享:

相关文章

    评论

    我要跟帖
    发表
    回复 小鸭梨
    发表
    //站内统计//百度统计//谷歌统计//站长统计
    *我要反馈: 姓 名: 邮 箱:
    Baidu
    map