2022年03月08日发布 | 1142阅读
肿瘤

基于全基因组拷贝数变化的机器学习模型预测成人弥漫性胶质瘤的 IDH 突变状态

马辰凯

墨尔本大学

邱天明

复旦大学附属华山医院

达人收藏




































































































































在该项研究中,作者使用来自癌症基因组图谱的786例成人弥漫性神经胶质瘤的体细胞拷贝数变异数据开发一个两阶段分类系统,用于识别1p/19q编码的少突胶质细胞瘤,并使用机器预测星形细胞肿瘤的IDH突变状态。结果发表在2021年12月的《Acta Neuropathologica Communications》在线。


——摘自文章章节

【Ref: Neuchterlein N, et al. Acta Neuropathol Commun. 2021 Dec 4;9(1):191. doi: 10.1186/s40478-021-01295-3.


研究背景




成人弥漫性神经胶质瘤由生物学和临床上三种不同的分子亚型组成,即以异柠檬酸脱氢酶(IDH)1和2的突变状态以及染色体1p和19q的共缺失定义,并进一步分为弥漫性IDH突变型胶质瘤。DNA测序是确定IDH突变状态的金标准,全基因组甲基化芯片和基因表达谱也可用于判断IDH突变状况。美国华盛顿大学神经病理学系医学和病理实验室的Nicholas Neuchterlein等的研究表明,通过全基因组体细胞拷贝数变化(SCNA)数据可以预测1p/19q共缺失和IDH突变状态。在该项研究中,作者使用来自癌症基因组图谱(TCGA)的786例成人弥漫性神经胶质瘤的体细胞拷贝数变异数据开发一个两阶段分类系统,用于识别1p/19q编码的少突胶质细胞瘤,并使用机器预测星形细胞肿瘤的IDH突变状态。结果发表在2021年12月的《Acta Neuropathologica Communications》在线。


研究方法



SCNA数据是成人弥漫性胶质瘤分子亚型的预测因子;每个成人弥漫性胶质瘤亚型都表现出独特的DNA结构。少突胶质细胞瘤的特征在于存在IDH突变和1p/19q-共缺失。成人IDH野生型弥漫性神经胶质瘤主要显示,同时获得整条染色体7和整条染色体10缺失(+7/-10)。IDH突变型星形细胞瘤的SCNA相对较少。


作者首先通过公共数据库确定SCNA的标准阈值。在多个独立的数据集中,作者确立85%的阈值是最优的阈值(MCC=0.97,MCC=0.97)。随后,分析TCGA患者数据,采用50%作为确定+7/-10状态的阈值。除TCGA验证集外,在三个独立验证集中,50%的阈值可以将所有组织学级别的IDH野生型弥漫性胶质瘤的+7和-10的双峰分布分开。


研究结果



之后,作者将包含成人弥漫性胶质瘤分子亚型预测系统第一阶段的1p/19q编码分类结果传输给系统的第二阶段——IDH突变分类。作者训练一个逻辑回归(LR)模型,构建这个分类,并通过最大化AUC实现优化。SHapley Additive exPlanations(SHAP)算法为每个患者的每个染色体臂分配一个值,表明该染色体臂的SCNA状态模型为该患者的预测贡献比例。作者的IDH突变分类的交叉验证预测SHAP分析表明,染色体臂10q的丢失推动IDH野生型的预测,并且染色体20q和1p的增益比10p丢失或7p和7q增益更具区分特性。


接着,作者在REMBRANDT数据库中对其预测模型进行验证。对模型置信度大于70%的所有REMBRANDT患者的预测表明,无论肿瘤组织学分级如何,预测的IDH野生型胶质瘤与TCGA中的IDH野生型胶质母细胞瘤具有相似的生存轨迹和中位总生存期。


结论



综上所述,作者应用全基因组SCNA成功开发一个预测工具可稳健地预测弥漫性神经胶质瘤中的1p/19q共缺失和IDH突变状态。在成人弥漫性胶质瘤研究中该工具可准确区分肿瘤的分子亚型。作者在REMBRANDT研究中确定1p/19q共缺失少突胶质细胞瘤、IDH野生型胶质母细胞瘤和IDH突变型星形细胞瘤的患者;还提出基于证据的分类阈值,用于从基因级SCNA数据中协调1p/19q共缺失和+7/-10。


20.png


声明:脑医汇旗下神外资讯、神介资讯、脑医咨询所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。

最新评论
发表你的评论
发表你的评论