重庆大学附属中心医院曾平等运用机器学习算法,通过基于CT平扫的最佳影像组学模型预测PH,并将该模型与基于临床和放射影像学的传统模型进行比较,结果发表在2022年6月的《Frontiers in Neurology》在线。
——摘自文章章节
【Ref: Yang Q, et al. Front Neurol. 2022 Jun 14;13:839784. doi: 10.3389/fneur.2022.839784. eCollection 2022.】
研究背景
创伤性颅脑损伤(traumatic brain injury,TBI)仍是全球范围内青少年死亡和严重残疾的主要原因。研究表明,脑挫伤患者伴有进展性出血(progressive hemorrhage,PH),患者的预后不良风险是无PH者的4倍。因此,早期识别PH尤为重要。影像组学分析可以从CT平扫成像中提取许多定量信息,捕捉肉眼无法评估的影像信息,已广泛应用于脑肿瘤、自发性脑出血等诊断,但用于颅脑外伤较少。重庆大学附属中心医院曾平等运用机器学习算法,通过基于CT平扫的最佳影像组学模型预测PH,并将该模型与基于临床和放射影像学的传统模型进行比较,结果发表在2022年6月的《Frontiers in Neurology》在线。
研究方法
该研究回顾2016年6月至2021年12月间经颅脑CT平扫确诊的脑挫伤并血肿形成患者的临床及影像学资料。与初始CT扫描相比,脑内血肿体积增加≥25%定义为PH。血肿体积采用ABC/2计算。研究者将患者的病灶影像资料以7:3随机分配到训练组(145例)和验证组(62例)。设计模型在训练组拟合,在验证组验证。利用后处理软件划定所有感兴趣区域(regions of interest,ROI)。采用开源Python软件包PyRadiomics从原始图像提取影像组学数据,包括信号强度特征、纹理特征、形状特征和高阶特征。利用滤波器依据上述特征计算高阶特征。结果自动提取2107个影像组学特征,包括414个一阶特征、14个形状特征、506个灰度共生矩阵(GLCM)特征、368个灰度区域大小矩阵(GLSZM)特征、368个灰度游程矩阵(GLRLM)特征、322个灰度依赖矩阵(GLDM)特征和115个邻域灰度差矩阵(NGTDM)特征。在影像组学中,验证组首先采用组内相关系数(ICC)分析识别具有高重复性和一致性的特征。当ICC>0.75时进行进一步分析。建立方差分析(ANOVA)模型,剔除无显著统计差异的特征。最后,采用Lasso算法(最小绝对值收敛和选择算子)并在训练组进行交叉验证。作者在训练组实施10种不同的机器学习(ML)算法,并通过交叉验证和网格搜索技术确定这些模型的最优参数。对每个选择的模型,生成受试者工作特征(ROC)曲线,并计算曲线下平均面积(AUC)来评估预测性能。同时使用学习曲线来确定模型是否过拟合。利用最优ML分类器,在训练组建立影像组学模型,并利用logit函数构建影像组学特征(Rad-score)。结合影像组学模型特征和临床放射学模型特征,采用LR算法建立联合模型,得出评估PH风险的列线图。训练组计算ROC-AUC、准确性、F1值、敏感性和特异性。采用测试数据对这三种模型的性能进行评估,并绘制决策曲线和校准曲线进行比较。利用约登指数分析法确定临界概率的最优阈值(临界值)。
研究结果
训练组的PH患者占51.03%(74/145),验证组占53.23%(33/62)。训练组的患者头皮血肿、GCS评分、发病至初次CT扫描时间、纤维蛋白原水平差异有统计学意义(p<0.01)。经ICC分析后,共有1494个影像组学特征可靠而且一致。经单因素方差分析显示,其中815特征具有显著统计学差异(p<0.05)。最后经LASSO算法筛选出12个显著特征。
在机器学习和影像组学组特征的构建中,作者采用5折交叉验证法评估不同算法在训练组和验证组的性能。除GNB,其算法在训练组都表现良好。而RF和Xgboost两种树模型在训练组出现过度拟合。SVM模型在验证组表现出良好的预测能力 (AUC=0.918),与训练组的结果相比不存在过拟合(AUC=0.879)。因此,作者采用SVM算法进行影像组学模型构建。分别得出训练组和验证组的影像组学评分(Rad-score)。
单变量Logistic回归分析表明,头皮血肿(p=0.008)、起病至初次CT扫描时间(p=0.013)和纤维蛋白原水平(p=0.014)是PH的危险因素。多变量分析表明,头皮血肿(p<0.0001)、起病至初次CT扫描时间(p=0.007)和纤维蛋白原水平(p=0.010)是PH的危险因素。
研究者在训练组以LR算法得出列线图,并由验证组进行预测。通过ROC-AUC、准确性、F1值、灵敏性和特异性等指标评估临床-放射学、影像组学和联合模型的性能。
联合模型在训练组拟合最好(AUC=0.937),DeLong检验结果表明,联合模型与其它两种模型有显著差异。此外,影像组学模型明显优于临床-放射学模型(p= 0.0002)。在其它指标中,联合模型的性能最好。在验证组,联合模型(AUC=0.853)显著优于其它两种模型。除特异性外,列线图其它指标均排第一。从标定曲线来看,组合模型在训练组和验证组都更接近理想;从决策曲线的角度看,使用列线图PH预测模型比没有Rad评分和Radiomics模型的预测更有利。在训练组进行HL检验时,只有联合模型的结果较好(p=0.4208>0.2),临床-放射学和影像组学模型的p值均小于0.05。在验证组,HL统计分析表明,临床-放射学模型拟合较差(p=0.0158<0.05)。影像组学(p=0.1686)和联合模型(p=0.184)充分拟合数据。
研究结论
影像组学模型预测PH优于传统的临床放射学模型。结合影像组学特征和临床放射学因素的列线图模型可以为预测PH值提供高效、便捷的工具。