2022年07月29日发布 | 1213阅读

【中国声音】XGBoost机器学习算法预测中重度创伤性脑损伤死亡率的效果优于回归模型

王若然

四川大学华西医院

王露萍

四川大学华西医院

徐建国

四川大学华西医院


第一作者:王若然,王露萍
通讯作者:徐建国
作者单位:四川大学华西医院


[REF: Wang R, Wang L, Zhang J, He M, Xu J. XGBoost Machine Learning Algorism Performed Better Than Regression Models in Predicting Mortality of Moderate-to-Severe Traumatic Brain Injury [published online ahead of print, 2022 Apr 14]. World Neurosurg. 2022;S1878-8750(22)00492-2. doi:10.1016/j.wneu.2022.04.044] PMID: 35430400

中重度颅脑损伤由于其高致残率和高死亡率而备受关注。为了避免和颅脑损伤病人的疾病进展和不良预后,临床医生应该对损伤的严重程度进行分类,并在损伤后早期识别预后不良的高危患者。


格拉斯哥昏迷评分被提出并在临床上使用了几十年,但是在评估颅脑损伤患者的损伤严重程度方面仍有不足。因此,既往许多研究都在构建针对颅脑损伤患者的更稳定、更精确的风险评分,例如IMPACT、CRASH和Marshall。所有这些预测模型都是基于包括logistic回归和Cox比例风险回归在内的广义线性方法开发的。然而,许多风险因素可能与患者结果呈非线性关系,因此传统的线性回归预测模型并不能合理纳入这些变量。


机器学习可以根据数据自动开发模型,并做出临床决策,以辅助医生的日常工作。既往研究探索了包括决策树、随机森林、支持向量机和朴素贝叶斯等几种经典的机器学习算法在预测颅脑损伤患者结局中的价值。由陈天奇设计的极度梯度增强(XGBoost)算法在计算速度和模型精度方面表现良好,受到了各个领域医学研究人员的广泛关注。本研究旨在验证XGBoost对中重度颅脑损伤患者病死率的预测价值,并将其准确性与传统的基于logistic回归的预后模型进行比较。


病例入组标准及研究路线

本研究纳入2015年1月至2019年6月因颅脑损伤入住华西医院的患者。排除标准如下:(1)入院时格拉斯哥昏迷评分>13;(2)首次颅脑损伤6小时后入院;(3)从其他医疗中心转入;(4)所需变量记录不完整。筛除后,368名中重度颅脑损伤患者纳入本研究。


记录患者的年龄、性别、损伤机制、瞳孔不等大、血压、入院时格拉斯哥评分和损伤严重程度评分。收集包括白细胞、血小板、葡萄糖、白蛋白、血红蛋白、凝血酶原时间在内的实验室检测指标。记录基于CT和MRI所识别的颅内损伤类型,包括硬膜外血肿、硬膜下血肿、蛛网膜下腔出血和弥漫性轴索损伤。


结果

本研究纳入的368例中重度颅脑损伤患者死亡率为55.7%。与幸存者相比,非幸存者的格拉斯哥评分较低(p<0.001),损伤严重程度评分较高(p<0.001)。实验室检测结果显示非幸存者的血糖(p<0.001)、凝血酶原时间(p<0.001)显著高于非幸存者,而血小板(p<0.001)、白蛋白(p<0.001)和血红蛋白(p<0.001)显著低于非幸存者。此外,非幸存者的硬膜下血肿发生率显著高于幸存者(p<0.001)。最后,非幸存者组的入住ICU时间(p<0.001)和住院时间(p<0.001)均较短。(表1)



在XGBoost模型中,格拉斯哥评分、凝血酶原时间和血糖在特征重要性方面排名前三(图1)。XGBoost模型预测死亡率的AUC值为0.955,显著高于传统logistic回归的0.805(图2)。XGBoost模型的准确性、敏感性和特异性分别为0.955、0.945和0.964。传统logistic回归的准确性、敏感性和特异性分别为0.703、0.738和0.754,均低于XGBoost模型。(表2)



讨论

本研究结果表明XGBoost算法在预测中重度颅脑损伤患者死亡率方面优于传统的logistic回归。既往研究探讨了包括支持向量机、决策树、随机森林、朴素贝叶斯和人工神经网络等不同机器学习算法在各种颅脑损伤患者中的预后价值。然而这些算法在基于不同颅脑损伤群体的各种研究中显示出不同的预后价值。一些研究甚至发现机器学习算法的表现并不优于传统的逻辑回归模型。这些结果的差异可能来源于颅脑损伤患者群体的差异、各医疗中心治疗策略的差异和算法优化方法的差异。尚无研究探索XGBoost算法在TBI患者中的预后价值。XGBoost算法基于梯度增强决策树,利用二阶泰勒展开式计算损失函数,在计算速度和预测精度方面都表现良好。

在我们的研究中,XGBoost算法中重要性排名前三的特征分别为格拉斯哥评分、凝血酶原时间和血糖。作为一种常规使用的评估颅脑损伤患者疾病严重程度的工具,格拉斯哥评分在特定的临床条件下显示出一些缺点。格拉斯哥评分的准确性会受到酒精、镇痛镇静以及气管插管的影响。因此,许多研究设计并开发新的预后模型,将其他临床和影像学特征与格拉斯哥评分结合以提高预测结局的稳定性和准确性。凝血酶原时间延长表明凝血功能下降,这可能与创伤患者大量出血、贫血、凝血因子的病理生理性消耗和大量晶体输注引起的血液稀释有关。先前文献报道颅脑损伤患者凝血障碍的发生率在10%-98%之间,且其与颅脑损伤患者预后显著相关。在我们的研究中,幸存者和非幸存者的凝血酶原时间中位数分别为13.0和14.9,这表明纳入的颅脑损伤患者中有很大比例存在凝血功能异常。作为公认的颅脑损伤不良预后的风险因素,高血糖可能与凝血障碍、脑代谢恶化、神经炎症和细胞凋亡相关。除了格拉斯哥评分、凝血酶原时间和血糖,瞳孔不等大、舒张压、损伤严重程度评分、年龄、白细胞、血小板和白蛋白在XGBoost模型中也显示出一定程度的重要性。基于这些特征,我们开发的XGBoost模型在预测中重度颅脑损伤患者住院死亡率方面表现出色,AUC为0.955。基于XGBoost算法的预后模型可以帮助临床医生评估中重度颅脑损伤患者的死亡率风险,并因此采取合适的治疗策略,加强医疗监护。


后记

XGBoost方法在预测中重度颅脑损伤患者的死亡率方面比logistic回归更有效、更精确。在未来,在移动电子设备中创建一个基于XGBoost算法的用户友好的程序有助于识别具有高死亡风险的颅脑损伤患者,从而指导医疗人员制定合适的治疗方案。


第一作者简介

王若然 博士研究生

四川大学华西医院

四川大学华西医院神经外科

一年级博士研究生,主要研究方向为神经肿瘤及神经重症

以第一作者身份发表多篇SCI论文,单篇影响因子最高5.71分

以第一主研身份参加四川省科技厅课题一项

获得2020年国家奖学金

Frontiers系列杂志审稿人


通讯作者简介

徐建国 教授

四川大学华西医院

医学博士后,教授,主任医师,博士研究生导师,神经外科主任

四川省学术和技术带头人,中国医师协会神经外科分会常委、颅底外科学组副组长,中国医疗保健国际交流促进会颅底外科分会副主任委员,中国研究性医院协会神经外科分会副主任委员,海峡两岸医药协会神经外科专委会颅底外科学组组长,中国医师协会神经修复学专业委员会脑肿瘤术后功能重建学组组长,四川省医师协会颅底神经外科学组组长,成都市医学会神经外科分会候任主任委员

擅长颅底外科(如垂体腺瘤、颅咽管瘤、鞍结节和蝶骨嵴脑膜瘤、前床突脑膜瘤、错构瘤、脊索瘤等),国内外核心期刊上发表论文100余篇,63篇刊登在Neurosurgery、J Neurosurg、J Neuro-oncology、Neurology等国外权威杂志上。主持国家自然基金面上项目3项,获得中华医学科技进步奖一等奖、教育部科技进步奖二等奖、国家发明专利1项,2016年“王忠诚医师奖”获得者


声明:脑医汇旗下神外资讯、神介资讯、脑医咨询、AiBrain所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。

最新评论
发表你的评论
发表你的评论
来自于专栏