美国夏洛茨维尔弗吉尼亚大学卫生系统神经外科的Natasha Ironside等运用卷积神经网络从自发性脑出血CT扫描推导并验证血肿体积的全自动分割计算法,结果发表在2019年12月的《Storke》杂志上。
——摘自文章章节
【Ref: Ironside N , et al. Stroke. 2019 Dec;50(12):3416-3423. doi: 10.1161/STROKEAHA.119.026561. Epub 2019 Nov 18.】
研究背景
自发性脑出血(spontaneous intracerebral hemorrhage,ICH)患者的治疗决策和预后,受初始颅内血肿体积和血肿进展的影响。CT平扫是评估血肿量最常用的神经影像学方法。美国夏洛茨维尔弗吉尼亚大学卫生系统神经外科的Natasha Ironside等运用卷积神经网络(convolutional neural networks,CNN)从自发性脑出血CT扫描推导并验证血肿体积的全自动分割计算法(fully automated segmentation algorithm),结果发表在2019年12月的《Storke》杂志上。
研究方法
CNN数据集包含脑出血预后项目(Intracerebral Hemorrhage Outcomes Project,ICHOP)的300例患者住院时的CT扫描结果。将纳入CNN数据集患者进行随机分配,选取前40例作为测试数据集,其余260例为训练数据集。分割计算法分两个阶段:第一阶段,在训练数据集中,由一名工作者对CT扫描进行人工分割;利用训练数据集的人工分割计算法获得全自动分割计算法。第二阶段,由两位工作者对测试数据集的每一次CT扫描都进行手工和半自动分割计算。为评估内部可靠性,作者从测试数据集随机选择10次CT扫描,最少每隔7天重复进行人工和半自动分割计算。应用开源软件3D Slicer 4.8在每个三维CT图像堆栈的二维切片上,手动跟踪ICH高密度进行人工分割计算;应用Analyze 12.0软件进行半自动分割计算;在ICH高密度周围设置一个极限边界,随后在感兴趣的区域内放置一个种子点,使用区域生长Hounsfield单位强度阈值工具(44-100HU)分割颅内血肿。对于人工和半自动分割计算方法,取两个独立评分者测量分值的平均值。记录从测试数据集的每次CT扫描时间。将收集到的数据转换成二通道数组格式,使用双三次插值调整输入矩阵为1×256×256。为了限制网络输入的动态范围,对原始灰度CT图像应用30-130HU的阈值进行加窗。通过减去所有CT数据的平均值并除以灰度水平的SD,然后对每个切片进行像素化处理从而达到归一化处理。ICH体积测量的CNN构架由一个收缩和扩展的拓扑结构组成。为保持非线性同时最大化计算效率,CNN实现一系列3×3的卷积核。使用联接平均和最大池操作来实现特征图大小的向下采样。修正后的线性单元用于所有非线性函数,它允许在反向传播过程中通过稳定梯度来训练深度神经网络。为限制层激活漂移,在卷积层与整流线性单元层之间使用批量归一化。为防止过拟合,作者使用50%信号丢失和L2正规则化,在最后一层使用1×1的卷积,将每个64分量的特征向量映射到所需的类数。总体来说CNN由31个卷积层和7个池化层组成(图1)。
图1. 卷积神经网络构图。
为推导辅助空间不变模型,训练数据通过应用,包括平移、旋转、缩放和剪切在内的仿射变形扩充。弹性变形由随机位移场的高斯卷积SDσ组成,σ表示弹性系数。从高斯分布中提取初始的核权值,然后使用Adam(一种利用Nesterov动量的自适应矩估计优化器)对模型进行优化。将像素方向的骰子系数(dice coefficient,DC)应用到最终的特征图,进行损失函数计算。DC是用来测量两个样本之间空间重叠程度的统计量。使用训练后的模型,从测试数据集对其ICH进行分割,采用骰子系数(定义为每次CT扫描测试和参考ICH分割节段之间的相似值,取值范围0-1)进行模型的性能评估。二次性能参数,包括Hausdoff距离(定义为每次CT扫描测试和参考ICH分割边缘之间的最大距离)、表面距离(每次CT扫描测试和参考ICH分割边缘之间的平均距离)、相对体积变异(每次CT扫描测试和参考ICH分割体素数量之差除以参考ICH分割的体素数量)。
CNN数据集包含300例患者的397次住院CT扫描,共12968张2维切片。训练数据集包含260例患者的357次住院CT扫描,共11566张2维切片,测试数据集包含40例患者40次住院CT扫描,共1412张2维切片。CNN接受100次训练,批量大小为32,初始学习率为0.0001。以人工分割计算法为参考标准,全自动分割计算法的平均体积DC、Hausdoff距离、表面距离和相对体积变异分别为0.894±0.264、218.84±335.83mm、5.19±23.65mm和17.96±14.55%。以半自动分割计算法为参考标准时,全自动分割计算法的平均体积DC、Hausdoff距离、表面距离和相对体积变异分别为0.905±0.254、277.69±368.04mm、5.09±16.47mm和16.18±14.18%。
研究结果
测试数据集的人工分割、半自动分割和全自动分割计算方法的差异无统计学意义(p=0.915)。比较人工、半自动和全自动分割计算脑内血肿的散点图(图2),全自动与人工分割计算(R2=0.981;0.960–0.990;p<0.0001)、全自动和半自动分割计算(R2=0.978;0.960–0.989;p<0.0001)、半自动和人工分割计算(R2=0.990;0.985–0.996;p<0001)之间均存在强关联。
图2. 测试数据集中,比较人工、半自动和全自动分割计算脑出血体积的散点图。A.每个人工分割、半自动分割与全自动分割计算方法的比较;B.全自动与人工分割计算的比较;C.全自动与半自动分割计算方法的比较;D.半自动与人工分割计算方法的比较。
每次CT扫描颅内血肿分割计算体积的绘制差异在视觉检查上具有可比性。人工与半自动分割方法的可信度分别为0.973(p<0.001)和0.978(p<0.001)。人工和半自动分割方法的可信度分别为0.975(p<0.001)和0.988(p<0.001)。测试数据集的人工、半自动和全自动分割计算体积的平均时间分别为201.45±92.22s、288.58±160.32s和11.97±2.70s。三种分割计算方法的体积分析时间有显著差异(p<0.0001)。全自动分割计算法比半自动算法(平均差异=−276.61s;p<0.0001)和人工分割计算法(平均差异=−189.48s)要快。半自动分割计算法比人工分割计算法慢(平均差异=87.13s;p=0.002)。
结论
综上所述,自发性脑出血量的全自动分割计算法速度明显快于半自动和人工分割计算法,有助于决定幕上自发性脑出血患者的治疗决策和预测结果。为确定其在临床中的适用性,还需对全自动分割计算法进行外部验证。