2024年01月17日发布 | 147阅读

【文献快递】垂体腺瘤分类:改进现行系统的工具

张南

复旦大学附属华山医院

达人收藏

《Free Neuropathology》杂志 2024 年1月1origin在线发表美国明州 Minneapolis的Abbott Northwestern Hospital,的William Charles McDonald 撰写的《垂体腺瘤分类:改进现行系统的工具Pituitary adenoma classification: Tools to improve the current system》(doi: 10.17879/freeneuropathology-2024-5226. )。


世界卫生组织垂体瘤分类为病理学家和研究人员分类垂体腺瘤提供了一个框架。从执业病理学家的角度来看,这种分类可以通过以更标准化的方式汇集免疫组织化学数据,并通过有意区分有助于分类的特征和那些不有助于分类的特征来改进。本文阐述了一种检查垂体前叶肿瘤由免疫组织化学染色组成的分类特征的一般工作流程,以促进辩论和推进基于证据的分类框架。


引言:改进的机会

每个病理学家都在他们的职业生涯中建立或调整工具,以更好地描述他们在实践中遇到的疾病。对于肿瘤,这通常是从熟悉疾病的显微镜光谱、常见受影响个体的人口统计学特征和常见临床表现开始的。有意识或无意识地,我们建立了一个特征列表,我们发现对疾病分类有用,然后继续改进分类或提供额外的预后或预测信息。


仅凭个人经验来诊断疾病是不可靠的,因为肿瘤在外观上重叠,而人类的判断充满了各种认知偏差。概括和简单的启发式可能会有所帮助,但数据是检验我们的假设和开发更好的分类工具所必需的。


理想情况下,世界卫生组织(WHO)第5版垂体瘤分类将为病理学家提供一个坚实的基于证据的分类,以帮助诊断。然而,目前的系统有几个缺点,阻碍了其准确和可重复分类垂体腺瘤的能力,包括:

●未能仔细区分用于分类的特征和其他描述性变量,其中一些可能在估计预后或预测治疗反应中起作用。病理学家的首要任务之一是决定进行哪些辅助检查以准确地进行肿瘤分类。也可以采用其他测试,但我们的首要目标通常是对有问题的疾病进行分类。


●关于什么是阳性测试的模糊语言。没有提供澄清什么是“有限”、“多变”或“局灶性”免疫反应性(what constitutes "limited", "variable", or "focal" immunoreactivity)的说明。


●未经证实的关于可能连续变量分布的说法,特别是细胞成熟度、嗜酸性或细胞颗粒度(Unproven claims about the distribution of presumably continuous variables, specifically cellular maturity, acidophilia, or cytoplasmic granularity.)。问问你自己:“我们用什么尺度来衡量成熟度、嗜酸性或颗粒度?”这些变量是非常主观的,在大多数情况下是没有帮助的。除了稀疏颗粒性生长激素细胞腺瘤(纤维小体已被分类并用作颗粒度的代表)外,泌乳素细胞腺瘤或促肾上腺皮质激素细胞腺瘤的颗粒度谱尚未得到充分的描述。虽然在生长激素细胞腺瘤中颗粒度可能本质上是双峰的,但其他腺瘤谱系或类别不一定是双峰的。


●缺乏负面对照的文献。阴性对照组允许特异性计算。由于没有足够的阴性对照,因此缺乏上下文,使得超微结构发现的说明,例如球棘(spheridia),无法验证。多谱系和多激素肿瘤在肿瘤谱系之间和内部显示模糊的界限,进一步强调了阴性对照的重要性。也就是说,如果像α亚基这样的标记可以在任何谱系中出现(或不出现),那么它有多大用处呢?目前,我们无法用任何严谨的统计数据来回答这个问题。


●未经证实的概括(Unsubstantiated generalizations)。例如,对于成熟的多激素PIT1谱系腺瘤,“ER和GATA3阳性”的笼统说法是基于仅包括少数此类肿瘤的单一参考文献( DOI: 10.1038/s41379-018-0167-7.)。相反,我们被迫满足于过于笼统的陈述,以获得更高的准确性;例如,“大多数”未成熟PIT1谱系腺瘤被认为表达α亚基、ER和GATA3。当然,可以引用数据来改进这种广泛的概括。


●小的数字(Small numbers)。关于GATA3免疫组织化学(IHC)在PIT1谱系肿瘤中的作用的说明尤其令人关注。只有少数引用GATA3的原始数据,只有Mete等显示GATA3在53个PIT1谱系肿瘤中的10个中具有免疫反应性。此外,在该系列中,GATA3免疫阳性被定义为大于或等于5%的肿瘤细胞,这是一个非常宽容的临界值(GATA3 immunopositivity was defined in that series as greater than or equal to 5% of neoplastic cells, a very permissive cutoff)。在该系列中,只有3个PIT1谱系腺瘤表现出弥漫性免疫反应性。


●缺乏支持的超微结构论点。例如,Horvath等在15例早期嗜酸性干细胞腺瘤中发现了6例小线粒体(small mitochondria );鉴于在嗜酸干细胞腺瘤中可能发现的广泛范围,因此尚不清楚哪些额外的特征将被证明对支持这种特殊的肿瘤类型有用。


●“多激素”和“多谱系”的混淆。使用WHO第5版分类,目前有可能仅通过单一激素阳性染色来诊断多激素肿瘤。相反,在临床实践中偶尔会遇到同一谱系的多个同步肿瘤,但似乎不适合“不同谱系的多个同步腺瘤”(it is currently possible to diagnose a plurihormonal tumor with only a single positive hormone stain. Conversely, multiple synchronous tumors within the same lineage are occasionally encountered in clinical practice, but do not appear to fit within the group "multiple synchronous adenomas of distinct lineages")。


●未能解决标记物共表达等技术障碍,这在PIT1谱系肿瘤中尤为重要(Failure to address technical hurdles like marker co-expression, which is especially important in PIT1 lineage tumor)。例如,是否需要双重或多重免疫组化来确定泌乳素生长激素细胞瘤(mammosomatotroph tumors)的诊断?我们一定要用电子显微镜吗?如果我们必须求助于电子显微镜,相关超微结构发现的敏感性和特异性是什么?虽然世卫组织委员会不认可特定的检测,但标记物共表达是垂体腺瘤分类的一个基本特征,需要加以解决(marker co-expression is a fundamental feature of pituitary adenoma classification that needs to be addressed)。


在我进一步讨论之前,让我先谈谈命名法在垂体肿瘤对话中所扮演的不必要的突出角色。我同意Ho等的观点,即“垂体神经内分泌肿瘤”(PitNET)的令人信服的病例还没有被提出,尽管它的倡导者非常突出。由于根据WHO第5版分类,仍然允许使用“垂体腺瘤”一词,因此我这样做,并请求PitNET标签的热情追随者的原谅。无论如何,这样的学术辩论不如世界卫生组织垂体肿瘤分类的缺陷那么重要,并且分散了对更重要问题的关注[ a compelling case for "pituitary neuroendocrine tumor" (PitNET) has not been made, despite the prominence of its advocates.  As it is still permissible to use the term "pituitary adenoma" according to the 5th edition of the WHO classification , I do so, and beg forgiveness from passionate adherents to the PitNET label.  In any event, such academic debates are less substantial than deficits in the WHO classification of pituitary tumors, and distract from more important concerns.]。


改进WHO分类

只提出这些批评而不提出改进的办法是有害的。更好的方法是可用的,并且已经被采用,例如DNA甲基化分析的构筑师,现在已经从它在德国的起源传播到世界其他地方的实验室,包括北美。毫不夸张地说,甲基化分析已经从根本上改变了我们对中枢神经系统肿瘤分类的理解,并准备对其他系统中产生的肿瘤进行这样的研究。


然而,在我们放弃目前使用甲基化分析而使用免疫组化进行垂体腺瘤分类的策略之前,我认为可以从甲基化分析的经验中提取两个关键教训,以改进我们基于免疫组化的方法。首先,任何建立分类系统的尝试都需要对包括所有相关肿瘤类别在内的大量病例进行登记和比较。如果没有收集大量的病例,甲基化分析是不可能成功的。在甲基化分析工作中,病例需要被整合到包含所有相关肿瘤类别的数据库中;这与目前出版有限的、高度偏倚的系列的常见做法相反,这些系列旨在说明而不是测试分类或分类变量。其次,必须选择对分类有用的诊断特征,并在整个注册表中统一应用。事实上,WHO垂体瘤分类的作者似乎意识到了这一点,并建议在垂体腺瘤的常规评估中进行“完整的染色组”(大概是所有可能与垂体腺瘤诊断相关的免疫组化)。尽管如此,从“完整的染色组”中获得的数据几乎从未在支持文献中提供过,这些文献往往包括对罕见肿瘤类型和个体分类变量的评论或有偏见的收集,而没有进行其他测试的文件来证实结论。世卫组织作者关于α亚基和GATA3的免疫组化索赔尤其令人担忧,因为它们缺乏背景和/或已发表病例数量少。


一个可能的工作流程,以解决所指出的挑战,其中包括这些来自甲基化分析的教训,这里提供一个使用以前发表的病例数据的说明。病例选择、术前数据记录、组织微阵列(TMA)构建、免疫组化和评分如前所述。除了先前报道的染色外,我们还对GATA3 (HG3-31 (sc-268), Santa Cruz Biotech, 1:100稀释)和雌激素受体(α) (SP1, Thermo Scientific, 1:160稀释)进行了IHC检测。简而言之,我们将来自Allina Health (n = 136)和宾夕法尼亚大学(n = 21)的157例垂体腺瘤纳入TMA,并用指定的IHC染色。采用Allred方法进行盲法免疫组化评分,根据免疫组化评分中位数,使用临床和血清学数据确定腺瘤分类。为了便于分析,我们安排了一个简化的管理班,但这个班并不监督机器学习的过程。


估计分类变量之间的相关性

为了开始我们的思想实验,分类变量应该与其他描述性变量区分开来,并明确说明。这有助于在分类问题上建立限制,并允许对诊断算法进行更精细的讨论。这也是在这些变量之间建立关系的重要步骤。在我们的工作中,“完整的染色面板”(即分类变量)包括免疫组化检测SF1、PIT1、TPIT、GATA3、α亚基、促黄体生成素(LH)、卵泡刺激素(FSH)、泌乳素、促甲状腺激素(TSH)、生长激素、雌激素受体、细胞角蛋白CAM5.2和促肾上腺皮质激素(ACTH)。当考虑我们的一系列垂体腺瘤时,变量之间的相关性很容易在矩阵中显示出来(图1)。

图1比较免疫组织化学染色的相关矩阵,使用分层聚类排序。界面显示相关系数。缩写:ACTH,促肾上腺皮质激素;ASU: α亚基;CAM 5.2,细胞角蛋白CAM 5.2;ER,雌激素受体;FSH,卵泡刺激素;GH,生长激素;LH:促黄体生成素;SF1,类固醇生成因子1;TPit:T-box转录因子;TSH,促甲状腺激素


很容易看出,人们可能用来对垂体腺瘤进行分类的变量彼此之间是变量相关的,正如人们应该预料的那样。然而,病理学家在考虑使用哪些变量对腺瘤进行分类时遇到了实际问题。将测试性能较差的冗余和相关的分类变量合并在一起,会降低分类算法的有用性,并错误地增强诊断专家的信心。换句话说,添加希望将病例分组的冗余和相关变量,会导致分类系统产生过拟合,分类过程会产生昂贵且分散注意力的假阳性和假阴性。这是统计学上的真理,但似乎被许多病理学家遗忘了。具体而言,当世卫组织内分泌垂体肿瘤分类的作者建议对所有垂体腺瘤进行“完整的染色组”时,他们提倡的分类系统会过度拟合数据,降低可重复性,同时在世界各地的实验室中产生昂贵、浪费和分散注意力的假阳性和假阴性。


建立语境:观察分类变量之间的多变量关系(Establishing context: observing multi-variable relationships among classification variables)


使用广泛可用的免费统计软件,超越简单的相关性,显示更广泛的、多变量的关系,从来没有像现在这样容易。在我们研究的157例垂体腺瘤中,分类变量、人口统计学和肿瘤大小之间的关系可以在所谓的热图中很容易地说明(图2)。

图2 该图显示了157个垂体腺瘤中位IHC评分(Allred评分)的热图,并标注了管理诊断(顶部)、肿瘤大小、患者性别和患者年龄(底部)。Alpha亚单位染色和CAM5.2模式包含在注释中,但不用于聚类。列表示个别情况。热图的行表示右侧IHC的Allred评分,范围从0(无染色)到8(超过2/3的细胞有强染色);灰框表示缺少数据。缩写:促肾上腺皮质激素;CAM 5.2,细胞角蛋白CAM 5.2;ER,雌激素受体;FSH,卵泡刺激素;GH,生长激素;LH:促黄体生成素;SF1,类固醇生成因子1;T-box转录因子;TSH,促甲状腺激素。


这种集群显示的优点是,它们说明了其他潜在重要变量上下文中的许多关系。例如,在这个肿瘤集合中,GATA3免疫反应仅限于一组或另一组腺瘤的程度可以一目了然。例如,图2显示,正如Ricklefs等所观察到的,在促肾上腺皮质激素细胞腺瘤的一个亚群中观察到GATA3的免疫反应性;相反,在我们的研究中,我们没有发现PIT1家族成员具有较强的GATA3免疫反应性,尽管Mete等人在有限的数量中报道了这一点。同样,很容易发现一组SF1免疫反应性/PIT1免疫反应性肿瘤,可能是Asa等所描述的类型。然而,与目前世界卫生组织分类引用的大多数作品不同,这些肿瘤的免疫组织化学和人口统计学背景是显而易见的。这种情况对于建立基于证据的分类以及在个别实验室开发合理的诊断算法至关重要。只有当分类变量被制成表格时,估计测试特征的困难工作才会发生。这些测试特性允许我们选择一种测试组合,以最大限度地提高准确性和最小化浪费的复杂性。


评估测试性能:敏感性和特异性(Estimating test performance: sensitivity and specificity)

使用我们为分类变量列表的数据,我们现在可以估计测试特征。一般来说,我们考虑的是敏感性和特异性。即使对那些在病理学领域工作多年的人来说,这些都是令人惊讶的细微差别。


对什么敏感?具体是什么?(Sensitive to what? Specific for what?)这两个问题往往没有说明,导致很多混乱。这些问题的答案决定了所执行计算的参数,并限制了任何测试的使用。


测试的目标可以极大地改变它的有用性(也就是说,它的阳性预测值和阴性预测值)。要考虑测试的敏感性,就相当于问“什么是真阳性(TP),以及该测试在多大程度上捕获了所讨论的所有疾病病例?”对于特异性,等效的问题是“什么是真阴性(TN),以及该检测在多大程度上捕获了不应归类为该疾病的所有病例?”[ it is equivalent to ask "What is true positive (TP) and how well does the test capture all cases of the disease in question?" For specificity, the equivalent question is "What is true negative (TN) and how well does the test capture all cases that should not be classified as the disease in question?".]


对于构成TP或TN的定义可以更狭义(例如,假设在识别促性腺激素细胞腺瘤时,SF1免疫反应性仅为TP)或更广义(例如,包括多谱系垂体瘤和促性腺激素细胞瘤的SF1免疫反应性)。这种思维练习应用于每个分类变量。


为什么要为每个分类变量做这样的脑力体操呢?简而言之,因为它允许测试特征的估计和比较,重要的是,它们的置信区间(CI)。图3- 5显示了将这种思想实验应用于上述分类变量时的结果。

图3使用限制性(狭义)或包容性(广义)真阳性定义的与肿瘤SF1家族相关的免疫组化染色的测试特征和95% CI。缩写:IHC,免疫组织化学;PPV,阳性预测值;NPV,负预测值。阳性免疫反应性定义为所有标记物的Allred中值大于4,但LH和FSH除外,其中Allred中值大于2被解释为阳性。

图4肿瘤TPIT家族免疫组化染色检测特征及95% CI。缩写:IHC,免疫组织化学;PPV,阳性预测值;NPV,负预测值。阳性免疫反应性定义为所有标记物的中位Allred评分大于4。

图5使用限制性(狭义)或包容性(广义)真阳性定义的PIT1肿瘤家族免疫组化染色的检测特征和95% CI。缩写:IHC,免疫组织化学;PPV,阳性预测值;NPV,负预测值。阳性免疫反应性定义为所有标记物的中位Allred评分大于4。


在决定哪种染色最适合用于性腺腺瘤的分类时,可以考虑图3。每种染色在狭义(TP =促性腺激素)或广义(TP =促性腺激素或多激素肿瘤)假设下被考虑,阳性免疫反应性定义为除LH和FSH外所有免疫染色的中位数Allred评分大于4,其中选择大于2的较低临界值,因为在促性腺激素腺瘤中表达LH或FSH的肿瘤细胞比例通常更有限。


在我们的研究中,SF1 IHC具有比其他标志物更好的敏感性,而LH和FSH IHC具有非常高的特异性,但即使在免疫阳性标准放宽的情况下,敏感性也很低。其他人也报告了类似的模式。在我的实验室,对大多数肿瘤来说,除了对SF1进行免疫组化外,对LH和FSH进行免疫组化是不必要的,这会增加复杂性和成本,至少在最初的免疫染色组中没有提供额外的价值。


对于促肾上腺皮质激素细胞腺瘤谱系,进默性和功能性促肾上腺皮质激素细胞腺瘤都被认为是TP,并且没有广泛或狭隘的条件进行估计。图4显示,在我们的研究中,转录因子TPIT的IHC优于ACTH,表现出更高的敏感性和相似的特异性。图4还显示,CAM5.2的阴性预测值相当高,提示当遇到缺乏CAM5.2免疫反应性的腺瘤时,不太可能是促肾上腺皮质激素细胞腺瘤。个人经验表明(数据未显示),TPIT IHC比ACTH更容易解释,在我们的实验室中,ACTH从来没有像TPIT那样清晰和深色染色。


最后,大多数病理学家会同意PIT1谱系代表了WHO垂体腺瘤分类中最复杂和诊断上最棘手的部分。图5显示了针对PIT1谱系的IHC的估计测试特征,并提供了几个重要的见解。最明显的特征之一是测试对可用数据点数量的依赖性。例如,TSH - IHC敏感性(图5,面板A)显示出非常宽的置信区间,这主要是由于阳性结果的病例很少。考虑到PIT1家族的异质性,以及PIT1家族成员IHC结果之间的相对模糊的界限,仅仅决定“什么是真正的阳性”是值得的。除了PIT1本身,所有的PIT1类别都被接受为TP,我已经在图5中展示了TP和TN的广义和狭义定义,但承认这样做的固有困难,特别是考虑到一些罕见腺瘤类别的患病率估计不足,以及目前分类指南的模糊性。


有了这些估计,我现在能够在我的实践中做出更明智的选择,选择在诊断算法中使用哪些染色。在我的实验室中,垂体腺瘤的检查目前需要仔细记录可用的临床、放射影像学和血清学信息。所有垂体腺瘤均采用免疫组化检查,包括SF1、PIT1和TPIT。对于无功能性腺瘤,该小组将大多数大腺瘤划分为促性腺激素细胞腺瘤类别,无需额外的免疫组化。在库欣病的情况下,或当发现无功能腺瘤有TPIT免疫反应时,我将ACTH和细胞角蛋白CAM5.2的免疫组化添加到初始面板中。在肢端肥大症或显著的高泌乳素血症的情况下,除了SF1、PIT1和TPIT IHC外,我们还在初始小组中进行泌乳素、生长激素、TSH、雌激素受体和GATA3的IHC。最后,当临床结果或最初的免疫组化不明确时,使用一种自由的方法,只有少数病例需要“完整的染色组”。


上述方法在某些方面类似于Neou等为建立垂体腺瘤分类所做的努力,但其局限于现成的免疫组织结构。虽然简单的免疫组织化学染色评分在这里被说明,其他潜在的分类变量,包括分子特征或分类变量,如超微结构的发现,也将受益于这种询问。有一天,使用诸如多因素分析之类的方法,可能会允许将各种不同的变量合并到单个模型中。我们可能最终能够在一个共同的背景下估计分子、血清学、人口统计学、免疫组织化学和超微结构变量的有用性。


我们方法的优势包括在病理学家解释之前对免疫组化进行盲法回顾,我们的系列包括社区中常见的肿瘤。缺点包括切除后临床随访有限,缺乏罕见肿瘤类型,微腺瘤的代表性不足(研究设计需要,每个腺瘤采用四个核心的TMA)。


分类生命周期:临时模型

正如英国统计学家乔治•博克斯(George Box)曾经指出的,“所有的模型都是错误的,有些是有用的”。测试和分类来来回回(Tests and classifications come and go)。从这个意义上说,所有分类都是临时的,我们的集体任务只是改进目前的分类草案。我乐观地认为,明确的分类变量,对相关性的关注,对大范围病例的联合登记,而不是罕见腺瘤类型的子集,以及对测试性能的关注,将产生一个更有用、更透明、更可重复的垂体腺瘤分类。对于执业病理学家来说,这将是无价的。在附录1中提供了我们系列的免疫组织化学数据的附录和基本特征,以便其他人在计算测试特征时提供他们自己的真阳性和真阴性定义,将我们的系列与他们自己的系列进行比较,并得出他们自己的结论。

声明:脑医汇旗下神外资讯、神介资讯、神内资讯、脑医咨询、Ai Brain 所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。

投稿邮箱:NAOYIHUI@163.com 

未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。

最新评论
发表你的评论
发表你的评论
来自于专栏