2021年3月,北京市神经外科研究所江涛教授团队在生物信息学领域权威杂志《Genomics, Proteomics & Bioinformatics (GPB)》在线发表题为“Chinese Glioma Genome Atlas (CGGA): A Comprehensive Resource with Functional Genomic Data from Chinese Gliomas”的数据库论文。
研究团队历经十五年的样本与信息收集以及功能组学数据测定构建了国内首个脑胶质瘤功能基因组学数据库——中国脑胶质瘤基因图谱计划(CGGA)数据库。北京市神经外科研究所赵征助理研究员、张克难和王强威博士研究生为共同第一作者,北京市神经外科研究所江涛教授和首都医科大学附属北京天坛医院神经外科保肇实副主任医师为共同通讯作者。
脑胶质瘤是成人最常见的颅内恶性肿瘤,年发病率约5-8/10万人。患者预后不良,常于手术后复发,对患者家庭及社会产生了巨大的经济和心理负担。近年来,随着脑胶质瘤分子生物学研究不断深入,越来越多的生物学标记物被发现并指导临床诊治。脑胶质瘤功能基因组学数据的全面收集和共享有助于加速科学研究和临床转化,对临床治疗对策和国家肿瘤防控政策的制定具有重要指导意义。
然而,当前脑胶质瘤功能基因组学数据的共享存在以下三个主要问题:
国际上存在多个脑胶质瘤基因组共享数据库/数据中心,但数据量小,且以欧美裔患者为主,无法反映中国人群患者特征;
现有数据库缺乏复发或复发配对患者的组学数据,无法评估治疗对脑胶质瘤基因组的影响;
江涛教授带领团队十五年来持续收集脑胶质瘤组织样本,有序开展测序研究并坚持长期随访。该工作致力于中国脑胶质瘤患者功能基因组学信息的整合与共享,为脑胶质瘤基础研究与临床转化研究提供服务和支撑。
目前,数据库已存储并共享了全外显子组测序数据(286例)、全转录组测序数据(1018例)、全转录组芯片数据(301例)、DNA甲基化芯片数据(159例)、小RNA芯片数据(198例),以及详细患者临床资料(例如:年龄、性别、放化疗信息、WHO等级、组织病理学分级、分子病理信息以及生存等)。CGGA数据库能够在线可视化分析全外显子组、转录组学及小RNA、DNA甲基化芯片平台等数据资源。用户可通过输入感兴趣的基因来查询在不同脑胶质瘤亚型中的分布情况,还可以探索感兴趣的基因对在特定脑胶质瘤亚型中的共表达情况;此外,用户可以针对自己感兴趣的基因探究在不同脑胶质瘤亚型中的的预后价值。相应的组学数据、临床数据以及R脚本呈现在相应结果部分,以便用户可以很好的复现可视化分析的结果。
CGGA数据库主要内容及外显子数据分析工具
CGGA数据库中所有功能组学数据和临床资料供全世界研究者开放使用。当前CGGA的部分原始测序数据储存于中科院国家生物信息学中心的组学原始数据归档库,欢迎研究者申请使用。
该研究得到国家科技支撑计划、国家863项目、国家自然科学基金、北京市自然科学基金等项目资助。