【Cell】作者解析临床肿瘤大队列CNS研究模式——蛋白基因组

来源: 上海中科新生命生物科技有限公司   2020-7-10   访问量:1236评论(0)

2020年07月09日,Cell 杂志上史无前例地同时发表了三篇肿瘤蛋白质组学的重磅成果,构建了基于蛋白质组的肺癌图谱全景及分子特征,揭示了肺癌精准治疗的新靶点。为了让给位老师能够更详细了解蛋白基因组的研究内容和方法,特此回顾我们在今年4月份给大家带来的蛋白基因组讲座。我们请到了同样在《Cell》上发表了肿瘤蛋白基因组重磅研究成果的,来自中科院上海药物研究所的朱洪文博士的分享。

在精准医学的理念下,随着高通量组学技术的成熟应用,肿瘤的研究逐渐进入了系统化的模式。其中,蛋白基因组(proteogenomics)的研究方式越来越受临床研究者青睐:近年来CNS级别的杂志上陆续发表了多篇蛋白基因组相关研究。

那么,什么是蛋白基因组?蛋白基因组具体要做哪些研究和分析?分别解决了什么科学问题?

4月15日下午,中科院上海药物研究所朱洪文博士为大家带来了一期题为《定量蛋白质组学方法在大队列肿瘤研究中的应用》的在线讲座。朱博士于2019年以共同一作的身份在《Cell》杂志上发表了关于肝细胞癌蛋白基因组的研究成果。本次讲座朱博士以该研究为例,详细解析了肿瘤大队列的典型研究思路,并介绍了近年来主流的定量蛋白质组技术发展以及各种技术的优缺点比较。本期讲座回顾为大家带来《Cell》蛋白基因组一作专家的分享与解答。

编者按

什么是临床肿瘤研究的蛋白基因组模式?

Proteogenomics是近两年来肿瘤精准治疗领域的热点方向。2016年美国癌症登月计划(Cancer Moonshot 2020)让精准医学正式落地。同年,美国VA、DoD、NCI三部门联合宣布将建立第一个同时进行基因信息和蛋白信息表征的医学系统,把基因组和蛋白质组作为常规检测手段,对癌症病人进行个性化蛋白基因组(Proteogenomics)表征,为更精准的用药提供指导。

在学术界,早在2013年,《Nature》上发表的一篇关于子宫内膜癌的多组学研究,就开启了学术界采用蛋白基因组模式开展肿瘤精准分型、精准治疗研究的热潮。随后《Nature》、《Cell》等顶级期刊上陆续发表了colon and rectal cancer、breast cancer、ovarian cancer等肿瘤的大队列Proteogenomics研究。

Proteogenomics是一种多组学分析体系,简单来说就是将基因组、转录组、蛋白组,以及翻译后修饰组(肿瘤研究主要关注磷酸化修饰组)的大数据整合起来,从多分子层面的大数据重新定义疾病的分型、挖掘潜在的治疗靶点,最终在蛋白水平上发现与验证肿瘤相关基因突变、表达变化及关键分子调控机制,以进行更精准的用药指导和药物开发。

蛋白质组学是大队列肿瘤研究中最重要的研究内容之一

在肿瘤的基因研究如火如荼的今天,为什么要引入蛋白组,开展蛋白基因组研究?蛋白质是生物功能的执行者,它能够在最接近表型的分子水平上体现基因突变、染色质拷贝数变异等因素造成的肿瘤发生机制。以蛋白质组表达信息进行的肿瘤分子分型也已经被诸多权威文献证明是最接近临床表型分型的。朱博士在讲座中提到:“蛋白质组学可以发现基因组学和转录组学层面上呈现不了的生物学信息”。同时,朱博士列举了近年来多篇利用蛋白质组学进行肿瘤大队列研究的案例,其中包括结直肠癌、卵巢癌、前列腺癌、肝癌、弥漫性胃癌、黑色素瘤、成神经管细胞瘤、乳腺癌、透明细胞肾癌、子宫内膜癌、小细胞肺癌等多种肿瘤类型。

肝癌蛋白基因组研究案例分享

蛋白基因组的本质是利用基因组、转录组、蛋白质组、修饰蛋白质组等多组学整合手段对肿瘤进行系统研究,以蛋白质组为核心发现肿瘤发生发展的关键调控机制,为肿瘤分型、药物开发和精准治疗等提供必要信息。在该研究中,总共纳入了316对癌症和癌旁组织进行分析,这些样本都具有详细的临床信息,比如预后生存期、癌栓有无等。通过对核酸、蛋白样本的抽提和质控后,筛选到了165对样本进行后续的基因、转录、蛋白、磷酸化组学检测。

最终获得以下主要结论:

1. 关于基因特征:通过外显子测序,发现国内肝癌的基因突变频率以TP53最高,其次是CTNNB1。

2. 关于转录-蛋白的相关性与功能:通过转录组与蛋白质组的联合分析,发现呼吸电子传递、RNA聚合酶相关基因的转录-蛋白相关性偏低,而代谢通路相关基因的相关性普遍较高。该结果与之前报导的其它肿瘤特征类似。

3. 关于基因拷贝数-转录本-蛋白表达的相关性与功能:拷贝数变异与RNA&蛋白表达量的关联分析中,发现染色体4q和16q的缺失会通过顺式效应影响泛素化相关蛋白、进而通过反式效应影响细胞周期相关蛋白,从而促进肿瘤增殖。

4. 蛋白组实现精准分子分型:通过蛋白质组分子分型,将肿瘤分为3个亚型:代谢驱动型、肿瘤微环境失调型和增殖驱动型。结合临床生存期数据,明显发现增殖驱动型预后最差,代谢驱动型预后较好。同时,将蛋白质组和转录组分型不一致的样本进行预后的比较,发现蛋白质组的分型效果明显更好。

5. 发现新的诊断标志物:利用蛋白质组学数据以及临床预后数据,筛选到两个预后标志物PYCR2与ADH1A。

6. HBV肝癌的蛋白组特征:从蛋白质组数据中发现HBV相关蛋白以及受体蛋白——胆汁酸转运蛋白SLC10A1在肿瘤中显著低表达,并具有亚型相关性与预后相关性。胆汁酸代谢和HBV的转录复制由同一套转录因子(FXR、RXR等)调控,这些转录因子功能受损会同时导致胆汁酸合成受阻和HBV基因表达下调,是感染HBV肝癌的特异性分子特征。

7.关键基因及分子机理的新发现:结合基因突变信息、蛋白质组与磷酸化组信息,发现CTTNB1突变型和野生型肝癌之间的蛋白质和磷酸化差异主要聚集于代谢通路。分析发现CTNNB1突变与果糖二磷酸醛缩酶A(ALDOA)的磷酸化相关。后续的体内外机制研究表明,ALDOA磷酸化增强肝癌细胞的糖代谢,进而促进肝癌的生长成瘤,且ALDOA的活性对于CTNNB1突变的肝癌细胞的增殖非常重要。因此,靶向调控代谢通路在肝癌防治中将发挥重要的作用。

关于蛋白基因组研究采用的主流蛋白质组学技术

在讲座中,朱博士为大家介绍了近年来主流的蛋白质组学研究技术,并对它们的优缺点分别进行了总结:

1. 非标记定量谱图数定量法:定量准确性不高,适合老型号质谱仪采集的质谱数据,使用越来越少。

2. 非标记定量-离子流色谱峰强度定量法:样本处理简单,尤其适用于少量蛋白样本;但蛋白鉴定深度有限、定量缺失值较多。

3. 代谢标记SILAC法:定量准确;通量低,样本量需求大,肿瘤蛋白质组研究相关应用正逐渐变少。

4. 化学标记定量(iTRAQ&TMT):通量高、蛋白鉴定深度高、同一组标记实验内平行性好;存在多组标记实验批次效应问题、定量比例压缩问题。

5. 数据非依赖性采集模式(SWATH/DIA):重复性好,缺失值少,样本用量少;鉴定深度略逊于化学标记定量。已经显示出其在肿瘤蛋白质组研究中的潜力。

以上是这篇文献案例的主要内容:蛋白基因组解决了肿瘤分子分型、预后标志物、多组学分子机制探讨等多类科学问题。如果想更详细地了解这篇文献,可以微信后台回复:【朱洪文博士讲座】索取讲座回看视频;中科新生命之前也对这篇文献做过详细的解读,同样可以微信回复【肿瘤分子分型讲座】获取回看视频。

 

在讲座最后,朱博士对肿瘤大队列蛋白基因组研究做了一些总结和答疑。

1.关于蛋白基因组研究的初衷:朱博士认为,“蛋白基因组研究最基本的出发点是构建大而全的临床肿瘤样本蛋白质和磷酸化数据库,为基础科研提供参考;从蛋白质组层面上对肿瘤进行分子分型,为肿瘤的精准治疗提供思路”。2.关于大家关心的“批次效应严重的标记定量方式如何满足构建大而全临床数据库的问题”:朱博士表示,一方面可以采取内参搭桥的方式对批次数据进行整合和批次效应去除,另一方面随着SWATH/DIA等数据非依赖式采集方法的发展,这些技术在临床肿瘤样本检测中也体现出了越来越大的优势。3.关于蛋白基因组的扩展研究方向,例如代谢组学在蛋白基因组研究中的应用前景:朱博士表示,“如果代谢组学的定性准确度上能够达到一定的水平,它在进一步揭示肿瘤分子机制中会发挥非常大的作用”。小编也非常同意这个观点,从朱博士分享的这篇文献案例中,我们可以看到其中的一种肿瘤亚型就是代谢驱动型,研究中筛选到的预后标志物PYCR2也是代谢相关的酶。因此,代谢组学在肿瘤分子机制研究中必然会起到重要作用。此外,中科新生命基于本地2700+标准品数据库,能够尽可能保证非靶代谢组学定性结果的准确性,使得代谢组学能够在肿瘤大队列研究中发挥重要的作用。4.关于蛋白基因组研究的瓶颈:朱博士也提到,“蛋白基因组研究中,多组学研究技术不是瓶颈,数据解读才是关键,需要多方合作。“面对这一实际需求,中科新生命推出了针对大队列肿瘤样本的蛋白基因组检测分析服务,包括个性化课题设计、学术顾问团队数据解读、定制版结题报告等VIP级服务内容。欢迎有合作意向的老师与我们联系。



上海中科新生命生物科技有限公司   商家主页

地址:上海市园美路58号1号楼15-18楼
联系人:刘
电话:021-54975031
传真:021-54975030
Email:liliu@aptbiotech.com;liliu@sibs.ac.cn