GC-MS非靶标代谢组学全面解决方案
产品名称: GC-MS非靶标代谢组学全面解决方案
英文名称: GC-MS Untargeted metabolomics
产品编号:
产品价格: 800
产品产地: null
品牌商标: null
更新时间: null
使用范围: null
- 联系人 :
- 地址 : 嘉定区新培路51号焦点梦想园5层
- 邮编 : 200438
- 所在区域 : 上海
- 电话 : 135****2152 点击查看
- 传真 : 点击查看
- 邮箱 : marketing@biotree.cn
鹅血清GC-TOF-MS非靶标代谢组学检测分析方案
一、项目简介
1.1样本信息
鹅血清样品,分对照组(C)、模型组I(M1)和模型组II(M2),每组取10个平行样品,进行GC-TOF-MS代谢组学检测分析,并对得到数据进行进一步生物信息学分析。
样品详情:共计30例样品。
1.2对比策略
针对非靶标代谢组学数据分别进行如下对比,并对得到数据进行进一步的生物信息学分析:
进行M1组 vs C组,M2组 vs C组,M2组 vs M1组共计3次对比分析。
1.3分析内容
基础数据分析包括:数据预处理,PCA 分析(principal component analysis),正交偏最小二乘法判别分析(OPLS-DA),差异化合物筛选和鉴定。
个性化分析:差异代谢物代谢通路分析
1.4检测平台
非靶标代谢组学检测平台:GC-TOF-MS, Pegasus HT (LECO, USA)
二、数据分析方案
基础数据分析
2.1数据预处理
GC-MS非靶标代谢组学对原始数据进行解卷积,峰对齐,标准化分析,通过原始总离子流(TIC)色谱图,初步观察仪器的保留时间重现性,所测得的物质数量,以及不同组之间的色谱图是否具有较明显的差异。
2.2 PCA分析(principal component analysis)
对样本进行主成分分析能从总体上反应各组样本之间的总体代谢差异和组内样本之间的变异度大小。软件采用瑞典MKS DAS 公司的SIMCA14.1,数据采用UV格式化(Unit Variance Scaling)和平均中心化(Mean-Centered)处理[1],以获得更加可靠且更加直观的结果。软件进行自动化模型拟合分析,获得最可靠数学模型的主成分数目。例图如下所示:
2.3正交偏最小二乘方-判别分析(OPLS-DA)
为了消除与分类不相关的噪音信息,同时也为了获得导致两组之间显著差异的相关代谢物信息,我们采用正交偏最小二乘方判别分析(OPLS-DA)过滤与模型分类不相关信号即正交信号,获得OPLS-DA模型。对模型的质量用交叉验证法进行检验,并用交叉验证后得到的R2X 和Q2(分别代表模型可解释的变量和模型的可预测度)对模型有效性进行评判。在此之后,通过排列实验对模型有效性做进一步的检验。
例图如下所示:
[2] 载荷图(loading plot)的横坐标代表每个物质在第一主成分上的载荷大小(cosα),纵坐标代表每个物质在第二主成分上的载荷大小(cosβ)。
[3] 置换检验的横坐标代表随机分组的Y与原始分组Y的相关性,纵坐标代表R2和Q2的得分。
[4] ROC作为模型的一种外部检验,当AUC越靠近1时表示模型越可靠。
[5] S-plot的横坐标代表每个物质在第一主成分上的载荷大小(cosα),纵坐标代表每个物质和第一主成分相关系数(可靠性)的大小。
[6] S-line的横坐标代表每个物质的ID,纵坐标代表每个物质在第一主成分上的载荷大小(cosα),颜色代表纵坐标代表每个物质和第一主成分相关系数(可靠性)的大小。
2.4代谢物定性及差异化合物筛选
GC-MS非靶标代谢组学代谢物定性的方法为:搜索自建的标准物质数据库和NIST商业数据库(自动峰识别和保真解卷积®)。
我们采用 OPLS-DA模型第一主成分的VIP(Variable Importance in the Projection)值(阈值>1),并结合学生氏t检验(t-test)的p值(阈值≤0.05)来寻找差异性表达代谢物。
表1. GC-TOF-MS差异化合物列表(部分)
个性化分析
2.5差异代谢物KEGG注释
生物体中的复杂代谢反应及其调控并不单独进行,往往由不同基因和蛋白质形成复杂的通路和网络,它们的相互影响和相互调控最终导致代谢组发生系统性的改变。对这些代谢和调控通路的分析可以更全面,更系统的了解实验条件改变导致的生物学过程的改变,性状或疾病的发生机理和药物作用机制等生物学问题。
京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG) Pathway数据库以基因和基因组的功能信息为基础,以代谢反应为线索,串联可能的代谢途径及对应的调控蛋白,以图解的方式展示细胞生理生化过程。这些过程包括能量代谢,物质运输,信号传递,细胞周期调控等,以及同系保守的子通路等信息,是代谢网络研究最常用的通路数据库。
我们整理出差异代谢物映射的所有通路,如下表所示:
获得上述结果后,我们将差异代谢物在KEGG通路图上进行标记,以亮红色代表上调,亮蓝色代表下调。以Citrate cycle (TCA cycle)代谢通路为例:
图10. 代谢通路图,其中红色标记的点为差异代谢物
2.6差异代谢物代谢通路富集分析
KEGG注释分析仅找到所有差异代谢物参与的通路,但要想知道这些通路是否与实验条件密切相关,需对差异代谢物进行进一步的代谢通路富集分析。通过对差异代谢物所在通路的综合分析(包括富集分析和拓扑分析),我们可以对通路进行进一步的筛选,找到与代谢物差异相关性最高的关键通路。
代谢通路富集分析的结果以气泡图进行展示。气泡图中每一个气泡代表一个代谢通路,气泡所在横坐标和气泡大小表示该通路在拓扑分析中的影响因子大小,大小越大影响因子越大;气泡所在纵坐标和气泡颜色表示富集分析的P值(取负常用对数,即-log10 P-value),颜色越深P值越小,富集程度越显著。我们对富集分析和拓扑分析综合考虑后凸显出重要性的通路进行了标注,帮助客户深入理解分析结果。
图11. 代谢通路富集分析气泡图
三、时间概算
非靶标代谢组学实验检测:22个工作日(从收到客户预付款并收到样品之日起)
非靶标代谢组学数据分析:10个工作日
代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分。基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞内许多生命活动是与代谢物相关的,如细胞信号(cell signaling)、能量传递等都是受代谢物调控的。代谢组学正是研究代谢物——在某一时刻细胞内所有代谢物的集合——的一门学科。基因与蛋白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养状态、药物和环境污染物的作用,以及其它外界因素的影响密切相关。因此 Bill Lasley(UC Davis)认为基因组学和蛋白质组学能够说明可能发生的事件,而代谢组学则反映确实已经发生了的事情。
新陈代谢网络是十分复杂的网络,特别是人体的代谢网络,一直被认为是最复杂的代谢网络。现在多数信号通路的研究都是集中在代谢网络的一个很小的领域。基因组学、蛋白组学研究已经揭示了部分调节通路,但是和代谢网络直接相关的是代谢产物。
但是从茫茫多的代谢产物中选取研究对象,无疑是大海捞针。代谢组学研究通过一定的手段能够帮助研究员从代谢产物海中挑出来,提供一个“航拍”的视角,一目了然地发现差异性代谢产物。然后通过已知的代谢通路逆推找出调节酶和基因,完成疾病发病机制、药物治疗机制等方面的研究。
代谢组学主要研究的是作为各种代谢路径的底物和产物的小分子代谢物(MW<1500)。其样品主要是血浆或者血清、尿液、唾液、以及细胞和组织的提取液,以及细胞和组织的提取液。主要技术手段是核磁共振仪(NMR)、液相色谱质谱联用(LC-MS)、气相色谱质谱联用(GC-MS)、色谱(HPLC、GC)等。通过检测一系列样品的谱图,再结合化学模式识别方法,可以判断出生物体的病理生理状态,基因的功能,药物的毒性和药效等,并有可能找出与之相关的潜在生物标记物(potential biomarkers)。