代谢组学方法与应用(许国旺)张强(8)

2025-09-14

活水平的提高,该病的发病率也随之提高了。近三十年的流行病学研究表明,这种疾病与很多环境和生化因素有关,例如,吸烟者比不吸烟的患心血管疾病的风险高1倍;血液中富含甘油酯的脂蛋白(主要是极低密度脂蛋白和低密度脂蛋白)中的胆固醇水平与心血管疾病的发病风险呈正相关,而高密度脂蛋白中的胆固醇水平与之负相关。这些流行病学的研究结果支持了公共健康政策和指导人们的生活方式,如在公共场合禁止吸烟、减少高胆固醇食物的摄入等;提供了导致动脉硬化和其他心血管疾病发病机制的重要分子生物学线索。而且,目前已经有综合致病风险因素(年龄、性别、脂蛋白水平、血压等)的方法用于鉴别心血管疾病发病的高危人群。但是,这些方法还很难有效地用于患者心血管疾病的诊断中。

英国帝国理工学院的Jeremy K. Nicholson教授等使用基于NMR技术的代谢

组学方法对传统医学方法确诊的心血管患者的血清(或血浆)进行了分析,对该方法和传统的风险因子的诊断效果进行了比较[3]。该研究比较了36例严重的心血管疾病(triple vessel disease,TVD)患者和30例经血管造影确认冠状动脉正常的患者(normal coronary artery,NCA)的血清的NMR结果(图9-2A,B)。从原始谱图中看不到明显的差别。因此该研究应用化学计量学的方法对两组数据进行了比较。首先,为了减少NMR数据的复杂性和便于比较,将谱自动地分成245个小的片段,分别对应着0.04X1CT6的数据值(图9-2C),这样数据就可以表示为一个66(样本,对应着分析对象的数目)X245(变量,对应样本在NMR谱图不同片段上的响应)的矩阵。然后,对这些数据进行主成分分析(principal components analysis,PCA)和偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)。PLS-DA的第二及第三个主成分的得分图结果(图9-2D)显示,虽然两类样本有少量的重叠,但是可以明显地看到聚类。相应的变量相关系数(coefficient)(图9-2E)给出了两类样品的NMR谱图的不同轮廓。图中横坐标对应245个宽度为0.04的化学位移的区间。其中,正值代表在该化学位移区间,TVD样本中对应的代谢物浓度有着较大的值;负值表示在该区间,与NCA样本相比,TVD中的代谢物浓度较低。相关系数(或loading plot)的结果表明,对TVD样品起重要作用的代谢物主要分布于δ0.86(主要由脂类特别是LDL和VLDL中的脂肪酸链中的CH3基团产生)、δ1.3和δ1.4[主要由脂类特别是LDL和VLDL中的脂肪酸链中的(CH2)而对NCAn基团产生]。

样品影响较大的变量则是δ1.22[主要由脂类特别是HDL中的脂肪酸链中的(CH2)n基团产生]和S3.22[主要由胆碱-N(CH3)3+产生]。其中胆碱为大部分来源于脂蛋白(主要是HDL)中的磷酸胆碱中的胆碱片段。

为了提高分类的效果,研究者采用了正交信号校正技术(orthogonal signal

correction,OSC)来提高模式识别的效果和模型的预测能力。应用OSC后,TVD和NCA样本能在PLS-DA的得分图中得到良好的区分(图9-2F)。而回归得到的相关系数(图9-2G)的结果则与使用OSC前的结果相同。

之后,随机选择其中的80%的样本作为训练集用以建立PLS-DA的模型,剩

下的20%的样本作为测试集用该模型进行预测,来评价模型的可信度和稳定性。该模型的相关系数结果与上述结果相一致,脂类(主要是VLDL、LDL和HDL)及胆碱对该模型有着重要的作用。使用该模型对冠状动脉性心脏病(coronary heart disease,CHD)进行了预测,灵敏度为92%,特异性为93%(图9-3)。图9-3中的^轴“1”表示TVD,“0”表示NCA,以0.5为分界点。

为了进一步发挥代谢组学的威力,研究者们进行了区分疾病的严重程度的研究。他们分别收集了一支(轻微患者,28例)、两支(中度患者,20例)、三支(重度患者,28例)冠状动脉狭窄的血清样本。对这76个样品按照上文中的方法进行分析,结果(图9-4)表明使用该方法可以区分该疾病的严重程度,而影响分类的主要因素仍为上文提及的代谢物。为了更好地说明问题,图9-4同时给出了三种不同严重程度的病历两两比较的结果。结果表明基于患者血清的代谢组学研究能够区分冠心病的严重程度。

研究者同时也对传统的风险因子的结果进行了相似的处理,包括年龄、血压、

LDL和HDL胆固醇、总胆固醇、总甘油脂、纤维蛋白原、血浆纤溶酶原激活物抑制剂(plasminogen activation inhibitor,PAI-1)、白细胞数、肌軒和吸烟史。对不同严重程度组进行ANOVA分析,均无显著性差异。对其进行PLS-DA处理,也未能提取出具有统计学显著性的主成分。

9.3基于修饰核苷的代谢组学用于肝脏疾病的研究

修饰核苷是细胞增生时RNA代谢产物,从尿液中排出,恶性肿瘤均有细胞

异常增生。因此不同类型恶性肿瘤患者尿中均可能出现修饰核苷含量的增高。如能证实这一推'测,理论上讲,尿中修饰核苷就能成为一种普适性肿瘤标志物。这一标志物如能用于肿瘤临床检验,恰可弥补蛋白质与基因肿瘤标志物检测谱系过窄、诊断敏感性较低的缺陷。研究表明,癌症患者尿中修饰核苷的含量明显高于正常人。另有一些报道表明修饰核苷可用于监控癌症的进展和治疗效果。前期研究表明使用化学计量学的方法建立的核苷靶标分析方法可以实现对恶性肿瘤的高灵敏度检测,并可用于监控癌症的进展和治疗效果[4]。然而有些良性疾病,特别是炎症在该方法中呈阳性,阻碍了该方法的应用。许国旺研究组构建了尿样中顺二醇类代谢产物的代谢轮廓分析方法,并将其应用于肝脏疾病的诊断上,成功地区分了肝癌患者及其他肝脏疾病患者。将假阳性结果降到7.4%,并给出了潜在的生物标志物[5]。

该研究从50例正常人、125例肝脏疾病患者(27例肝硬化患者、30例急性

肝炎患者、20例慢性肝炎患者和48例肝癌患者)中收集随机尿样,年龄为50.6±16.2(年龄范围为20~58岁)。样品采集时没有进行饮食和其他方面的限制。收集到样品后立刻放入-20℃的冰箱中冷冻。分析尿中的顺式二羟基代谢产物之前,尿样在室温下解冻。在使用苯基硼酸亲和凝胶色谱法提取前,加人内标8-溴化鸟苷(Br8G)。肌酐浓度用毛细管区带电泳法测定。尿样中提取的顺式二羟基代谢产物在反相液相色谱柱上实现分离。柱温为23℃,5mmol/L乙酸铵溶液(pH4.5)和60%的甲醇水溶液作为流动相进行二元梯度洗脱(表9-1),检测波长为254nm。

该研究首先对15种核苷(Pseu、C、U、mlA、I、m5U、G、X、mil、mlG、

ac4C、m2G、A、m2,2G、m6A)进行了靶标分析。尿中核苷浓度用内标法定量,所得结果换算为核苷/肌酐(creatinine)含量(nmol//Ltmol)。然后对顺二醇类代谢产物进行了轮廓分析,在轮廓分析的数据里,所有HPLC的峰信息都被记录下来。整个数据分析的流程如图3-5所示。首先,选择一个目标色谱图(target chromatogram or reference chromatogram),在这张色谱图上存在着大多数色谱图上出现的峰,简单来说,就是选择一张具有代表性和峰较多的色谱图来作为目标色谱图。紧接着使用峰检测算法去找出这张目标色谱图中的所有的峰。我们使用

了峰高大于1000倍信噪比、峰宽大于12s作为限制条件,使用Class-VP进行了峰检测。得到的峰表以CSV格式输出。之后,使用上节发展的峰对齐算法将其他样本的色谱图与目标色谱图对齐,在峰对齐的过程中,使用了6个参考峰,分别试验了k和logk两种保留值的表达方式。经过峰对齐后,得到了125×113的矩阵,对应着125个样本,113个顺二醇类代谢物的峰面积。然后使用这些样本对应的内标峰Br8G的峰面积对其进行校正,并除以相应的肌酐浓度。由于使用了肌酐校正,随机尿中的顺二醇类代谢物的浓度将与24h尿样中的浓度相似,减小了样本由于采样差异引起的系统偏差。许多在目标色谱图中检测到的峰在样品色谱图中并未出现。这主要是由于这些峰的高度低于所设的阈值——1〇〇〇倍的信噪比,这并不意味着这些化合物的浓度为〇,其真实的峰面积应该是介于0和阈值间的某个值。对于这样的峰面积,赋值为1×10-6。

需要指出的是,使用目标色谱图的优点在于生成的数据具有相同的变量数,

是一个简单的二维矩阵,适合于很多的统计分析和模式识别方法。

9.3.1代谢物的靶标分析

代谢物的靶标分析主要关注少数已知的生物标志物。该研究根据其生物学重

要性和标样是否能购买到选择了15种核苷:假尿苷(pseudouridine,Pseu)、胞苷(cytidine,C)、尿苷(uridine,U)、1-甲基腺苷(1-methyladenosine,mlA)、次黄苷(inosine,I)、5-甲基尿苷(5-methyluridine,m5U)、鸟苷(guanosine,G)、黄苷(xanthosine,X)、1-甲基次黄昔(1-methylinosine,mil)、1-甲基鸟苷(1-methyiguanosine,mlG)、氮4-乙酰基胞苷(Nracetyicytidine,ac4C)、2-甲基鸟苷(2-methylguanosine,m2G)、腺苷(odenine,A)、2,2-二甲基鸟苷(dimethylguanosine,m2,2G)和6-甲基腺苷(6-methyladenosine,m6A)。

对健康对照组和肝癌患者的〖检验数据表明,所有15种核苷的浓度均有显

著性差别(C,P<0.05;其他核苷,P<0.01)。之后,对15种核苷的数据进行主成分分析,肝癌患者的阳性检出率为81.25%(表9-2),同时研究者也收集了这些患者的常规指标(如AFP,肝癌的常规标志物),AFP的阳性检出率仅为73%,说明使用15种核苷的代谢物靶标分析的检出率高于常规指标。

但是,作为癌症临床诊断指标的另外一个要求是,其他良性疾病的假阳性干

扰小。为了得到该方法的假阳性率,对急性肝炎患者、慢性肝炎患者、肝硬化患者的尿样中这15种核苷进行了分析。图9-5A给出了各类患者15种核苷的平均浓度,7种核苷(Pseu、C、U、X、mlG、ac4C、m2G)的平均浓度随着疾病的严重程度而增高,急性肝炎患者的平均浓度最小,慢性肝炎患者的平均浓度略高,肝硬化患者的平均浓度更高,癌症患者的平均浓度最高。这与期望的结果类似。

但作为诊断的生物标志物,需要考虑总体样本的分布。类似地,对肝硬化和

肝癌患者的15种核苷数据做主成分分析。由于主成分分析是将高维的数据投影到低维(二维)的平面上,其二维显示可以反映样本在高维空间的分布。图9-5B给出了肝硬化和肝癌患者的二维分布。从图9-5中可以看出,使用15种核苷的数据仍不足以提供足够的信息来区分肝癌和肝硬化。换言之,15种核苷的代谢物的靶标分析不能解决肝硬化患者的假阳性。

9.3.2顺二醇类代谢物的轮廓分析

为了减少假阳性结果,使用代谢轮廓分析对这些样本的谱图进行了分析,期

望能从原始谱图中得到尽可能多的信息。

图9-6A给出了肝病患者进行顺二醇类代谢轮廓分析的主成分分析的得分图。

从图9-6中可以看出,肝炎和肝硬化患者聚集在一起,而肝癌患者分布在另一个区域;有一些癌症患者落在了肝炎和肝硬化区域,几个肝硬化患者落在了肝癌的区域。.这可能与肝癌患者有肝炎和肝硬化的部分症状,而肝炎和肝硬化患者很少有像肝癌患者那样高表达的RNA转录有关。另外,有些肝硬化患者有转化为肝癌的趋势,也可以部分解释这个区域出现的重叠现象。

一般认为,如果AFP浓度大于20ng/ml是肝癌的提示,也有使用200ng/ml

的标准。如果以20ng/ml为标准,以上数据中50%(13/26)的肝硬化患者和52.2%(12/23)的慢性肝炎患者将被诊断为肝癌。如果使用200ng/ml为诊断标准,有11.5%(3/26)的肝硬化患者和17.4%(4/23)的慢性肝炎患者被诊断为肝癌。而图9-6A显示只有7.40%的肝硬化患者,没有肝炎患者被诊断为肝癌。结果表明,构建的代谢轮廓分析方法可以有效地降低假阳性率,将肝炎、肝硬化和肝癌有效地区分开来;同时,尿中的顺二醇类化合物的子集比传统的单个标志物(AFP)与癌症的诊断关联更好。


代谢组学方法与应用(许国旺)张强(8).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:心理咨询室管理员职责

相关阅读
本类排行
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 7

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219