由SARS-CoV-2引起的新冠肺炎大流行给全世界带来沉重的健康和经济负担,同时也开启了对控制疾病传播措施的讨论,如社会距离和人口筛查。患者的筛查和风险管理对政府和当局如何引导资源、规划重新开放以及卫生对策发挥着根本性作用,现有的筛查方法主要有:抗原或RT-PCR检测、血清学检测、以及RT-PCR和胸部CT相结合检测等。尽管标准程序的基础已经确立,但对于现实检测的敏感性和特异性、与程序相关的时间和成本、试剂和培训人员可用性以及测试窗口的担忧也越来越多。新冠肺炎的复杂性导致了对SARS-CoV-2的准确诊断和患者风险分类的困难,用于患者风险分层和管理的医疗决策工具的开发与新冠肺炎检测的紧迫性是一致的。
2021年2月巴西坎皮纳斯大学Rodrigo Ramos Catharino教授和Anderson Rezende Rocha教授共同在Anal Chem杂志上发表题目为《Covid-19 Automated Diagnosis and Risk Assessment through Metabolomics and Machine Learning》的研究成果,利用机器学习算法与基于质谱的代谢组相结合,分析了815名患者(442名新冠肺炎患者,350名对照患者和23名新冠肺炎可疑患者)的血浆样本,引入一种新的新冠肺炎筛查方法,通过代谢物提供感染的间接检测,并将发现与疾病的病理生理学联系起来,创建了可在几分钟内识别新冠肺炎血浆样本、同时提供风险评估的工具,为医疗人员进行患者管理和决策提供帮助。
【研究材料】 人-血浆样本
【技术方法】 非靶代谢组学+机器学习算法
【实验方法】
🔹 步骤1:新冠肺炎MS-ML平台测试:建模与性能评估;
🔹 步骤2:利用非靶代谢组数据构建COVID-19诊断Panel;
🔹 步骤3:候选生物标志物病理生理学作用。
【研究结果】
1. 新冠肺炎MS-ML平台测试:建模与性能
首先研究人员利用代谢组数据与机器学习算法(MS-ML)构建了用于诊断和风险评估的预测模型(盲法测试),下表展示了队列的分组情况和使用成对特征的预测模型(自动诊断(M1),风险评估(M2)和低风险判别(M3))的判定结果。用梯度树增强(GDB)算法进行COVID-19自动诊断可获得最佳的诊断效果,其特异性为96.0%,灵敏度为83.1%。ADA Boosting算法,以80.3%的特异性和85.4%的敏感性,成为最佳的风险评估模型。为了评估模型的特异性和敏感性,研究人员将中度和轻度症状患者与非感染对照组(M3)进行ADA Boosting分析,获得92.9%的特异度和91.3%的敏感度。
2. 利用非靶代谢组数据构建COVID-19诊断Panel
通过ML筛选出19个分子用于新冠肺炎诊断(M1),26个分子用于风险评估(M2) , 24个分子用于低风险判别(M3)。总结发现,SARS-CoV-2感染者和非感染者的主要区别是:溶血磷脂酰胆碱(LysoPC)、胆固醇和不饱和脂肪酸减少,而三酰甘油(TG)、二酰甘油(DG)和嘌呤增加;与轻、中度症状的患者相比,重症患者某些溶血磷脂酰胆碱(LysoPC)、磷脂酰胆碱(PC)、磷脂酰胆碱衍生的缩醛磷脂、胆固醇、甘油三酯(TG)、鞘磷脂(SM)和N-酰乙醇胺的含量相对减少,脱氧鸟苷/腺苷、N-硬脂酰缬氨酸和甾醇脂质衍生物增加;轻症患者与新冠肺炎阴性患者相比,4种甘油磷脂和2种甘油磷脂是上调的,二十碳三烯酸、3个甾醇类脂代谢物则下调。
3. 候选生物标志物病理生理学作用
研究人员认为:①氧鸟苷是嘌呤代谢的产物,在病毒ssRNA存在的情况下,可增强TLR7信号,诱导巨噬细胞分泌细胞因子,因此需进一步研究脱氧鸟苷在SARS-CoV-2免疫过度激活中的潜在作用;②本研究中发现的与轻度病例相关的亚油酰甘氨酸和N-酰基乙醇胺(C20:1和C22:0)通过促进抗炎作用来调节免疫反应;③主要的脂质发现表明甘油磷脂代谢的重塑;④新冠肺炎的病理生理似乎破坏了胆固醇的稳态,在新冠肺炎阳性的患者中胆固醇和胆固醇酯(CE(16:0))降低。
候选生物标志物在COVID-19病理生理学中的作用
【小编小结】
本研究采用质谱-机器学习方法对SARSCoV-2标本进行非靶向分析,基于光谱图进行诊断或生物标志物评估及其对COVID-19患者严重程度的意义;引入成对m/z分析,可直接从原始数据提供诊断,是非靶向代谢组学应用的重要进展。本研究建立的MS-ML平台定性结果可靠,其特异性为96.0%,灵敏度为83.1%(盲法测试),与现有的血清学和RT-PCR方法相比性能相似甚至更好。总体而言,本研究提出了COVID-19筛查的替代方案,并通过风险分类为公共卫生工作提供指导。