语言 ▾
中文EN

实验设计不止疾病组和健康组怎么办?快让Fuzzy C Means聚类来帮忙

发布时间:  2024-10-30 09:40:45


Fuzzy C Means(FCM)是一种无监督学习算法,用于将数据点分配到多个簇中。与传统的K-means聚类不同,FCM允许每个数据点属于多个簇,并为每个数据点分配一个隶属度,表示该点属于某个簇的程度。作者通过将Fuzzy C Means和WGCNA结合找出糖尿病肾病的生物标志物,且该生物标志物可以展示疾病的进展,一起来看看吧~


题目:通过定量蛋白质组学研究HMGB1作为早期糖尿病肾病监测的潜在血清生物标志物

杂志:iScience

影响因子:IF=4.6

发表时间:2024.01.08




研究背景



糖尿病(DM)是一种慢性代谢性疾病,其特征是胰岛素分泌或利用受损导致的慢性高血糖。全球有超过4.15亿人患有糖尿病,预计到2045年将有6.93亿人被诊断出患有糖尿病。糖尿病肾病(DN)是糖尿病的主要微血管并发症之一,大约30%–40%的糖尿病患者会发展为DN。不幸的是,大多数DN患者在没有任何症状的情况下进展,直到出现肾损伤,然后发生不可逆的肾衰竭,只能通过肾移植和透析来治疗。DN不仅对患者的生命构成威胁,还给患者和社会带来巨大的经济和医疗负担。因此,早期诊断是有效预防和治疗DN的关键。

然而,基于质谱(MS)的蛋白质组学是分析蛋白质以发现潜在疾病相关生物标志物的首选技术。血清中含有大量分泌蛋白,这些蛋白在生理和病理变化中起着至关重要的作用。因此,全面的血清蛋白质组学可用于发现DN的新型蛋白质生物标志物,从而了解更多有关病理生理学的信息并提高诊断分层的准确性。尽管有许多研究探索血清蛋白质组学以寻找潜在的DN生物标志物,但由于方法限制,只能检测到有限数量的蛋白质。最近已经开展了涉及血清蛋白质组学以研究DN进展的研究,但它们无法区分DM和早期DN。此外,许多研究仅关注血清中的生物标志物,而很少有研究检查通过体外、细胞或动物模型鉴定的分子。因此,需要进一步探索基于血清蛋白质组学的DN进展生物标志物。




研究思路



作者使用健康对照(NC)、糖尿病患者(DM)、早中期DN(DN-EM)和晚期DN(DN-L)的血清样本,采用定量蛋白质组学和Mfuzz聚类分析,发现15种蛋白质在DN进展过程中表达增加,暗示它们具有生物标志物的潜力。随后,将Mfuzz聚类与加权基因共表达网络分析(WGCNA)相结合,筛选出了五个候选蛋白,并在小鼠中进行了实验验证。





数据来源



共招募了96名健康对照、糖尿病和糖尿病肾病参与者,通过纳排标准得出24名受试者,进一步将其分为四组,包括健康对照(NC)、糖尿病(DM)、早中期(DN-EM)和晚期(DN-L),每组6名进行液相色谱-串联质谱(LC-MS/MS)分析。




主要结果




1、参与者特征和血清蛋白质组分析评估 


作者共招募了96名受试者,在入组进行血清蛋白质组学分析时,他们的纳入和排除标准被重新设定,因此最终入组24名,按照全球肾脏病预后改善组织(KDIGO)对慢性肾脏病(CKD)eGFR的分类,他们进一步分为4组(图1A),每组6例。受试者的人口统计学和临床特征列于表1。

随后,用LC/MS鉴定出1602种蛋白质,其中1402种蛋白质可以定量(图1B)。与基于酶水解和质谱碎裂模式的一般规律一致,大多数肽段分布在7–20个氨基酸内,这表明质谱鉴定的肽长度分布符合质量控制标准(图1C)。为了确保血清样本和检测技术的可靠性,并确认定量结果的统计一致性,我们采用了一种综合方法,包括皮尔逊相关系数(PCC)、主成分分析(PCA)和相对标准偏差(RSD)评估。PCC分析显示所有标本之间存在高度相关性,相关系数普遍高于0.9(图1D)。PCA分析表明这些蛋白质可以成功区分这四个组(图1E)。值得强调的是,与其他阶段相比,DN-EM和DN-L组表现出最明显的差异。这表明在DN阶段蛋白质表达谱发生了显著改变。每组蛋白质的定量重复性都是可以接受的,如RSD箱线图所示(图1F)。




2、糖尿病肾病患者的血清蛋白质组分析


作者对血清蛋白质组学定量结果进行差异表达蛋白分析(p<0.05、FC>1.5和FC<1/1.5)。经过预处理和缺失值过滤后,热图共显示484个差异蛋白(图2A)。此外,还分析了NC,DM,DN-EM和DN-L组之间成对比较的火山图,以可视化差异表达蛋白(图2B-2G)。在组间成对比较的背景下,两个DN组与NCvs.DM组相比具有更多差异表达蛋白,并且与DN-EM和DN-L相比,NC组的差异表达蛋白最多(图2H)。然后,从组间成对比较中选出所有差异表达蛋白,并绘制了它们的UpSet图,结果显示,在DN-EM与NC、DN-L与NC、DN-EM与DM和DN-L与DM中存在40种常见上调蛋白和23种常见下调蛋白(图2I和2J)。



3、血清蛋白质组学揭示糖尿病肾病的进展 


利用血清蛋白质组学,作者执行了fuzzy c-means算法对潜在蛋白质进行聚类。总共观察到代表不同调控蛋白的5个时间模式簇(图3)。在这些簇中,簇1代表下调蛋白质,簇2和5代表上调蛋白质,簇3和4代表双峰表达蛋白质。在本研究中,重点关注在DN进展过程中升高的蛋白质,即簇2和5。随后,对每个簇中蛋白质进行GO分析,结果显示上调的蛋白质倾向于执行多种功能,包括细胞外基质(ECM)结构成分、细胞粘附分子结合、ECM、内质网腔和生物粘附(簇2)。Cluster2中蛋白质的KEGG通路主要富集在蛋白质的消化和吸收、PI3K-Akt信号通路、人乳头瘤病毒感染、ECM-受体相互作用以及内质网中的蛋白质加工(图3)。


为了获得可靠的DN诊断指标,作者设置了聚类成员资格、组内的RSD和聚cluster2中独特肽的数量。总共有16条肽符合条件,源自15种不同的蛋白质,包括ADAMDEC1、ADAMTSL4、AMBP、APOA4、AZGP1、CD44、COL18A1、COL6A3、EEA1、FBLN1、FBN1、HMGB1、MAN1A1、OAF和PTPRG(表S3)。比较了所有四个组中每种肽的表达水平(图4A),FBLN1、AZGP1、CD44、ADAMDEC1、ADAMTSL4和HMGB1组显示出显著差异(p<0.001)。为了探究DN进展的机制,将15种蛋白输入STRING数据库,上传至Cytoscape,构建PPI网络数据,使用Cytohubba插件按degree降序筛选出前21个核心蛋白(图4B)。根据最高分值,CD44、HMGB1和AMBP可能在DN进展中起关键作用。随后对这15种蛋白进行GO和KEGG富集分析,其功能主要与ECM结构和受体相互作用有关,ECM沉积在DN发展中起重要作用(图4C)。



4、高迁移率族蛋白B1是监测糖尿病肾病的生物标志物


使用WGCNA方法对所有蛋白质进行共表达网络分析,得到五个不同颜色的不同模块(图5A)。使用具有各种模块分配和蛋白质树状图的热图对DN蛋白质的拓扑重叠矩阵(TOM)进行初始可视化(图5B)。在此基础上,研究了模块特征基因与性状DN之间的模块-性状关系,DN组包含来自DM、DN-EM和DN-L组的所有蛋白质(图5C)。有趣的是,只有蓝色模块与性状NC(cor=0.51和p=0.01)和DN(cor=0.45和p=0.03)均最显著相关。最后,用维恩图探索了蓝色模块和聚类2中蛋白质的重叠(图5D,表2)。



研究表明HMGB1与DN的发展之间存在显著联系。基于ROC曲线分析,作者发现HMGB1是区分DN-EM与NC(ROC的AUC=0.917)、DN-L与NC(ROC的AUC=1.000)、DN-EM与DM(ROC的AUC=0.889)和DN-L与DM(ROC的AUC=1.000)的良好标记(图6A)。此外,HMGB1与eGFR(Pearson R=−0.787和p<0.001)、血尿素氮、血清肌酐比率(Pearson R=−0.631和p<0.001)呈负相关。同时,HMGB1与血尿素氮(Pearson R=0.646和p<0.001)、血清肌酐(Pearson R=0.688和p<0.001)和胱抑素c(Pearson R=0.661和p<0.001)呈正相关(图6B-6F)。这些研究结果表明,HMGB1可以准确监测疾病的状态,尤其是对于DN早期和晚期个体。



5、高迁移率族蛋白B1在糖尿病肾病模型中的研究


作者利用糖尿病小鼠来确定HMGB1在改善DN发展中的作用。与20周的糖尿病小鼠相比,28周的糖尿病小鼠肾脏出现了严重的病理生理改变。随着糖尿病的进展,肾脏组织损伤增加、胶原沉积和基底膜不规则增厚,表明糖尿病小鼠模型是可行的(图7A)。与对照组相比,注射STZ后20和28周的小鼠血糖水平明显升高(图7B),最重要的是,其血清肌酐(图7C)、尿素氮(图7D)和尿微量白蛋白与肌酐比率(ACR;图7E)水平(反映肾功能变化)随着糖尿病的发生而逐渐升高。


随着糖尿病小鼠肾脏组织的进展,HMGB1也显示出显著的上调。免疫荧光(图7F)和蛋白质印迹分析(图7G)显示,患有肾损伤的糖尿病小鼠的肾脏组织具有较高水平的HMGB1,并且该水平随着糖尿病持续时间的延长而增加。有趣的是,对照小鼠肾脏组织中HMGB1的表达随着年龄的增长而增加,尽管统计上并不显著(图7G)。此外,建立了DN肾小管上皮细胞(HK2细胞)的体外模型。在高葡萄糖培养基(30mM)中对HK2细胞进行时间依赖性培养,随着上皮-间质转化(EMT)变化的加剧,36小时时HMGB1蛋白水平升高(图7H)。通过免疫荧光观察处理过的HK2细胞的HMGB1表达情况,结果显示高糖刺激HK2细胞后,细胞核和细胞质中HMGB1的表达增加(图7I)。数据表明HMGB1是一种新发现的标记物,可以将其作为监测DN进展的潜在标记物进行评估。




文章小结



作者通过定量蛋白质组学研究了糖尿病患者或不同阶段的DN患者和健康对照者的蛋白质组,以了解DN进展过程中血清蛋白的变化。HMGB1、CD44、FBLN1、PTPRG和ADAMTSL4这五种有希望的生物标志物可以监测DN的进展,而HMGB1与肾功能改变高度相关,可以作为早期检测DN的合适标志物,尤其是区分健康对照者和DN患者。虽然没有足够的证据证明这些生物标志物可以取代DN的侵入性诊断,但随着进一步研究,这些蛋白质组学变化可能有助于临床医生在早期识别DN。









上一篇:代谢健康肥胖与女性不孕症之间的关联

下一篇:探寻心血管疾病与主动脉病变之间的因果关系:孟德尔随机化分析揭示新视角



邮编:400000
联系电话:13651835632
电子邮件:zhoubaihao910@126.com
地址:重庆市沙坪坝区龙湖光年4号楼
Copyright © 2022 重庆嘉舟生物科技有限公司 All Rights Reserved 渝ICP备2022013225号