欢迎与万川携手      
共创美好未来
万川医疗健康产业集团

新闻资讯
万川资讯
行业动态
政府政策
首页 >> 新闻资讯 >> 内容浏览        
【论著】糖尿病前期亚型的识别及其预后的相关性研究:基于6个变量的数据驱动聚类分析

          2025-07-31   浏览:32

糖尿病前期是由正常血糖向糖尿病过渡的中间高血糖状态 [ 1 ] 。自然病程中,糖尿病前期人群每年5%~10%进展为糖尿病,但同时有相近比例的人群可逆转为正常血糖程 [ 2-3 ] 。相较于血糖正常人群,糖尿病前期人群心血管疾病(cardiovascular disease,CVD)风险增加 15%,全因死亡率风险增加 13% [ 4 ] 。有研究显示,随访 2.3年后,合并糖尿病前期的心力衰竭患者 CVD 风险增加 59%,全因死亡率风险增加29% [ 5 ]  

芬兰糖尿病预防研究 [ 6 ] 和大庆糖尿病预防研究 [ 7 ] 证明,饮食与运动干预是阻止糖尿病前期患者发展为 2 型糖尿病(type 2 diabetes mellitus,T2DM)并降低 CVD发生率的最重要干预方式。但糖尿病前期管理策略仍存在争议,仍然是需要进一步研究的重要问题 [ 8 ] 。例如,高风险人群基数庞大,防控成本持续攀升;而部分患者未经干预即可恢复到正常血糖水平 [ 9 ] ,提示可能存在过度干预风险。

为了实现健康获益与卫生经济学的平衡,糖尿病前期人群精准分型对实施精准防控至关重要。现有研究虽已建立数据驱动的糖尿病前期亚型与临床预后的关联 [ 10-12 ] ,但尚未见有研究系统分析不同亚型的远期T2DM风险及CVD风险差异。本研究旨在检验和验证6个代谢参数是否支持糖尿病前期分型,并揭示疾病转归异质性,为分层干预策略提供依据。

资料与方法

一、研究对象

本研究为队列研究。本研究中糖尿病前期人群数据源自中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS; 2011—2020 年 ;3 340 例)及英国老年纵向研究(English Longitudinal Study of Aging,ELSA;2008— 2018 年;1 529 例)。CHARLS 和 ELSA 的设计方案和主要研究结果已在系列文献中详细阐述 [ 13-19 ] 

所有参与者均签署知情同意书。CHARLS 获得了北京大学生物医学伦理审查委员会的批准(批准号:IRB00001052?11015)。ELSA 获得了国家研究与伦理服务下属的国民健康服务研究伦理委员会的批准(批准号如下。第4轮:07/H0716/48;第5轮:09/H0505/124;第6轮:11/SC/0374;第7轮:13/ SC/0532;第8轮:15/SC/0526;第9轮:17/SC/0588)。

二、研究方法 

1. 人群资料的采集:采集参与者的一般情况,包括年龄、性别、教育水平(初中及以下或高中及以上)、婚姻状况(已婚或其他)和居住地(城市或农村)。生活习惯因素,包括吸烟(吸烟或其他)和饮酒(饮酒或其他),吸烟状况通过标准化问题确定: “您目前仍有吸烟习惯还是已经完全戒烟?”,回答 “仍有”的参与者被定义为吸烟,饮酒定义为每月饮酒频率超过 1 次。既往病史,包括 T2DM、CVD、高血压和血脂异常等。生理生化指标,包括收缩压(systolic blood pressure,SBP)、舒 张压(diastolic blood pressure,DBP)、身高、体重、高密度脂蛋白胆固醇(high?density lipoprotein cholesterol,HDL?C)、低密 度脂蛋白胆固醇(low?density lipoprotein cholesterol,LDL?C)、总胆固醇(total cholesterol, TC)、甘油三酯(triglycerides,TG)、空腹血糖(fasting plasma glucose,FPG)和糖化血红蛋白(glycated hemoglobin 1cHbA 1c)。计算体重指数(body mass index,BMI)及腰围身高比(waist?to?height ratio, WHtR),WHtR=腰围(cm)/身高(cm)。 

2. 糖尿病前期诊断:根据美国糖尿病学会 2010年版指南 [ 1 ] ,糖尿病前期定义为在非糖尿病人群中,FPG 5.6~6.9 mmol/L或HbA 1c 5.7%~6.4%。 

3.结局和代谢状态:T2DM 定义为 FPG≥ 7.0 mmol/L、HbA1c≥6.5% [ 1 ] 或临床诊断(自述医师确诊或正在使用降糖药物)。CVD定义为自我报告的医师确诊,包括脑卒中、冠心病、心绞痛、心肌梗死、心力衰竭或其他心脏问题。T2DM和CVD的发病时间通过两种方法确定:(1)自述确诊日期或确诊年龄;(2)对于未提供具体确诊时间的T2DM患者,发病时间估算为最近两次调查的中位时间。血压值采用3次测量均值。高血压定义为:SBP≥140 mmHg(1 mmHg= 0.133 kPa),或DBP≥90 mmHg,或自述医师确诊或正在使用降压药物。血脂异常定义为:TC≥6.20 mmol/L,或 LDL?C≥4.13 mmol/L,或TG≥2.25 mmol/L,或HDL?C< 1.03 mmol/L [ 20 ] ,或自述医师确诊或正在使用调脂药物。

三、统计学分析

采用统计软件 R 4.2.2 进行统计学分析。Kolmogorov?Smirnov 检验分析计量资料是否符合正态分布。正态分布的计量资料示,偏态分布的计量资料以[M(1 ,3 )]表示,计数资料以频数和百分比表示。

根据以下标准选择关键变量:(1)对于表征糖尿病前期至关重要;(2)在临床中为常规检测项目;(3)易于解释且具有明确生理意义。最终纳入6个代谢指标包括SBP、HDL?C、LDL?C、FPG、HbA 1c 和BMI进行聚类分析。聚类分析前将变量数值进行标准化(均值= 0,标准差=1)转换,剔除极端离群值(绝对标准化水平>5)。

本研究采用两阶段聚类。第一阶段,通过对 100个随机子样本(80% 无放回抽样)进行 K?means 聚类(使用欧氏距离)以确定最佳聚类数量(K=2,3,……,8) [ 12,21 ] 。根据一致性矩阵热图、累积分布函数图和一致性得分确定最佳聚类数为 7。第二阶段,运用“fpc”包中的kmeansruns函数(runs=100)通过 K?means 聚类将患者分为 7 个类别。使用 “fpc”包中的 clusterboot 函数,采用 bootstrap 重抽样(n=100)结合 Jaccard 相似度评估聚类稳定性,当 Jaccard相似度>0.75时认为聚类稳定 [ 22 ] 。 

T2DM和CVD的发病率以每100人年事件数表示。采用Cox比例风险模型估计各聚类的T2DM和 CVD 的发病风险。采用 Cox 比例风险回归模型分析 T2DM 和 CVD 发生的危险因素。由于 T2DM 事件数不足,未估计 ELSA 中的 T2DM 风险。所有分析均采用双侧检验。以 P<0.05 为差异有统计学意义。

结 果

一、患者纳入情况

在 17 705 名 CHARLS 基线人群中,排除:非糖尿病前期者(12 461名);已确诊癌症、CVD或T2DM 者(1 172 名);缺失基线生理生化测量数据者(706 名);存在异常值者(26 名)。最终分析纳入 3 340 例糖尿病前期个体(图 1),随访至 2020 年。 ELSA人群纳入流程图见图2。

图1 中国健康与养老追踪调查(CHARLS)研究参与者筛选流程图


图2 英国老年纵向研究(ELSA)参与者筛选流程图

二、确定最佳聚类数量

最终纳入 6 个代谢指标,包括 SBP、HDL?C、 LDL?C、FPG、HbA 1c 和 BMI 进行聚类分析。在不同聚类数量下生成一致性矩阵热图,在K=7时表现出最明显的分离,白色和蓝色模块具有最大的纯度。在 K=7 时,所有聚类的平均一致性得分均超过 0.75(各聚类平均一致性得分:聚类1:0.87、聚类2: 0.79、聚类3:0.80、聚类4:0.82、聚类5:0.90、聚类6: 0.91、聚类 7:0.81),较高的值表明聚类具有更好的稳定性。

三、7个聚类的代谢特征

基于 CHARLS和 ELSA数据识别出的 7个聚类的患者特征如表1,2所示。这7个聚类表现出独特的代谢特征(图3,表3),每个聚类的Jaccard相似度均 大 于 0.75(分别为 0.81、0.84、0.75、0.81、0.87、 0.81 和 0.82)。这些聚类的特征为:聚类 1(646 例, 19.34%,代谢指标正常型);聚类2(532例,15.93%,高 HDL?C 型);聚类 3(351 例,10.51%,高血压型);聚类 4(467 例 ,13.98%,高 HbA 1c 型 );聚类 5(435 例,13.02%,高 LDL?C 型);聚类 6(468 例, 14.01%,高 BMI型);聚类 7(441例,13.20%,高 FPG 型)。这些聚类在ELSA中得到了验证(图4)。

图4 英国老年纵向研究中各聚类代谢变量分布(1 529例)。所有代谢变量的值都经过中心化标准化处理(均值=0,标准差=1)。A:聚类1(代谢指标正常型);B:聚类2(高HDL?C型);C:聚类3(高血压型);D:聚类4(高HbA 1c 型);E:聚类5(高LDL?C型);F:聚类6(高BMI型);G:聚类7(高FPG型)

四、聚类与结局的关联

在CHARLS研究中,在平均9年的随访期间,高 FPG型显示出最高的T2DM发病率,其次是高BMI型。代谢指标正常型表现出最低的T2DM发病率(图5),提示了代谢综合管理对T2DM预防的临床价值。与代谢指标正常型相比,在调整后的模型2中,高HbA 1c 型(HR 1.49,95%CI 1.06~2.08)、高LDL?C型(HR 1.54, 95%CI 1.11~2.15)、高BMI型(HR 2.72,95%CI 2.00~ 3.70)和高FPG型(HR 2.75,95%CI 2.03~3.74)显示出更高的T2DM风险。与高HDL?C型相比,在调整后的模型2中,高血压型(HR 1.52,95%CI 1.16~2.01)显示出升高的CVD风险。


图5 中国健康与养老追踪调查中各聚类间疾病风险的比较(3 340例)。2型糖尿病和心血管疾病的发病率按每100人年观察事件数计算。模型1调整了年龄和性别,模型2在模型1的基础上调整了教育水平、婚姻状况、吸烟状况、饮酒情况、是否使用降压药物、是否使用调脂药物和腰围身高比。以发病率最低的聚类作为参照组

在 ELSA 研究中,在平均 8.5 年的随访期间,高 HDL?C 型表现出最低的 CVD 发病率(图6)。与高 HDL?C 型相比,在调整后的模型 2 中,高血压型(HR 1.96,95%CI 1.04~3.67)、高HbA 1c 型(HR 1.98,95%CI 1.04~3.75)和高 FPG 型(HR 3.16,95%CI 1.68~5.91)显示出更高的CVD风险。    


图6 英国老年纵向研究中各聚类间心血管疾病风险的比较(1 529 例)。心血管疾病的发病率按每 100 人年观察事件数计算。模型 1调整了年龄和性别,模型2在模型1的基础上调整了教育水平、婚姻状况、吸烟状况、饮酒情况、是否使用降压药物、是否使用调脂药物和腰围身高比。以发病率最低的聚类作为参照组

讨 论

糖尿病前期的患病率存在显著的地域异质性,欧洲人群约为 10%,与 T2DM 的患病率相似 [ 23 ],而中国人群患病率达 35.6% [ 24 ] 。该阶段人群具有更高的 CVD 风险和死亡率。研究表明,生活方式干预可有效预防糖尿病前期进展。然而,高风险人群基数大、预防成本高,且部分患者可自行恢复正常血糖代谢,亟需建立代谢表型驱动的糖尿病前期精准分型体系,提供识别高风险人群代谢异质性和实施个体化干预的依据。

最近几项研究也分析了糖尿病前期亚型 [ 10-12 ] 。有研究分析了不同聚类的 T2DM 风险。Liu等 [ 11 ] 基于 BMI、甘油三酯?葡萄糖(triglyceride?and?glucose, TyG)指数和HbA 1c ,通过 K?means 算法在中国人群发现了 3 个亚组并揭示了糖尿病进展和缓解的风险差异。Zheng等 [ 12 ] 使用HbA 1c 、肝酶和稳态模型评估胰岛素抵抗指数(homoeostasis model assessment of insulin resistance,HOMA?IR)等 12 项代谢指标,使用K?means算法在中国人群发现了6个亚型并分析了 T2DM和慢性肾脏病的比值比和随访 3.1年的 CVD 风险比。这些研究并未阐明不同表型聚类的长期T2DM风险,且仅关注中国人群。本研究将糖尿病前期个体分为7个可重复的聚类,每个聚类都表现出不同的代谢特征以及T2DM和CVD的风险。其中 4 个聚类(高HbA 1c 型、高 LDL?C 型、高 BMI 型和高 FPG 型)显示出增加的 T2DM 风险。此外,高血压型与较高的 CVD风险相关。本研究展示了不同聚类的远期T2DM和CVD风险,且在欧洲人群进行了验证,突破了既往研究的地域限制性,为糖尿病前期精准防控提供了跨种族证据支持。

本研究构建的糖尿病前期代谢分型体系,核心目标在于揭示疾病异质性特征而非直接指导临床个体化诊疗。我们使用了能够反映糖尿病前期代谢特征且易于测量的变量,包括SBP、HDL?C、LDL?C、 FPG、HbA 1c 和 BMI 进行聚类分析。因此,这种聚类方法既适用于现有糖尿病前期队列(如药物试验)的二次分析,也可作为门诊糖尿病前期患者评估的辅助工具。这些亚型的识别提示了潜在的治疗策略。高血压型具有增加的T2DM和CVD 风险,可能从减重、生活方式干预和降压治疗中获益 [ 25-26 ] 。HbA 1c 型和高FPG型具有增加的T2DM风险,可能从减重、营养治疗、体育活动和降糖药物中获益 [ 27-29 ] 。高LDL?C型具有增加的T2DM风险,可能从减重、生活方式干预和血脂治疗中获益 [ 30 ] 。高 BMI 型具有增加的T2DM风险,可能从营养治疗、体育活动和减重药物或手术中获益 [ 31 ] 。未来可以开展基于不同分型的早期干预研究进行验证。

本研究结果在英国队列ELSA中得到验证。但 CHARLS 与 ELSA 队列存在 CVD 风险异质性。高血压型在 CHARLS 和 ELSA 研究中均显示 CVD 风险增加,这与既往研究一致,即高血压是 CVD最重要的危险因素 [ 27,32 ] 。 HbA 1c 型和高 FPG 型在 ELSA 研究中显示出增加的 CVD 风险 ,但在 CHARLS 研究中没有,这可能是因为 ELSA 研究中的高 HbA 1c 型和高 FPG 型中 FPG 与HbA 1c 的特征不同(高HbA 1c 型:CHARLS中FPG中位数满足糖尿病前期诊断标准而HbA 1c 不满足,ELSA 中HbA 1c 中位数满足糖尿病前期诊断标准而FPG不满足;高FPG 型:CHARLS中FPG中位数满足糖尿病前期诊断标准而 HbA 1c 不满足,ELSA 中HbA 1c 和 FPG 中位数均满足糖尿病前期诊断标准),且 ELSA 中高HbA 1c 型和高FPG型血脂异常比例较高。

本研究存在以下局限性。第一,由于发病事件数不足限制了在 ELSA 研究中评估 T2DM 的风险。第二,聚类分析纳入的与T2DM相关的危险因素没有考虑生活方式、遗传影响和疾病家族史等。第三,缺乏基于胰岛素或C肽水平计算的β细胞功能及胰岛素抵抗指标。第四,糖尿病前期和T2DM的诊断标准仅基于FPG和HbA 1c,可能存在潜在偏差。第五,本研究使用了 6 个变量进行聚类分析,不确定其他一些变量(如糖负荷或者餐后 2 h 血糖和肝酶)对糖尿病前期分型以及转归预测的增量价值。

综上,本研究证实了在无T2DM和CVD的糖尿病前期个体中进行聚类分析的可行性,揭示其代谢异质性特征。不同亚型可能提示导致代谢并发症结局的潜在关键病理生理机制,但并非旨在临床实践中对个体进行分类。该分型体系需通过队列研究进一步验证和完善,从而为T2DM和CVD的靶向预防和治疗建议提供进一步参考。

                                                                                 联系我们 | 工作机会 | 合作伙伴 | 关于万川 | 员工服务 | 物流查询 | 万川视频    

 

版权所有:江苏万川医疗健康产业集团有限公司 Varsal ©     法律声明

ICP:苏ICP备14047837号-1  


南京万川医药 信息部 建设与维护