发布时间: 2025-03-06 13:25:19
2025年1月22日,HualongMa等人在《EClinicalMedicine》杂志上发表了一篇题为《Performance of an AI prediction tool for new-onset atrial fibrillation after coronary artery bypass grafting》的文章。该文献旨在开发和验证一种基于人工智能(AI)的预测模型,用于准确预测冠状动脉搭桥术(CABG)后新发房颤(NOAF)(图1A),并创建一个用户友好的网页临床工具(图1B)。
图1 A部分:第一阶段涉及使用通过堆叠技术堆叠的11个基础学习器为接受CABG的患者开发NOAF预测模型,并进行内部和外部验证。B部分:第二阶段侧重于创建一个用户友好的网页临床工具。
研究背景
CABG是治疗严重冠状动脉疾病的主要手段,术后NOAF是其最常见的并发症(发病率20%-40%),导致住院时间延长、脑血管事件风险增加(10年HR=1.53)及长期死亡率增加。尽管已有管理指南,但近年NOAF发病率未显著下降。当前预测工具(如CHA2DS2-VASc、HATCH、POAF评分)存在局限性,其AUC仅为0.64-0.76,且依赖线性模型,无法捕捉NOAF的多因素复杂性。大部分研究多基于单中心小样本或术后变量,限制了术前决策的实用性。本研究旨在开发并验证一种基于AI的临床预测模型,利用术前可获取的临床参数(如脑钠肽、左心室功能指标)预测NOAF,并创建一个用户友好的网页临床工具。
数据来源
研究纳入中国两家三级医院2015年3月至2024年7月接受CABG的2994例患者,其中2486例来自医院A(模型开发队列,按7:3分为训练集与测试集),508例来自医院B(外部验证队列)。
研究方法
研究采用回顾性多中心设计,分两阶段:1)模型开发与验证;2)临床工具构建。
模型构建:通过LASSO回归和逻辑回归筛选出12个关键变量(年龄、脑钠肽、左室舒张末期内径、射血分数、BMI、β受体阻滞剂使用、手术时长、中性粒细胞百分比/白蛋白比值、心梗史、左房直径、高血压、吸烟),使用SMOTE处理类别不平衡。共构建了11个基础学习器(逻辑回归、K最近邻、朴素贝叶斯、决策树分类、随机森林、支持向量、极端梯度提升、轻量梯度提升机、自适应增强、CatBoost、多层感知机),通过堆叠集成(Stacking)以逻辑回归为元学习器,网格搜索优化超参数,5折交叉验证防止过拟合。评估指标包括准确率、精确率、召回率、F1分数、AUC、校准曲线及Hosmer-Lemeshow检验。外部验证对比CHA2DS2-VASc、HATCH、POAF评分的预测性能,并通过SHAP值解释特征重要性。
“
图2 A部分:参与者流程图。B部分:LASSO回归中纳入了21个特征。图中的虚线表示最优的α值,左边12个特征具有非零系数。C部分:使用逻辑回归对12个特征进行进一步选择。统计上显著的12个特征经过SMOTE处理,以解决NOAF阳性样本的不平衡问题,从而形成最终的数据集E。
结果
1
患者基本特征
最初收集了4003名患者的数据;根据纳入和排除标准,共纳入2994例病例:2486例来自医院A,508例来自医院B(图1A)。模型开发队列的平均年龄为63.98±6.89岁,其中75.62%的患者为男性。NOAF的总体发病率为26.69%。术后第三天,窦性心律维持率为90.64%(95%CI:89.54%–91.63%)。Kaplan-Meier分析显示,NOAF的发生率最高发生在术后第1天至第5天之间(图3A)。
2
特征选择
如图2所示,单变量分析确定了NOAF组和非NOAF组之间具有统计学显著差异的21个特征,包括年龄、教育水平和吸烟状况等(P<0.05)。对这些特征进行LASSO回归分析,在最佳惩罚下确定了12个具有非零系数的变量:年龄、左心室射血分数、左心房直径、左心室舒张末期直径、BMI、手术持续时间、脑钠肽、中性粒细胞百分比与白蛋白比率、高血压、β受体阻滞剂的使用、心肌梗死和吸烟状况。然后将这12个变量纳入二元逻辑回归,模型对数似然比得出的P<0.001,表明统计显著且模型有效。在逻辑回归分析中发现,所有12个变量都是重要的预测因子。
3
堆叠模型开发
使用数据集E中的12个变量作为输入,以NOAF作为预测标签,开发了11个基础学习器(图2C和图1A)。使用Stacking策略集成这些基础学习器,并对模型进行了内部和外部验证。图3C和D分别描绘了内部和外部验证的ROC和决策曲线分析(DCA)结果。表1显示了每个模型的性能指标,其中Stacking模型在模型开发队列和验证队列中均获得了最高的AUC和F1分数。Hosmer-Lemeshow检验(P=0.217)同样证实了Stacking模型提供了最佳的整体预测性能,概率校准曲线如图3E所示。在基础学习器中,AdaBoost在派生队列中表现出最高的AUC,证明了其强大的性能。因此,基于AdaBoost模型绘制了SHAP值(图3B),揭示了预测NOAF的最重要的特征。此外,如图3D所示,在独立外部验证中,Stacking模型的AUC值高于现有POAF预测工具([POAF评分:0.667,HATCH评分:0.708,CHA2DS2-VASc评分:0.713] vs. 0.931,所有P<0.05),显示出卓越的预测性能。
4
临床工具
利用Stacking模型,我们开发了一个临床工具(图1B),该工具可以根据简单的数字输入自动计算NOAF风险,为临床医生提供实时预测见解。
图3 A:CABG术后窦性心律维持率。B:SHAP图。C:左侧显示内部验证集的ROC曲线;右侧显示内部验证集的临床决策曲线。D部分:所有模型在外部验证集上的表现。E部分:概率校准曲线。
总结
本研究成功开发了一种基于堆叠集成学习的AI预测模型,能够通过12项术前特征准确预测CABG术后NOAF风险,其AUC(0.931)显著优于现有临床预测模型。通过SHAP值提供可解释性,并转化为用户友好的网页工具。
上一篇:基于AEA、孕激素和β-hCG的机器学习工具构建模型以预测中国孕早期先兆流产风险