发布时间: 2025-10-10 14:14:19
✦THE LANCET
1.因果深度学习用于实时检测心脏手术相关急性肾损伤:七个时间序列队列的推导和验证
Causal deep learning for real-time detection of cardiac surgery-associated acute kidney injury: derivation and validation in seven time-series cohorts
(1)背景:本研究旨在解决心脏手术相关急性肾损伤(CSA-AKI)的早期预测难题。由于CSA-AKI显著增加患者死亡风险,而现有方法存在识别能力有限、泛化性差及临床实施门槛高等问题,研究团队提出了一种名为REACT的新型因果深度学习架构。该模型通过整合来自中、美多家医疗中心的超63,000名患者的时间序列数据,试图从复杂临床变量中提炼出具有因果关联的关键因素,以实现术后48小时内CSA-AKI风险的动态、精准预测,并为临床提供可实际应用的决策支持工具。
(2)解释:研究结论表明,REACT成功将初始1,328个变量蒸馏为六个核心因果变量,在内部验证中表现出色(平均AUROC=0.930),并在外部多中心及跨国验证中保持一致的高性能(平均AUROC=0.920)。与主流深度学习模型及临床指南推荐方法相比,REACT不仅预测精度更高,还能平均提前16.35小时识别CSA-AKI事件,且仅需极少输入变量即可运行。此外,通过前瞻性临床验证(纳入754名患者),REACT显示出93.8%的异常事件捕捉率及良好的敏感度(0.825)与特异度(0.811),证实其可作为可靠的床边评估工具应用于真实临床环境。
2.开发多任务深度学习系统对 MRI 上九种常见膝关节异常进行分类:一项大规模、多中心、逐步验证研究
Development of a multi-task deep learning system for classification of nine common knee abnormalities on MRI: a large-scale, multicentre, stepwise validation study
(1)背景:本研究旨在开发并验证一个基于多任务深度学习系统(DLS),用于分类膝关节MRI中九种常见异常(包括主要异常如半月板撕裂、软骨缺损和前交叉韧带撕裂,以及次要异常如后交叉韧带损伤、内侧副韧带损伤等)。研究通过大规模、多中心回顾性数据(涵盖2010年至2022年五家医院的13,419名患者及14,962次MRI扫描),构建一个注意力引导的粗到细模型,以提升诊断的全面性和准确性。
(2)解释:本研究证实所开发的DLS在分类九种膝关节异常方面表现出色(内部测试集AUC达0.898–0.815),尤其在主要异常分类上与资深放射科医生准确率相当。通过多读者多案例研究及随机对照试验,DLS作为辅助工具显著提升了所有经验级别医生的诊断性能(净重分类指数NRI 0.0446–0.1756,所有p < 0.05),并减少解读时间(平均节省30.7–35.5秒)。此外,DLS在复杂病例(如ACL撕裂伴血肿、慢性PCL损伤)中表现出优势,减少了过度诊断与漏诊。
3.食管胃交界处腺癌内镜诊断人工智能基础模型的开发与验证:一项队列研究和深度学习研究
Development and validation of an AI foundation model for endoscopic diagnosis of esophagogastric junction adenocarcinoma: a cohort and deep learning study
(1)背景:该文章旨在开发并验证一个基于人工智能基础模型的创新方法,用于食管胃交界腺癌(EGJA)的内窥镜筛查和分期诊断,以解决当前EGJA诊断高度依赖操作者经验、早期检测率低的问题。作为首次尝试利用AI基础模型进行EGJA分期诊断的研究,它结合了先进的视觉基础模型DINOv2和典型的卷积神经网络ResNet50,通过混合专家(MoE)架构融合这些特征,实现 robust 的特征表示。研究基于多中心设计,收集了来自七家中国医院的12,302张内窥镜图像(涉及1,546名患者,包括早期EGJA、晚期EGJA和对照组),并将数据分为训练集、保留测试集、外部测试集和前瞻性测试集,以确保模型的泛化性和可靠性。最终目标是通过AI技术提升EGJA诊断的准确性、效率性和可解释性,为临床实践提供辅助工具。。
(2)解释:该文章的结论是所开发的AI模型在EGJA分期诊断中表现出卓越的性能、泛化能力和临床适用性。在多个测试集上,模型 achieving accuracy of 0.9256、0.8895和0.8956 respectively,显著优于其他代表性AI模型(如ResNet50)和不同经验水平的内镜医生(所有P < 0.05),同时AI辅助评估显示,模型能显著提升内镜医生的诊断准确性,例如受训医生、合格医生和专家医生的准确率分别从0.7035、0.7350和0.8147提高到0.8497、0.8521和0.8696。此外,模型通过Grad-CAM和t-SNE可视化提供可解释性,突出关键诊断特征,增强了临床信任度。尽管存在数据来源区域限制和成像模态限制等局限性,但模型证明了作为临床辅助工具的潜力,能改善诊断精度、减少操作者变异,并支持精准治疗决策。
4.用于原发性腹膜后肿瘤诊断和分割的端到端深度学习模型:一项多中心队列研究
End-to-end deep learning model for the diagnosis and segmentation of primary retroperitoneal neoplasm: a multicenter cohort study
(1)背景:该研究旨在开发并验证一个端到端的深度学习模型REMIND(REtroperitoneal neoplasMs artificial-INtelligence Diagnosis),用于原发性腹膜后肿瘤(PRNs)的精确诊断和分割。研究基于多中心增强CT图像数据,覆盖七种常见PRN类型,以解决当前PRN诊断依赖放射科医生经验、存在高误诊率和主观差异的临床难题。通过整合大规模回顾性和前瞻性数据,REMIND采用基于nnU-Net的架构实现像素级分类与分割,旨在提供一个自动化、可解释的AI工具,提升诊断一致性并辅助临床决策。
(2)解释:REMIND模型在多项验证中表现出色:在七分类任务中,训练集、外部验证集和前瞻性验证集的Top-1准确率分别达0.66、0.61和0.63,分割任务的Dice分数均高于0.72。读者研究显示,REMIND的诊断准确率显著优于初级和中级放射科医生(64.0% vs. 42.6%和57.4%),与资深医生相当(64.0% vs. 64.3%),且AI辅助使所有医生组别的诊断准确率、确定性显著提升(初级医生准确率从42.6%升至60.8%),同时大幅缩短解读时间。模型的可视化分析增强了其临床可解释性。尽管存在少数类型性能略低及样本量限制,REMIND证明了其作为PRN诊断辅助工具的潜力,有望减少工作量并推动诊疗标准化。

上一篇:基于非造影计算机断层扫描的自发性脑出血患者 90 天预后结果的机器学习模型的开发和验证
下一篇:真性红细胞增多症患者白细胞计数升高与血栓事件之间的关联