肝硬化患者一旦进入失代偿期,其病死率显著增加,如何早期发现有肝功能恶化风险的患者是十分重要的问题。在第57届欧洲肝病研究学会年会(EASL2022)暨2022年国际肝脏大会TM(ILC 2022)上,德国学者Sophie Elisabeth Müller等人报道了一项应用机器学习技术预测肝硬化失代偿参数的研究(摘要号:THU500)。《国际肝病》特邀南开大学人民医院/天津市人民医院韩涛教授对该项研究进行点评。
机器学习技术能预测肝脏失代偿吗?对德国三个转诊中心招募的1415名肝硬化患者的分析
背景和目的
由于肝硬化患者失代偿的病死率显著增加,因此,早期发现有肝功能恶化风险的患者是至关重要的。该研究旨在应用机器学习技术来识别预测肝脏失代偿的参数。
方 法
使用Python、Keras和Scikit-Learn,包括决策树、随机森林、神经网络和支持向量机(SVM)在内的机器学习技术,对INCA试验数据库进行分析。该数据库包含来自德国三所大学医院(Homburg, Halle, Jena)的1415名肝硬化患者的前瞻性和回顾性数据。除实验室数据和病史外,还分析了遗传资料[包括核苷酸结合寡聚结构域蛋白2(NOD2)基因型]。模型构建和验证队列的比例为85:15。Ward最小方差法对数值变量进行基于Spearman秩序相关的分层聚类后,利用置换特征重要性(Permutation Feature Importance, PFI)技术来评估特征对失代偿预测的影响。
结 果
数据收集时,313名患者一直处于代偿期,354名患者曾经失代偿,748名患者目前正处于失代偿期。825名患者进行了随访(中位时间12个月,最长55个月),其中46.5%的患者在随访期间出现失代偿。SVM在预测失代偿方面表现最佳,在回顾性评估中训练数据集的准确率为84.1%,测试数据集的准确率为77.7%,在前瞻性分析中的准确率分别为78.4%和73.8%。
PFI显示白蛋白和胆红素的基线水平以及最低血清钠浓度是与既往失代偿有关的最高等级参数。胆红素的最高水平以及钠和白蛋白的基线水平是前瞻性数据中最准确的变量。除了MELD和Child-Pugh评分等已有评分体系参数外,NOD2基因型和与感染有关的参数(如炎症标志物和抗生素使用)也排名靠前。
结 论
在测试的机器学习模型中,SVM似乎在预测肝脏失代偿方面具有最高的准确性。除了经典的实验室参数外,遗传因素和感染是SVM预测个体情况的关键参数。
专家点评
肝硬化患者一旦进入失代偿期,会出现多种严重威胁生命的并发症,其病死率明显增加,早期预测、及时发现与干预有肝功能失代偿风险的患者,对于改善肝硬化患者的预后具有十分重要的意义。近年来,随着人工智能技术的不断进步,在医学领域的应用越来越广泛。机器学习技术在预测疾病进展的研究也越来越多。
本届EASL年会上,德国学者Sophie Elisabeth Müller等人报道的应用机器学习技术预测肝硬化失代偿参数的研究表明机器学习技术中SVM在预测肝脏失代偿方面具有较高的准确性,筛选的参数与既往临床已经确立的评价指标具有较好的一致性。除经典指标外,还发现遗传因素与感染也是十分重要的参数,提示我们需要进一步加强相关研究工作。
该项研究初步展示了利用人工智能技术在辅助临床决策中的良好前景,今后有必要进一步加强多学科交叉协作,不断拓展与提高其在临床应用的能力。
往期推荐