%A 杨丽蓉, 王羽丰 %T 预测浆液性卵巢癌术后复发远处转移风险机器学习模型的构建 %0 Journal Article %D 2023 %J 国际肿瘤学杂志 %R 10.3760/cma.j.cn371439-20221214-00043 %P 220-226 %V 50 %N 4 %U {https://gjzlx.sdfmu.edu.cn/CN/abstract/article_11277.shtml} %8 2023-04-08 %X

目的利用常规临床数据开发浆液性卵巢癌(SOC)术后复发远处转移风险机器学习预测模型。方法收集2010年1月至2020年12月在云南省肿瘤医院行手术治疗后复发的687例SOC患者为研究对象。根据复发状态将患者分为远处转移组(n=105)及非远处转移组(n=582)。采用logistic回归筛选SOC远处转移相关变量,运用K最近邻(KNN)、逻辑回归(LR)、随机森林(RF)、支持向量机(SVM)和极限梯度提升(XGBoost)5种机器学习算法开发SOC术后复发远处转移风险预测模型。在模型验证方面,采用十折交叉验证方法进行内部验证。模型的性能使用受试者工作特征曲线评估。结果远处转移组与非远处转移组患者国际妇产科联盟(FIGO)分期(Z=-3.81,P<0.001)、围手术期化疗周期(t=-5.11,P<0.001)、淋巴结转移(χ2=5.98,P=0.014)、腹腔积液细胞学(Z=-2.22,P=0.026)、新辅助化疗(χ2=5.29,P=0.021)差异均具有统计学意义。多因素分析结果显示,FIGO分期(OR=1.54,95%CI为1.07~2.22,P=0.019)和围手术期化疗周期(OR=1.22,95%CI为0.09~0.36,P<0.001)是SOC术后复发时发生远处转移的独立影响因素。腹腔积液细胞学(OR=1.20,95%CI为0.71~1.89,P=0.180)不是SOC远处转移的独立影响因素,结合文献观点将其纳入后可提高模型的曲线下面积(AUC),最终将其纳入模型的构建。基于上述3个变量构建的5个机器学习模型中,基于KNN构建的模型识别SOC远处转移的性能最佳,AUC为0.750、敏感性为0.591、特异性为0.786、准确率为85.0%;LR模型的AUC为0.679、敏感性为0.545、特异性为0.765、准确率为84.3%;SVM模型的AUC为0.634、敏感性0.240、特异性为0.968、准确率为84.7%;RF模型的AUC为0.575、敏感性0.905、特异性为0.245、准确率为84.7%;XGBoost模型的AUC为0.704、敏感性0.567、特异性为0.745、准确率为84.9%。结论FIGO分期、围手术期化疗周期为SOC术后发生远处转移的独立影响因素;基于FIGO分期、围手术期化疗周期及腹腔积液细胞学构建的KNN模型预测SOC术后复发远处转移具有较高的区分度与准确率。