目的基于机器学习(ML)算法构建食管癌患者同步放化疗(CRT)过程中发生≥2级放射性食管炎(RE)的预测模型。方法回顾性分析2018年1月至2023年1月在安徽医科大学附属六安医院接受CRT的276例食管癌患者的临床资料,根据美国放射肿瘤治疗协作组RE分级标准评估是否发生RE,以发生≥2级RE为结局事件。通过最小绝对值收敛和选择算子(LASSO)回归筛选变量后重新建立数据集,将数据集以7∶3的比例分为训练集(n=193)及测试集(n=83),纳入到随机森林(RF)、决策树(DT)、极端梯度提升(XGboost)、支持向量机(SVM)4种ML模型中。在训练集中进行数据训练、模型优化,测试集用于受试者操作特征(ROC)曲线评价模型效果,计算曲线下面积(AUC)、精确度、准确度、敏感性、F1分数对模型进行评估,使用SHAP分析解释最优模型。结果至随访结束,91例(32.97%)食管癌患者在CRT期间发生≥2级RE。≥2级RE发生组(n=91)与未发生组(n=185)患者肿瘤病灶长径(Z=-5.53,P<0.001)、Karnofsky功能状态(KPS)评分(χ²=5.92,P=0.015)、美国东部肿瘤协作组(ECOG)评分(χ²=4.01,P=0.045)、高血压(χ²=15.35,P<0.001)、糖尿病(χ²=13.06,P<0.001)、白细胞计数(Z=-6.59,P<0.001)、中性粒细胞计数(Z=-6.72,P<0.001)、放疗剂量(χ²=9.81,P=0.002)差异均具有统计学意义。经过LASSO回归筛选最终选择出7个特征变量,分别为肿瘤病灶长径、ECOG评分、KPS评分、中性粒细胞计数、高血压、糖尿病、放疗剂量。ROC曲线分析显示,XGBoost模型预测性能较好,其AUC为0.90、准确度为0.82、精确度为0.80、敏感性为0.73、FI分数为0.76,RF模型AUC为0.89、准确度为0.78、精确度为0.76、敏感性为0.48、FI分数为0.59,DT模型AUC为0.72、准确度为0.72、精确度为0.44、敏感性为0.60、FI分数为0.52,SVM模型AUC为0.74、准确度为0.82、精确度为0.52、敏感性为0.88、FI分数为0.65。通过SHAP分析对XGBoost模型进行解释,其中肿瘤病灶长径、中性粒细胞计数、高血压、糖尿病、放疗剂量对食管癌患者CRT期间发生≥2级RE预测能力较强。结论基于XGBoost算法建立的模型对食管癌患者CRT期间发生≥2级RE具有较好的预测效能,同时与SHAP分析相结合,可以直观地了解模型中重要特征对结局的影响。