登革热仍然是菲律宾的主要公共卫生问题,每年夺去数百人的生命(Jaymalin 2017)。 鉴于在开发确定性疾病模型中获得必要的流行病学参数的数据有限,预测作为控制和预测爆发的一种手段仍然是一个挑战。 在这项研究中,两个时间序列模型,即季节性自回归综合移动平均 (SARIMA) 和支持向量机 (SVM),是在不需要事先流行病学参数的情况下开发的。 通过测量均方根误差 (RMSE) 和平均平均误差 (MAE),比较了模型在预测菲律宾西米沙鄢地区登革热发病率方面的性能。 结果表明,这些模型都可以有效地预测登革热发病率,以进行流行病学监测,这已得到历史数据的验证。 SARIMA 模型产生的平均 RMSE 和 MAE 分数分别为 16.8187 和 11.4640。 同时,SVM 模型的得分分别为 11.8723 和 7.7369。 使用所使用的数据和设置,这项研究表明 SVM 在预测登革热发病率方面优于 SARIMA。 此外,使用随机森林回归器的特征排名对滞后一个月的气候变量进行初步调查,得出的降雨强度和价值是登革热发病率最高的气候预测因子。