基于机器学习的纵向缺失值处理方法在体育科学研究中的应用
本文中,我们讨论了基于机器学习的纵向缺失值处理方法在体育科学研究中的应用,以运动对大学生执行控制影响的纵向研究为例。我们首先介绍了纵向实验研究中出现的后测数据缺失问题,然后探讨了基于机器学习的预测模型在缺失值处理中的优点,以机器学习中的支持向量计算法建立后测执行控制缺失值的预测模型,详细呈现了应用机器学习处理后测数据缺失值的步骤和结果可靠性。
在体育科学研究中,纵向实验研究越来越多,但在研究过程中由于外界因素干扰或研究参与者自身原因等,后测数据容易缺失。如果不能可靠地处理缺失数据,将导致分析结果产生潜在的偏差,甚至会得出误导性的结论。传统的插补方法,如回归替换法、均值替换法和多重替代法等,但是这些方法的选择会受到缺失数据的比例、变量间的关联度和时间限制等因素的影响,并且在不同的数据缺失模式和分布模式下,选择不适合的插补方法仍然会使数据产生偏离,得出错误的结果。
机器学习是一门多领域交叉学科,专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。随着人工智能浪潮的到来,作为人工智能核心的机器学习被广泛应用于各个学科领域。机器学习在预测中的可靠性受到各大领域的强烈响应。相比之下,在将机器学习如何应用于处理体育科学研究中的后测数据缺失值方面尚无针对性研究;与常用的一些插补法处理缺失值相比,机器学习建立的预测模型适合任意缺失模式,对数据的分布类型要求较低,模型的拟合效果好,且稳健性好,偏差小。
本研究选择通过基线有氧适能和基线执行控制对后测执行控制的缺失值进行预测,以机器学习中的支持向量计算法建立预测模型,旨在探索纵向缺失值处理的新方法,为机器学习应用于体育研究中后测数据缺失值的处理提供实践基础。执行控制作为个体认知、情绪和社会功能的核心,对其身心健康发展有着极其重要的作用。寻找改善执行控制的有效途径已成为各个学科和社会共同关注的热点问题。
本研究基于机器学习的纵向缺失值处理方法可以为体育领域纵向研究中后测数据缺失值的处理提供可靠科学手段,并为机器学习应用于体育研究中后测数据缺失值的处理提供实践基础。