进行样本分组时,要考虑到数据分层 1.留出法 将样本中分出一部分作为训练集,另一部分作为测试集,比例在3/7-2/8左右 2.交叉验证法 将样本分为K份,依次选择m1-mk作为测试集,剩余k-1份作为训练集,计算k个训练结果的平均值 样本太多时, 对算力要求较大 3.自助法 随机从k个样本中有放回的抽取k个样本作为m测试集,在m中不包含的样本作为测试集,进行k次抽取得到mk个测试集,计算k个训练结果的平均值 自助法改变了样本集的数据分布,有一定的风险 作者:tensorhyt
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~