进行样本分组时,要考虑到数据分层
1.留出法
将样本中分出一部分作为训练集,另一部分作为测试集,比例在3/7-2/8左右
2.交叉验证法
将样本分为K份,依次选择m1-mk作为测试集,剩余k-1份作为训练集,计算k个训练结果的平均值
样本太多时, 对算力要求较大
3.自助法
随机从k个样本中有放回的抽取k个样本作为m测试集,在m中不包含的样本作为测试集,进行k次抽取得到mk个测试集,计算k个训练结果的平均值
自助法改变了样本集的数据分布,有一定的风险
作者:tensorhyt
评估方法
方法
模型