Loading...
墨滴

algolearn

2021/11/24  阅读:22  主题:默认主题

训练集和测试集划分

训练集:用于训练模型的样本集合, 主要用来训练模型参数.

测试集:对于训练完成的模型, 通过测试集惊醒评估

划分方法有3种

1 留出法

将数据集按照比例分(8:2,7:3,...)成互不相交的两部分,其中一个是训练集,一个是测试集,尽量保持训练集和测试集分布一致

2 交叉验证法

将训练集分成k个互斥的子集,k个子集随机分为k-1个一组作为训练集,剩下一个为另一组作为测试集,有k种分法。

3 自助法

每次随机从数据集(有m个样本)抽取一个样本,然后再放回(也就是说可能被重复抽出),m次后得到有m个样本的数据集,将其作为训练集。始终不被抽取到的样本的比例约为0.368,这部分作为测试集。

迎关注微信公众号(算法工程师面试那些事儿),建号初期,期待和大家一起刷leecode,刷机器学习、深度学习面试题等,共勉~

algolearn

2021/11/24  阅读:22  主题:默认主题

作者介绍

algolearn