数据星辰

V1

2023/04/21阅读:24主题:蓝莹

缺失值填补

基于模型的缺失值填补

分布均衡的小数据集适合使用KNN模型对缺失值进行填充

  1. 预测目标:基于模型的方法将含有缺失值的变量作为预测目标
  2. 集合分类:将数据集中其他变量或其子集作为输入变量,通过变量的非缺失值构造训练集,训练分类或回归模型
  3. 构建预测:使用构建的模型来预测相应变量的缺失值

数据回归

  1. 线性科学领域的经典学习算法
  2. 用来刻画响应变量与自变量之间的关系

线性回归可以用来预测响应变量

那如何来进行缺失值填充呢

  1. 含有缺失值的属性作为因变量
  2. 其余的属性作为多维的自变量
  3. 建立二者之间的线性映射关系
  4. 求解映射函数的系数

分类:

前端

标签:

计算机网络

作者介绍

数据星辰
V1

数据星辰存储平台的搭建、分析、研究