
数据星辰
V1
2023/04/21阅读:24主题:蓝莹
缺失值填补
基于模型的缺失值填补
分布均衡的小数据集适合使用KNN模型对缺失值进行填充
-
预测目标:基于模型的方法将含有缺失值的变量作为预测目标 -
集合分类:将数据集中其他变量或其子集作为输入变量,通过变量的非缺失值构造训练集,训练分类或回归模型 -
构建预测:使用构建的模型来预测相应变量的缺失值
数据回归
-
线性科学领域的经典学习算法 -
用来刻画响应变量与自变量之间的关系
线性回归可以用来预测响应变量
那如何来进行缺失值填充呢
-
含有缺失值的属性作为因变量 -
其余的属性作为多维的自变量 -
建立二者之间的线性映射关系 -
求解映射函数的系数
作者介绍

数据星辰
V1
数据星辰存储平台的搭建、分析、研究