1

17633788835

V1

2022/11/09阅读:20主题:蓝莹

使用Python进行数据分析

使用Python进行数据分析——相关性分析

前几章节我们所介绍的Numpy以及Pandas模块都让Python具有了很强的数据分析功能,可以轻松应对一些实战中的的各种数据分析问题,从本次课程开始主要讲解如何使用 python来完成几类基础的数据分析,如相关性分析、假设检验、方差分析、描述性统计分析、线性回归分析等;

相关性分析



相关性分析是指对多个可能具备相关关系的变量进行分析,从而衡量变量之间的相关性程度或密切程度,提到相关性分析就不得不提到三大常见的相关系数:

  • Pearson相关系数、 Kendall相关系数和Spearman相关系数,这三大相关系数中,前两种统称为秩相关系数,为统计相关程度的指标,以下为三种相关系数的计算公式:

1.Pearson相关系数


其中COV(X,Y)是变量X和变量Y的协方差,D(X)、D(Y)分别是变量X和变量Y的方差, 分别是变量X和变量Y的标准差。

  1. Kendall相关系数


c表示种拥有一致性的的元素(两个元素为一对),d表示XY中拥有不一致的元素对数,n为这个元素个数。

3,Spearman相关系数


以上就是这三大相关系数公式,接下来,让我们进行相关性分析:

  • Pearson相关性分析,演示代码如下:
import numpy as qq
import pandas as qw
import matplotlib.pyplot  as mqt
import seaborn as sea
#导入数据
data=qw.read_excel('D:/shujufenxi/hotmap.xlsx')
# print(data)
#皮尔森相关系数
pearson=data.corr(method="pearson")
# print(pearson)
# data.corr(method="pearson")
#绘制热力图
sea.heatmap(pearson)
mqt.show()


  • Kendall相关系数,演示代码如下:

提示:初次进行分析的友友们记得下载'scipy'模块,否则代码会报错,无法进行分析

import numpy as qq
import pandas as qw
import matplotlib.pyplot  as mqt
import seaborn as sea
#导入数据
data=qw.read_excel('D:/shujufenxi/hotmap.xlsx')
# print(data)
#kendall相关系数
kendall=data.corr(method="kendall")
# print(pearson)
# data.corr(method="pearson")
#绘制热力图
sea.heatmap(kendall)
mqt.show()


  1. Spearman相关系数,演示代码如下:
import numpy as qq
import pandas as qw
import matplotlib.pyplot  as mqt
import seaborn as sea
#导入数据
data=qw.read_excel('D:/shujufenxi/hotmap.xlsx')
# print(data)
#spearman相关系数
spearman=data.corr(method="spearman")
# print(pearson)
# data.corr(method="pearson")
#绘制热力图
sea.heatmap(spearman)
mqt.show()


好啦,今天的分享到此结束,时间匆忙,对于一些参数没能学习到位,以至于不是很美观,如果您对我的教程感兴趣,动下发财的小手,点个关注加分享吧!!!

微信扫描二维码,关注更多资讯 详细内容请搜索微信公众号:作物表型记录本 私人微信:saxn2022

分类:

后端

标签:

Python

作者介绍

1
17633788835
V1