阿升

V1

2022/06/29阅读:32主题:默认主题

对p值的理解

一.对 值的理解

1.对 值的直观理解

什么是 值呢? 值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。这个说法可能比较抽象,更直接的解释如下: 分布曲线下,从抽样得到的 值画一条线(双边检验是两条线),这条线到极端方向的阴影面积就是 值。如果 ,那么接受 。如果 ,那么拒绝

2.通过单样本双边 检验理解

假设王老师班级中20名同学英语成绩分别为:136, 136, 134, 136, 131, 133, 142, 146, 137, 140, 134, 135, 136, 132, 119, 132, 145, 131, 140, 141。全校均分 。那么王老师的班级均分和全校总体均分有无显著差别呢? 假设 (即王老师班级这个样本来自均分 分的一个总体)。 使用R语言代码实现如下所示: 其中,wang_class表示王老师班级中20名同学英语成绩,mu=137表示总体均值,alternative="two.sided"表示单样本双边 检验。输出结果如下所示:
(1)t=-0.90834,df=19,p-value=0.3751:分别表示t值、自由度和p值。
(2)alternative hypothesis:表示备择假设,即
(3)95 percent confidence interval:95%置信区间。
(4)mean of x:样本均值。
假设 ,因为 ,那么接受 ,即王老师的班级均分和全校总体均分没有显著差别。
说明:单样本 检验本质是单样本是否来自已知的总体。

3.通过双样本双边 检验理解

双样本 检验和独立样本 检验是一回事。假设grou1和group2两组数据满足正态性(使用shapiro.test计算)、独立性和方差齐性(使用var.test计算)。使用t.test()进行 检验: 因为 ,所以不能拒绝原假设,即两组样本之间没有显著差别。
说明:双样本 检验本质是两个样本是否来自同一个总体。

二.概率和统计知识回顾

1.概率知识

1.1重点概率定义

  概率论中常见的概念有乘法公式,全概率公式,贝叶斯公式,样本空间,随机变量,(联合|边缘|条件)分布函数,(联合|边缘|条件)分布律,(联合|边缘|条件)概率密度,伯努利试验, 重伯努利试验,随机变量数字特征(数学期望|方差|标准差|协方差和相关系数|矩|协方差矩阵),切比雪夫不等式等。这里重点说下随机变量、分布函数、概率密度这3个概念:

(1)随机变量

  严格定义:设随机试验的样本空间为 是定义在样本空间 上的实值单值函数,称 为随机变量。

  • 随机变量:定义在样本空间上的实值单值函数。即随机变量原来是个函数,它的定义域是样本空间,值域是实数值,随机变量本质就是将样本空间映射为实数值。
  • 样本空间:将随机试验中所有可能结果组成的集合称为样本空间。
  • 随机试验:可以在相同的条件下重复地进行;每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;进行一次试验之前不能确定哪一个结果会出现。

(2)分布函数

严格定义:设 是一个随机变量, 是任意实数,函数

称为 的分布函数。 这个定义看上去很抽象,有什么具体的物理意义吗?对于任意实数 ,那么:

可见如果知道 的分布函数,就可以计算任意区间 上的概率。分布函数是研究随机变量的工具,描述了随机变量的统计规律性。

(3)概率密度

如果对于随机变量 的分布函数 ,存在非负函数 ,使对于任意实数

那么函数 就是 的概率密度(或概率密度函数),并且 是连续型随机变量。 概率密度有什么直观的物理意义吗?通过方程 可知: 落在区间 上的概率 就是该区间上曲线 下的面积。

1.2离散型随机变量分布律

  • 0-1分布
  • 二项分布
  • 泊松分布

1.3连续型随机变量概率密度

  • 均匀分布
  • 指数分布
  • 正态分布(高斯分布)

1.4大数定律

大数定律是描述随机变量序列的前一些项的算术平均值在某种条件下收敛到这些项的均值的算术平均值。

(1)弱大数定理(辛钦大数定理)

是相互独立的,并且服从同一分布的随机变量序列,具有数学期望 。前 个变量的算术平均 ,对于任意

弱大数定理(辛钦大数定理)表达了什么物理意义呢?本质就是说对于独立同分布且具有均值 的随机变量 ,当 很大时它们的算术平均 很可能接近于

(2)伯努利大数定理

是{n}次独立重复试验中事件 发生的次数, 是事件 在每次试验中发生的概率,那么对于任意正数

伯努利大数定理表达了什么物理意义呢?本质上就是当试验次数非常大时,可以用事件的频率来代替事件的概率。

1.5中心极限定理

中心极限定理是确定在什么条件下,大量随机变量之和的分布逼近于正态分布。

(1)独立同分布的中心极限定理

设随机变量 相互独立,服从同一分布,并且数学期望和方差为: ,随机变量之和 的标准化变量:

的分布函数 对于任意 满足:

独立同分布的中心极限定理表达了什么物理意义呢?就是说当均值为 ,方差为 的独立同分布的随机变量 之和 的标准化变量,当 充分大时:

(2)李雅普诺夫定理(略)

(3)棣莫弗-拉普拉斯定理

设随机变量 服从参数为 的二项分布,对于任意 有:

棣莫弗-拉普拉斯定理表达了什么物理意义呢?本质上就是正太分布是二项分布的极限分布,当 充分大时,可以利用上述方程来计算二项分布的概率。

2.统计知识

2.1 统计量和抽样分布

抽样分布就是统计量的分布,那什么是统计量呢?设 是来自总体 的一个样本, 的函数,如果 中不含未知参数,那么 就是一个统计量。

(1)常见统计量

样本平均值:
样本方差:
样本标准差:
样本 阶(原点)矩:
样本 阶中心矩:

(2)3大抽样分布: 分布

是来自总体 的样本,则称统计量 服从自由度为 分布,记为
分布概率密度函数如下: 分布累积分布函数如下:

(3)3大抽样分布: 分布

,并且 相互独立,称随机变量 服从自由度为 分布,记为
分布概率密度函数如下: 分布累积分布函数如下:

(4)3大抽样分布: 分布

,且 相互独立,称随机变量 服从自由度为 的分布,记为
分布概率密度函数如下: 分布累积分布函数如下:

2.2 参数估计

  参数估计和假设检验是统计推断的两大基本问题,而参数估计又包括点估计和区间估计。那么什么是点估计呢?设总体 的分布函数的形式已知,但它的一个或多个参数未知,使用总体 的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。
  具体来说就是设总体 的分布函数 的形式为已知, 是待估参数。 的一个样本, 是相应的一个样本值。点估计问题就是要构造一个适当的统计量 ,用它的观察值 作为未知参数 的近似值,称 的估计量,称 的估计值。
  矩估计法和最大似然估计法是构造估计量的两种常用方法。估计量的选择肯定也会有一个好与坏的评估标准,那就是无偏性、有效性和相合性。

(1)无偏性(均值角度)

若估计量 的数学期望 存在,并且对于任意 ,那么称 的无偏估计量。

(2)有效性(方差角度)

都是 的无偏估计量,如果对于任意 ,有 且至少对于某一个 上式中的不等号成立,那么 有效。

(3)相合性

为参数 的估计量,若对于任意 ,当 依概率收敛于 ,则称 的相合估计量。即
说明:简单理解置信区间就是此区间包含参数 真值的可信程度。

2.3 假设检验

  简单理解假设检验就是提出某种假设,然后判断假设是否成立的过程,要么接收,要么拒绝。但是这里面涉及很多的概念,比如显著性水平、原假设与备择假设、检验统计量、P值、假设检验两种错误、单双测检验、假设检验方法( 检验| 检验|卡方检验)。实际中用的比较多的还是单样本 检验和双样本 检验。假设检验的一般过程如下所示:

  • 提出原假设和备择假设:把没有充分理由不能轻易否定的命题作为原假设,把没有足够把握不能轻易肯定的命题作为备择假设
  • 选择适当的统计量,确定其分布形式
  • 规定显著水平,确定其临界值:显著水平表示原假设为真时拒绝原假设的概率,即拒绝原假设的风险。通过取值为0.1、0.05、0.01
  • 计算校验统计量的值
  • 作出结论

2.4 多元统计

  多元统计是研究多个随机变量之间相关依赖关系以及内在统计规律性的一门统计学科。包括回归分析,方差分析,因子分析,典型相关分析,聚类分析,判别分析,主成分分析,混合效应模型等。

参考文献:
[1]概率论与数理统计(浙大第4版)
[2]一篇搞懂假设检验:https://blog.csdn.net/weixin_42327743/article/details/112568365
[3]通俗统计学原理入门:https://www.bilibili.com/video/BV1x64y1B71k

人工智能干货推荐 左边的图片1 专注于人工智能领域的技术分享

游戏元宇宙 右边的图片 专注于游戏领域的技术分享

分类:

数学

标签:

数学

作者介绍

阿升
V1

吾爱DotNet(公众号)