维克托儿

V1

2022/12/02阅读:61主题:自定义主题1

5分钟就够:置信的简单理解

“置信”一词从中文角度,只能从“难以置信”这个成语中找到。

在数理统计中初看这个概念,有点模糊。

今天来探究一下置信这个统计学概念是啥意思。

术语百科

首先给出百科中关于置信的解释:

在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数测量值的可信程度范围,即前面所要求的“一定概率”。这个概率被称为置信水平。

举例说明

举一个同样是百科中的例子:

如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的概率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之2.5(假设分布是对称的)。

如何理解呢?

首先,探讨一下支持率这个概念,可以理解为这个国家中所有人口中有多少人支持他。 比如总人口是1亿,有5000w人支持,那么支持率就是50%。 这只是个理想值,调研这一亿人的每一个人是不可能的,但理论上他一定是存在精准的值。

其次,如何获得支持率呢? 大家马上想到一个办法,就是找一部分代表去投票,然后“以偏概全”,用这些代表投票的支持率去估计整个国家的支持率。 思考一下,假设这些代表的投票结果是55%,那么按照上面支持率的概念,这个国家一定有55%的人支持吗? 当然不一定啦,因为这只是个估计,那个精确且存在的支持率到底是多少,谁也不知道!

最后,那有没有一个更精准的表达呢? 有的,就像其它数学概念一样,数学家们发明了置信区间置信度两个词来描述这件事。 精准支持率落在50%到60%之间的概率在95%以上! 这句话在数学上多么严谨啊(现实中没有啥卵用,总统不可能根据概率产生,这里不讨论)。 再加上一句话:精准支持率不到50%的概率小于2.5%,当然还有另一部分,精准支持率高于60%的概率也小于2.5%。

上面的50%到60%就是置信区间,概率95%就是置信度了。

另:对上面的分布是不是很熟悉,这不正是左右对称的正态分布么......

总结

简单说,置信就是对估计的可信度的评估,或者数学化。 估计这东西在非此即彼、非对即错的数学世界,显得太“难以置信”了。 有了置信的加持,一切都更“数学”了。

注:

  • 本文只做理论探讨,所举的例子没有任何政治、法律意义。
  • 本着知识碎片化原则,一篇小文,5分钟能了解一个知识点就满足了。
  • 坚信复杂的理论背后都有一个简单的道理。

分类:

人工智能

标签:

机器学习

作者介绍

维克托儿
V1