归纳与统计:频率论者范式
“频率论者范式”试图对“贝叶斯范式”作出改进,特别是,前者寻求消除贝叶斯范式中的先验设置——因为对科学家来说,寻找附加的先验信息,几乎是一种负担。
严格的给出一个已知的先验值,贝叶斯方法可以顺理成章地运用——但要害问题在于:常常无法得知先验值
频率论者范式强调的是:证伪(排斥、拒绝),而不是接受或者证明假说。
按照频率论者所创立的统计学,在所考虑的各个假说中间,特意安排一个零位假说。
- 零位假说可能为真,也可能为假。经过统计检测,这个零位假说可能被接受,也可能被拒绝。
- 这样一来就有了四种可能情况:
| |
真 |
假 |
| 接受 |
成功 |
II 类错误 |
| 拒绝 |
I 类错误 |
成功 |
- I 类错误,指拒绝了一个真的零位假说;
- II 类错误,指接受了一个假的零位假说。
首先无法确定零位假说的真假,所以为了得出两类错误都比较低的结果,必然存在着一个两者之间内丰的平衡。为了达到这个平衡点,最理想的方法就是分别计算I 类和II 错误所付出的代价或损失,然后对这些错误加以平衡。
按照常规的惯例,科学家们都倾向于把I 类错误率设置到一个便于操作的水平上,而不去理会相应的II 类错误率究竟是多少。
另外,还有一个重要的数值,就是p值。
把它定义为获得一种结果的概率,在假定零位假说为真的前提下,至少能与观察到的预期值相同,并包含实际观察到的预期值以上的那些数值。
为了计算p值,必须假想,在假定零位假说为真的下,无数次的重复实验,寻找一个结果的概率,使它尽量达到临界程度,还要包括比该界限度以外的那些结果。
在科学社群中,似乎形成了一种习惯,在p值为0.05时作出的拒绝,称之为“有效的”结果。在0.01时所作出的拒绝,被称之为“极有效的”结果。
“大理石球实验”的频率论者分析
背景:该实验抽取了15次,其中有4次是白色的,11次是蓝色球,通过贝叶斯范方式所得的结论,HB为真的概率为:0.999543,HW为真的的概率为:0.000457。当时的先验概率是通过抛掷硬币来决定的。
现在假定:对先验值一无所知
设定HW为零位假说,即:WWWB
那么,抽中一次白球的概率为:0.75,抽中一个蓝球的概率为0.25.
那么,抽中两次白球的概率为:0.75 X 0.75
那么,抽中n次白球的概率为:0.75n
同理,抽中m次蓝球的概率为:0.25m
那么,每次同时抽中n次白球和m次蓝球的概率为:0.75m X 0.25n
现在假设,15次抽取中,抽中了w次白球,b次蓝球。
就相当于,在15个球的序列中,出现了w个白球,b个蓝球
在所有排列中,这种类型的排列共有:15! / (w! X b!) 种
那么,15次抽取中,出现w次白球,b次蓝球的概率为:
所有可能性[15! / (w! X b!) ] X 每种可能的概率(0.75m X 0.25n)
上面这个公式是我加上的,基于目前的理解。
上表说明
例如抽中5个蓝球和10个白球的概率为[15!/(5! X 10!)] X 0.255 X 0.7510≈0.165146
对于b值从0到15,所有可能的结果都列在此处,所有情况的概率值之和为1.
最后表中的第三列是p值,是把所有抽中b个蓝球和更多个蓝色球的概率值都加到一起,所得的总和,就是b行的p值。
这个特定的实验中,共抽到了11个蓝色球,相应的p值是0.000115,也就是用一种极为有效的结果排除了Hw的假说。
引申:
上表的P值是用当前b值的概率值加上所有的>b的概率值计算出来的
也可以用1去减所有已经排除了的概率值来得出
这样有一个好处是,当得出一个想要的结论后,后续的实验就不是必须的了(不可能,想错了)