贝叶斯定理:是从概率公理中推导出来的特别重要的定理,它说明,后验概率等于或然率乘以先验概率。[P 213]
大理石球实验:问题[P 179]
- 步骤
- 投掷一枚公平硬币
- 如果是正面,向坛子里放1个白球3个蓝球;
- 如果是反面,向坛子里放3个白球1个蓝球
确定哪一个假说,Hb还是Hw,可能为真
把球充分混合后,从中取出一个,观察这个球的颜色,然后重新放回。只要需要,该程序可反复进行。
当一个假说的后验概率达到了0.999,即告停止。
对这个大理石球问题,采用贝叶斯规则的比例式最为方便:
计算的结果如下:
| ID | 结果 |
|
| 先验比 |
| 或然率 |
| 后验概率比 |
| P(HB|D) |
|
| 颜色 | HB累计 | HW累计 | P(HB) | P(HW) | P(D|HB) | P(D|HW) | P(HB|D) | P(HW|D) |
|
| (先验) | 1 | 1 | 1 | 1 | 3 | 3 | 1 | 1 | 0.50000 | |
| 1 | 白 | 1 | 2 | 1 | 1 | 3 | 3 | 1 | 3 | 0.25000 |
| 2 | 蓝 | 2 | 2 | 1 | 3 | 3 | 3 | 3 | 3 | 0.50000 |
| 3 | 白 | 2 | 3 | 3 | 3 | 3 | 3 | 3 | 9 | 0.25000 |
| 4 | 蓝 | 3 | 3 | 3 | 9 | 3 | 3 | 9 | 9 | 0.50000 |
| 5 | 蓝 | 4 | 3 | 9 | 9 | 3 | 3 | 27 | 9 | 0.75000 |
| 6 | 蓝 | 5 | 3 | 27 | 9 | 3 | 3 | 81 | 9 | 0.90000 |
| 7 | 蓝 | 6 | 3 | 81 | 9 | 3 | 3 | 243 | 9 | 0.96429 |
| 8 | 蓝 | 7 | 3 | 243 | 9 | 3 | 3 | 729 | 9 | 0.98780 |
| 9 | 蓝 | 8 | 3 | 729 | 9 | 3 | 3 | 2187 | 9 | 0.99590 |
| 10 | 白 | 8 | 4 | 2187 | 9 | 3 | 3 | 2187 | 27 | 0.98780 |
| 11 | 蓝 | 9 | 4 | 2187 | 27 | 3 | 3 | 6561 | 27 | 0.99590 |
| 12 | 白 | 9 | 5 | 6561 | 27 | 3 | 3 | 6561 | 81 | 0.98780 |
| 13 | 蓝 | 10 | 5 | 6561 | 81 | 3 | 3 | 19683 | 81 | 0.99590 |
| 14 | 蓝 | 11 | 5 | 19683 | 81 | 3 | 3 | 59049 | 81 | 0.99863 |
| 15 | 蓝 | 12 | 5 | 59049 | 81 | 3 | 3 | 177147 | 81 | 0.99954 |
- 需要注意的几点:
- 设M是蓝色球数超过白色球数的边际值,那么,M3就意味着抽中蓝色球比抽中白色球多了3次。
- 那么后验比例值HB:HW就等于3M:1。为了使HB获胜的比例值超过999:1,或者99.9%置信度,需要M=7。
- 一个实验的平均长度L大约是2X7=14次。关于检测序列概率比的伯努利数是可以获知的。取近似值,L≈2M也算是相当准确了。