第3章 概率分布 II
离散型随机变量的概率-二项变量[P 60]
二项变量的一个经典例子
X=投掷一硬币n次所出现的国国徽向上的次数
许多随机变量都属于这一类型。重新叙述问题如下:
- 每次试验的结果只会是两种可能之一:成功或失败
- 每次重复试验时两种可能的概率不变,分别用π和(1-π)表示
- 那么在n次重复试验中成功的总次数X就称为二项变量。
- X的概率分布就叫做二项分布,可能的取值为0,1,2,...n。
成功的总次数等于的概率可以用如下的简单公式来计算:
=C^k_n\pi^k(1-\pi)^{n-k},(k=0,1,...n))
其中:
- n=重复次数
- k=成功的总次数
- π=成功的概率
=二项系数
引申:此处与《科学方法实践》中关于“频率论者概率”的计算方法一致:
={\left(n\\R\right)}\times{0.75^R}\times{(1-0.75)^{n-R}})
即,R个白球出现的概率=所有R个白球且(n-R)个蓝球的总排列数 X 每R个白球出现的概率 X 每(n-R)个蓝球出现的概率
此处:二项系数
表示从n个不同元素中取出k个元素的全部可能的组合数。与
等值。
查组合数可以有三种方法
- 一种是用n! / (R! X (n-R)!)
- 一种是查统计附表
- 另外还有一个杨辉三角形。它的规律是:每一行的第一个和最后一个数都等于1,而其他的数都等于前一行中与该数形成倒三角形的那两个数之和。
连续型随机变量的概率分布
例子:男子身高,可用直方图表示其相对频率的分布
如果将组距从6cm变成3cm的话,直方条的高度将降低1/2,就好像压扁了一样。但总高度仍然为1.
相对频率密度 = 相对频率 / 组距
当样本含量n逐渐增加,而各组的组距逐渐减小时,连续型随机变量的相对频率密度趋于概率密度。
在面积固定在1的同时,相对频率密度近似地变成一条曲线,称之为概率密度函数,简称概率分布φ(X)
正态分布
对于许多连续型随机变量来说,其概率分布是一种呈钟形的对称曲线,叫做正态曲线或高斯曲线。这是统计学中最常用 的一种分布。当其他类型的概率分布(如二项分布等)的样本增大时,也可以用正态曲线来近似。
1、标准正态分布也称Z分布。它是均值u=0,标准差σ=1的正态分布。
2、一般正态分布一般来说,正态随机变量可以有各种不同的均值u和标准差σ,但都有着铃关的分布曲线。因此,任何正态变量都可以转换成标准正态变量。
3、正态分布的常用性质
- A 只要给出了平均值和标准差,对应的正态分布就完全确定了
- B 平均值决定了分布的中心,它就位于正态曲线的对称中心
- C 标准差决定了分布的形状,其大小就等于从正态曲线的中心到其右侧(或左侧)曲线的拐点处的距离。(拐点是指曲线的“曲率”改变的地方:向上凸或向下凹之处)
- D 任何正态分布中,以下的68-95-99.7规则都近似成立。即:
- 大约有68%的数据,落在距平均值一个标准差的范围内
- 大约有95%的数据,落在距平均值两个标准差的范围内
- 大约有99.7%的数据,落在距平均值三个标准差的范围内
(更准确的数值为:68.26%、95.44%、99.73%)