第3章 概率分布 II

离散型随机变量的概率-二项变量[P 60]

二项变量的一个经典例子

X=投掷一硬币n次所出现的国国徽向上的次数

许多随机变量都属于这一类型。重新叙述问题如下:

  • 每次试验的结果只会是两种可能之一:成功或失败
  • 每次重复试验时两种可能的概率不变,分别用π和(1-π)表示
  • 那么在n次重复试验中成功的总次数X就称为二项变量。
  • X的概率分布就叫做二项分布,可能的取值为0,1,2,...n。

成功的总次数等于的概率可以用如下的简单公式来计算:

其中:

  • n=重复次数
  • k=成功的总次数
  • π=成功的概率
  • =二项系数


引申:此处与《科学方法实践》中关于“频率论者概率”的计算方法一致:

即,R个白球出现的概率=所有R个白球且(n-R)个蓝球的总排列数 X 每R个白球出现的概率 X 每(n-R)个蓝球出现的概率

此处:二项系数表示从n个不同元素中取出k个元素的全部可能的组合数。与等值。

查组合数可以有三种方法

  • 一种是用n! / (R! X (n-R)!)
  • 一种是查统计附表
  • 另外还有一个杨辉三角形。它的规律是:每一行的第一个和最后一个数都等于1,而其他的数都等于前一行中与该数形成倒三角形的那两个数之和。


连续型随机变量的概率分布

例子:男子身高,可用直方图表示其相对频率的分布

如果将组距从6cm变成3cm的话,直方条的高度将降低1/2,就好像压扁了一样。但总高度仍然为1.

相对频率密度 = 相对频率 / 组距

当样本含量n逐渐增加,而各组的组距逐渐减小时,连续型随机变量的相对频率密度趋于概率密度。

在面积固定在1的同时,相对频率密度近似地变成一条曲线,称之为概率密度函数,简称概率分布φ(X)


正态分布

对于许多连续型随机变量来说,其概率分布是一种呈钟形的对称曲线,叫做正态曲线或高斯曲线。这是统计学中最常用 的一种分布。当其他类型的概率分布(如二项分布等)的样本增大时,也可以用正态曲线来近似。

1、标准正态分布也称Z分布。它是均值u=0,标准差σ=1的正态分布。

2、一般正态分布一般来说,正态随机变量可以有各种不同的均值u和标准差σ,但都有着铃关的分布曲线。因此,任何正态变量都可以转换成标准正态变量。

3、正态分布的常用性质

  • A 只要给出了平均值和标准差,对应的正态分布就完全确定了
  • B 平均值决定了分布的中心,它就位于正态曲线的对称中心
  • C 标准差决定了分布的形状,其大小就等于从正态曲线的中心到其右侧(或左侧)曲线的拐点处的距离。(拐点是指曲线的“曲率”改变的地方:向上凸或向下凹之处)
  • D 任何正态分布中,以下的68-95-99.7规则都近似成立。即:
    • 大约有68%的数据,落在距平均值一个标准差的范围内
    • 大约有95%的数据,落在距平均值两个标准差的范围内
    • 大约有99.7%的数据,落在距平均值三个标准差的范围内
      (更准确的数值为:68.26%、95.44%、99.73%)