第4章 抽样

假定总体是已知4 ,如果从已知总体中抽取样本,那么样本的均值和比例(统计量)将具有哪些重要性质

随机抽样[P 75]

  1. 总体和样本
  2. 有放回和无放回的抽样 1.总体较大时,差别较小
    1. 总体较小时,差别较大
  3. 抽样模拟的两种方法
    1. 利用随机数字表
    2. 利用随机正态数表

蒙特卡罗法

标准的统计问题为:总体未知,从中抽取一个较小的、花费不多的随机样本并计算其均值。一般的,样本均值与总体均值会有一些偏离,重要的问题是,用样本均值去估计总体均值,其可靠程序如何?

所以要研究的分布

重复的用随机抽样结果来求的值,求得的概率分布,也叫的抽样分布

为了区分X的标准差和的标准差,的标准差通常称为的标准误差,或简称SE。即SE=的标准误差=的标准差

在确定的波动大小时,样本量n是关键。

总体数N的大小对的波动却没有影响

不管总体自身是否服从正态分布,其样本均值的分布是渐近正态的

样本均值的抽样分布

1、非常简单随机样本

  • 抽样分布的中心就是原总体的中心u:的期望值=u
  • 抽样分布的标准误差比原总体的标准差σ小,而且样本量n越大,标准误差就越小:的标准误差=σ/n-2
  • 正态总体产生的正态抽样分布。当样本量增大时,非正态总体的的抽样分布也会近似地变成对称的和正态的。
  • 正态近似定理:在容量为n的非常简单随机样本(VSRS)中,样本均值以σ/n-2的标准误差(σ为总体标准差)围绕着总体均值u波动。随着n的增大,的分布也就围绕其目标u波动得越来越小,这也就越来越接近于正态(铃状)。

2、简单随机样本(无放回)

当签一量被抽出后就不再放回时,中的抽样波动将被缩减,其中:缩减因子=((N-n)/(N-1))-2

所以前面的正态近似定理变为:的标准误差=((N-n)/(N-1))-2 X σ/n-2

修改后的正态近似定理对于无放回的随机样本也是适用的。