假定总体是已知4 ,如果从已知总体中抽取样本,那么样本的均值和比例(统计量)将具有哪些重要性质
- 总体和样本
- 有放回和无放回的抽样
1.总体较大时,差别较小
- 总体较小时,差别较大
- 利用随机数字表
标准的统计问题为:总体未知,从中抽取一个较小的、花费不多的随机样本并计算其均值。一般的,样本均值与总体均值会有一些偏离,重要的问题是,用样本均值去估计总体均值,其可靠程序如何?
所以要研究的分布
重复的用随机抽样结果来求的值,求得
的概率分布,也叫
的抽样分布
为了区分X的标准差和的标准差,
的标准差通常称为
的标准误差,或简称SE。即SE=
的标准误差=
的标准差
在确定的波动大小时,样本量n是关键。
总体数N的大小对的波动却没有影响
不管总体自身是否服从正态分布,其样本均值的分布是渐近正态的
1、非常简单随机样本
- 抽样分布的中心就是原总体的中心u:
的期望值=u
- 抽样分布的标准误差比原总体的标准差σ小,而且样本量n越大,标准误差就越小:
的标准误差=σ/n-2
- 正态总体产生
的正态抽样分布。当样本量增大时,非正态总体的
的抽样分布也会近似地变成对称的和正态的。
- 正态近似定理:在容量为n的非常简单随机样本(VSRS)中,样本均值
以σ/n-2的标准误差(σ为总体标准差)围绕着总体均值u波动。随着n的增大,
的分布也就围绕其目标u波动得越来越小,这也就越来越接近于正态(铃状)。
2、简单随机样本(无放回)
当签一量被抽出后就不再放回时,中的抽样波动将被缩减,其中:缩减因子=((N-n)/(N-1))-2
所以前面的正态近似定理变为:的标准误差=((N-n)/(N-1))-2 X σ/n-2
修改后的正态近似定理对于无放回的随机样本也是适用的。