本例两者都等于42元,这也表明,用不重置样本平均数来估计总体平均数,从总体来看,所有样本平均数平均数说来是没有离差的。
第二,
抽样平均数的标准差??x?也是放映样本平均数与总体平均数的平
均差程度。即:
E?x?E?x??2?E?x?X? (4.45)
2所以抽样平均数的标准差也可称为抽样平均误差,或抽样标准误差,用?来表示,不重置抽样的抽样平均误差等于重置抽样的抽样平均误差乘以修正因子
N?nN?1,即:
?2 ????x???X??Nn?n??? (4.46) N?1??用各项数字代入上式得: ????x??32?5?2????2?5?1?12?3.464
所得结果与上面按定义计算的完全一致。这说明不重置抽样的平均误差总是小于重置抽样的平均误差,从样本平均数分布来看,样本平均数更集中于总体平均数。但如果总体单位数N很大,修正因子
N?nN?1 接近于1,则两者几乎没
有什么差别,因此在大样本情况下,通常可以用重置抽样误差来代替不重置抽样误差。
以上结论也具有普遍意义,现在加以一般的推导。
设总体变量X:X1,X2,?XN,其平均数为X,标准差为??X?。样本容量为n的变量x:x1,x2,?,xn。
x?x1?x2???xnn
1. 按照平均数的定义: E?x??E? ?1n?x1?x2???xn??n??
?E?x1??E?x2????E?xn??
在不重置抽样条件下,x1,x2,?,xn的抽选不是独立的,现在分别讨论E(x1),
E(x2),?,E(xn)。
E(x1)表示抽第1单位为X1,X2,?,xN的平均数。每单位出现的概率相等,均为1/N。所以: E?x1??N?i?1XiPi?1NN?i?1Xi?X
E(x2)表示抽第2单位为X1,X2,?,XN的平均数。但要第二单位抽中某Xi则必须第一单位不为Xi,所以第1单位不为Xi而第2单位为Xi的概率为: Pi?N?1N?N1N?1?1N
N? E?x2???Xi?1NiPi?1NN?Xi?1i?X依此类推
N?2N?11N?2 E?x3???i?1XiPi??i?1XiN?1N??
?1N?Xi?X
? E?xn??NN?i?1XiPi??i?1XiN?1N?N?2N?1?1N?n?1
?1N?Xi?X
所以 E?x?? ?1n1n?E?x1??E?x2????E?xn??
?X?X???X??1n?nX??2X (4.47)
2. 按照抽样平均误差的定义: ?2?E?(x?Ex)??E?x?X?
2?x1?x2???xnX?X???X??E? ??
nn??2 ? ?1n2Ex1?X?x2?X???xn?X????????2
1?Exi?X2??n?????E?x2i?ji??Xxj?X?
????由于是不重置抽样,样本xi与xj不是独立的,共有n(n-1)项的E(xi-X)(xj-X)≠0,现在分别讨论E(xi-X)2与E(xi-X)(xj-X)。
E?xi?X??2??i?1NPiXi?X?2?1N??Xi?1Ni?X?2??2?X?
E?xi?X??xj?X?? ??P?Xk,Lk?Lk?X??XkL?X?
L?X?N?N?1?k?L1?XX???X
?式中k,L=1,2,?,N,PkL表示第i个被抽中的单位取值为Xk,第j个被抽中的单位取值为XL的概率。其概率等于
又由于
1N?N?1? 。
??Xk?Lk?XX??L?N?X=??X?j?1??j??X???2???Xj?1Nj?X?2
????Xj?X???N?2?X?
2j?1N?
E?xi?X??xj?X???N??X??N?N?1?2??2?X?N?1
代入上式求得:
2? ??1?EXi?X2??n?????E?x2i?Li??Xxj?X?????
1? ?2?n?n?2?X??n?n?1???2? N?1??X?? ??2?X??nn?1???X??N?n?1??? ???N?1nN?1????2? ???2?X??Nn?n??? (4.48) N?1??当总体N很大时,N-1≈N则有 ???2?X??nn??1?? (4.49)
N??㈡样本成数的分布
总体成数P可以表现为是非标志(0,1)分布的平均数,而它的标准差σ也可以从总体成数推出来。即
XP?P ; ?P?P?1?P?
p
从总体N个单位中,用不重置抽样方法取n个单位计算样本成数p,它的分布就是(0,1)样本不重置平均数的分布。即有
E?p??P
?p?P?1?P??N?n??? n?N?1?P?1?P??n??1?? nN?? ?在得布道总体成数P的资料时,也可以用实际样本的抽样成数p来代替。
例如,要估计某地区10000名适龄儿童的入学率,用不重置抽样方法从这个地区抽取400名儿童,检查有320名儿童入学,求样本入学率的平均误差。
根据已知条件:p=320/400=80%
σ2=P(1-P)=80%×20%=16%
1. 在重置抽样下,入学率的抽样平均误差?p为: ?p?P?1?P?n?0.8?0.2400?2%
2. 在不重置抽样下,入学率的抽样平均误差?p为: ?p?P?1?P??n?1????nN??0.16?400?1????1.96% 400?10000?两者相比,抽样平均误差相差甚少。当总体的单位数很大时,不重置抽样
分布也就趋近于重置抽样分布,抽样平均误差就接近一致了。
现在把各种抽样平均误差公式汇编列表如下:
表4—5 抽样平均误差公式汇编
重置抽样 不重置抽样 样本平均数误差
?2?X?n
?2?X??nn?1??? N??样本成数误差
P?1?P?n
P?1?P??n??1?? nN??第三节 正态分布和正态逼近
重置抽样分布和不重置抽样分布都是离散型变量分布,正态分布则是连续型
的变量分布。许多客观现象属于连续型变量,例如农作物亩产量、棉花纤维长度、机械零件尺寸、测量误差等等,都必须用连续型的正态分布来描述其变化规律。在统计推断中正态分布居于特别重要地位,它作为抽样平均数和抽样成数分布的极限式,可以为抽样的概率估计提供简便的方法。
一、 正态分布的密度函数 对于连续变量可以用密度函数来描述其概率分布情况,正态分布的密度函数为:
f?x??1?2?e?x?x??2/2?2
式中x为正态分布的平均数,σ﹥0是它的标准差。这两个参数决定正态分布函数的形状。所以正态分布可以简记为N?x,?2?,其图形如图4—8。
F(x)
0 x-σ x x+σ x
图4—8正态分布图
正态分布密度函数有如下特性:
1. 对称性。即以x?x为对称轴,曲线完全对称地向两边延伸。 2. 非负性。密度函数f(x)都处于ox轴的上方。 3. 当x?x时f?x??1? 为最大值。f(x)的值随x递增而递减。
2?变动平均数x而σ不变,则并不改正态分布的形状,而只改变正态分布的中心位置,如图4—9。
4. 在x??处为密度函数f(x)的拐点,即在x???x?x??的区间里,曲线凸向上。如图4-8。
变动标准差σ而x不变,则并不改变正态分布的中心位置,而只改变分布曲线的尖峭程度,如图4-10。当σ变小时,密度函数曲线的中心部分纵坐标升高,曲线两侧迅速趋于X,表示变量分布比较集中。反之,当σ变大时,则曲线呈现扁平,表示变量分布比较分散。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库《统计学原理》教案(8)在线全文阅读。
相关推荐: