(3)常见的离散型随机变量 ①0-1分布(也称两点分布)
如果随机变量X只可能取0和1两个值,它的概率分布为P(X?1)?p,P(X?0)?1?p?q,则称X服从参数为p的两点分布,也称0-1分布,P(X?x)?pxq1?x(0?p?1)。
0-1分布的数学期望为p,方差为p(1?p)。 ②二项分布
kkn?k在n次独立的试验中,(n重贝努里试验)出现“成功”的次数的概率为P(X?k)?Cnpq, 则称随机变量X
服从参数(n,p)的二项分布,记作X~B(n,p)。
二项分布的数学期望为E(X)?np,方差为D(X)?np(1?p)。
3、连续型随机变量
(1)连续型随机变量的概率密度函数和分布函数 ①概率密度函数
设X是一连续随机变量,它代表某一区间或多个区间中的任意数值,它的概率分布通过概率密度函数来表述,记作f(x)。连续型随机变量在给定区间内取值的概率对应的是概率密度函数f(x)曲线(或直线)在该区间上围成的面积。
概率密度函数满足以下两个条件:f(x)?0;
?????f(x)dx?1。
连续型随机变量取个别值的概率为0,也就是说连续型随机变量在任一区间上取值的概率与是否包含区间端点无关,即P(x1?X?x2)?P(x1?X?x2)?P(x1?X?x2)?P(x1?X?x2)。
②分布函数 连续型随机变量的分布函数定义为F(X)?P(X?x)??x??f(t)dt。
分布函数具有以下两个基本性质:0?F(X)?1;F(X)是一个单调非减的函数。
P(a?X?b)?F(a)?F(b)。 (2)正态分布 如果随机变量X的密度函数为f(x)?212??2e?12?2(x??)2,???x???,则称X为正态随机变量,或称X服
从参数为?,?的正态分布,记作X~N(?,?)。
正态分布曲线具有如下性质:曲线对称轴为x??;曲线与横轴所围面积为1。(其他性质略)
如果正态分布的随机变量具有均值为0,标准差为1的特征,则称该随机变量服从标准正态分布,记为X~N(0,1)。 任何一个服从一般正态分布的随机变量X~N(?,?)都可通过Z转换成标准正态分布N(0,1),转换公式为
22
?4、三种分布
Z?x??,变换后Z?x???~N(0,1)。
①总体分布:总体中各元素(单位)的观察值所形成的频数分布,称为总体分布。
②样本分布:从总体中抽取一个容量为n的样本,由这n个观察值形成的相对频数分布称为样本分布。
③抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。 5、两个定理 ①中心极限定理:设X是具有期望值为?,方差为?的任意总体,则样本平均数x的抽样分布将随着n的增大而趋于正态分布,分布形式(参数)x~N(?,2?2n),这就是统计学中的中心极限定理。 ②大数定律:大数定律(或大数法则)是指如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单位数n,可以以几乎趋近于1的概率,使抽样平均数与总体平均数的绝对离差的期望为任意小。 大数定律从理论上揭示了样本和总体之间的内在联系,即随着抽样单位数n的增加,抽样平均数呈现出接近总体平均数的趋势。 6、抽样分布 (1)单个总体的抽样分布 有限总体(均值为?,方差为?):x~N(?,重复抽样 无限总体(均值为?,方差为?):x~N(?,大样本 有限总体(均值为?,方差为?):x~N(?,不重复抽样 ①样本均值的抽样分布 无限总体(均值为?,方差为?):x~N(?,2222?2n) ?2n) ?2N?nn?N?1)
?2n) 正态总体方差已知(X~N(?,?)):x~N(?,小样本 正态总体方差未知(总体均值为?):t? 其他情况:分布未知
2?2n) x??~t(n?1) sn
重复抽样:p~N(P,②样本比例抽样分布(大样本)
不重复抽样:p~N(P,P(1?P)) nP(1?P)N?n?) nN?1③样本方差抽样分布(正态总体,重复抽样):(2)两个总体的抽样分布 (n?1)s2?2~?2(n?1) ①两个样本均值之差的抽样分布(X1~N(?1,?1),X2~N(?2,?2)):x1?x2~N(?1??2,22?12n1??22n2)
②两个样本比例之差的抽样分布:p1?p2~N(P1?P2,P1(1?P1)P2(1?P2)?) n1n2③两个样本方差之比的抽样分布:s12/?1s/?22222~F(n1?1,n2?1)
第6章 总体参数估计
1、点估计
用样本估计量的值直接作为总体参数的估计值,称作参数的点估计。 点估计具有无偏性、一致性和有效性三个性质。 (1)无偏性
如果样本统计量的数学期望等于所估计的总体参数的值,则称该样本统计量为总体参数的无偏估计量。 (注意:总体标准差的无偏估计量为s?2(x?x)?n?1,注意计算时的分母为n?1) (2)有效性
一个样本可能同时给出同一总体参数的两个或两个以上的不同的无偏估计量,其中方差(或标准差)更小的估计量是更有效的估计量。
(3)一致性
如果样本容量更大时,点估计量的值更接近于总体参数,则该估计量是总体参数的一致估计量。 2、区间估计的要素
(1)三种误差
①抽样(实际)误差
抽样实际误差是指某一次抽样结果所得到的样本指标数值与总体指标数值之差。 ②抽样平均误差
抽样平均误差是指所有可能出现的样本指标的标准差,也可以理解为所有样本指标和总体指标的平均离差。抽样平均误差也就是抽样分布中的标准差,例如大样本情况下总体均值抽样平均误差为?n。 ③极限误差 抽样极限误差就是指抽样指标和总体指标之间抽样误差的可能范围。例如总体均值的抽样极限误差表示为Ex,抽样极限误差一般表示为多少倍的抽样平均误差,即Ex?z??2?n,式中z?称为临界值,临界值
2对应着相应的置信水平(1??)。 (2)置信水平 如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平。置信水平表示为100(1??)%。常见的置信水平有90%、95%、95.45%,对应的临界值分别为1.645、1.96、2。 (3)置信区间、置信上限、置信下限 由样本统计量构造的总体参数估计区间,称为置信区间。 其中区间的最小值称为置信下限,最大值称为置信上限。
x?z?(4)综上,根据样本均值x构造的总体均值?的置信水平为(1??)的置信区间上下限为:?2n,
即置信区间为[x?z??2n,x?z??2n]。可以表述为我们有(1??)的把握保证我们构造的区间
[x?z??2n,x?z??2n]包含总体均值。
3、单个总体参数的区间估计
方差未知:x?z?大样本 方差已知: (1)总体均值估计 x?z?
正态总体方差已知: 小样 正态总体方差未知:x?t? 其他情况:× (2)总体成数估计(大样本)p?z?S2n ?2n S2n 2p(1?p) n??n?1?s2n?1?s22(3)总体方差估计(正态总体)???2??2?12??2
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库统计学相关概念(3)在线全文阅读。
相关推荐: