第4讲 样本容量的确定
1.合理确定样本容量具有重要的意义。 2.必要样本容量的确定公式:
(1)在重置抽样的条件下,抽样平均数的单位数为:
2t2?xt2p(1?p) nx?2 np?
?x?2p(2)在不重置抽样的条件下,抽样平均数的单位数为:
2Nt2?xt2Np(1?p) nx? np? 22222N?x?t?xN?p?tp(1?p)3.在确定抽样单位数时,要注意以下两点:
(1)抽样单位数受允许误差范围△人的制约。△要求愈小,则样本容量n就需要愈多。 (例)如果标准6=0.4kg,抽样误差分别不超过0.08kg和0.04kg,保证这个范围的概率为95.45%,求在重复抽样条件下次生的必要数目。(P164)
(2)一个总体往往同时需要计算抽样平均数和抽样成数,它们的方差和允许的误差范围不同,因此需要的抽样单位数也可能不同。
(例)对秤某型号电池进行电流强度检验,根据以往正常生产的经验,电流强度的标准差D=0.4安培,而合格率为90%。现在用重置抽样的方式,要求在95.45%的概论保证下,抽样平均电流强度的极限误差不超过0.08安培,抽样合格率的极限误差不超过5%,问必要的抽样单位数应该为多少?(P164)
4.影响样本容量的主要因素有哪些? (1)总体标志变动度 (2)抽样极限误差 (3)概率保证程度 (4)抽样方式和方法 项目7 相关与回归分析 第1讲 相关分析
1.相关关系:是社会现象之间客观存在的,在数量变化上受随机因素影响的,非确定性的相互依存关系。
2.相关关系的特点:
(1)相关关系表现为现象间相互依存的关系。
(2)相关关系在现象间表现为非确定性的相互依存关系。 3.相关关系的种类:
(1)相关关系按照影响因素的多少分为单相关和复相关。 (2)相关关系按表现形态分为直线相关和曲线相关。 (3)相关关系按变动方向分为正相关和负相关。
(4)相关关第按密切程度分为完全相关、不完全相关和不相关。
相关关系密切程度判断标准 相关系数绝值︱r︱ 0.3以下 0.3~0.5 0.5~0.8 0.8以上
相关关系系数r公式:
相关关系密切程度 不相关 低度相关 显著相关 高度相关
r????x?y2xy1?(x?x)(y?y)n 112(x?x)?(y?y)2?nn式中:x为自变量;x为自变量数列的平均值;
y为因变量;y为因变量数列的平均值;
2为变量x、y的协方差; ?xy?x为变量x的标准差;
?y为变量y的标准差。
分子(子项)为变量x的离差与变量y的离差的乘积的均数(又称协方差);分母(母项)为变量x的标准差与变量y的标准差的乘积。
相关系数r的简洁计算公式:
r?n?xy??x?yn?x?(?x)?n?y?(?y)2222
(例)根据下表资料,判断10户居民的年收入与年支出之间的相关关系统。 序号 1 2 3 4 5 6 7 8 9 10 合计
年收入(万元)x 1.40 2.50 2.80 2.90 3.20 3.50 5.70 5.90 9.60 15.00 52.50 年支出(万元)y 0.90 1.60 1.60 1.80 2.00 2.50 3.20 3.20 4.80 6.2 27.8
4.相关分析中应注意的问题有?
(1)不能用相关系数解释两变量间的因果关系 (2)警惕“虚假相关” 第2讲 回归分析
1.回归分析:是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。 2.回归分析的特点:
(1)在对两个变量进行回归分析时,必须根据研究的目的确定自变量和因变量。 (2)回归分析中,因变量是承机变量,自变量是非随机变量。
(3)在两个变量互为因果的前提下,可以依据研究的目的分别建立y对于x的回归方程,也可以建立x对于y的回归方程。
(4)在用回归方程进行估计预测时,只能给出自变量的数值来估计因变量的数值,即一个方程只能做一种推算。
??a?bx 3.一元线性回归方程公式:y?表示y的估计值; 式中:y x为自变量的实际值; a为直线在y轴上的截距;
b为自变量增加一个单位时因变量的平均增加值,也称回归系数。 a和b都称作待定参数。(用最小平方法确定,也称最小二乘法)
?n?xy??x?yb??n?x2?(?x)2? ?
yb?x???a?n?n?y?bx?(例)某地区高校教育经费(x)与高校学生为数(y)连续6年的统计资料如下表,要求建立以在校学生人数为因变量的回归方程。 编号 1 2 3 4 5 6 合计
教育经费(万元)在校学生人数(万人)x 316 343 373 393 418 455 2298 y 11 16 18 20 22 25 112
4.估计标准误差:是因变量的实际值与理论值的平均离差,是用来说明回归方程代表性大小的统计分析指标。 公式:Sxy??)?(y?y n?2?为因变量估计值;n为数据的项数。 式中:Sxy为估计标准误差;y为因变量的实际值;y利用定义公式计算估计标准误差,运算量大,须计算出所有的估计值。如果已知直线回归方程的参数值,有一个比较简便的计算方法。公式如下:
Sxy??y2?a(?y)?b(?xy)n?2
5.估计标准误差与相关系数的关系。
r?1?2Sxy?2y Sxy??y1?r
2从相互联系的两个算式中可以看出r与Sxy的变化方向是相反的。当r越大时,Sxy越小,这说明相关密切程度越高,回归直线的代表性较大;当r越小时,Sxy越大,这说明相关密切程度越低,回归直线的代表性较小;r=?1时,Sxy=0,说明现象间完全相关,各相关点均落在回归直线上,此时对x的任何变化,y总有一个相应的值与之对应;当r=0时,Sxy取得最大值,这说明现象间不存在直线关系。 6.相关系数与回归系数的关系
相关系数与回归系数的关系推导如下: 因为
b?n?xy??x??yn?x2?(?x)22?xy?2 ?x且
2?xyr??2222?x??yn?x?(?x)?n?y?(?y)n?xy??x?y
b?x??y ?2r?xr?b?即
?x?y
7.区间估计公式:
??tSxy?y?y??tSxy y8.应用回归分析应注意的问题
①定性分析与定量分析应结合使用。
②注意社会经济现象的复杂性。 ③回归系数。
项目8 统计指数
第1讲 统计指数的概念和种类
1.统计指数:是一个既古老又现实的统计指标。
2.统计指数简称为指数。从广义上讲,是指反映社会经济现象数量变动的相对数。从狭义上讲,是特指用来反映不能直接相加的复杂的社会经济现象的综合数量的变动相对数。 3.统计指数的作用:
(1)编制指数,综合反映复杂的社会经济现象综合数量方面的变动方向和变动程度。 (2)编制指数体系,对社会经济现象的综合数量的变动及其影响因素进行分析。 (3)编制指数数列,对社会经济现象的变动趋势进行分析。 4.统计指数的各类:
(1)指数按其所包括的范围不同,可分为个体指数、组指数和总指数。 (2)指数按其反映的指标性质不同,可分为数量指标指数和质量指标指数。 (3)指数按其选择的对比基期不同,可分为定基指数和环比指数。 第2讲 综合指数
总指数有两种形式:一是综合指数,二是平均指数。
(例)某厂生产三种产品,各自产量及价格资料见下表:(P202) 产品名称
利用综合指数来编制总指数,关键是如何选择合适的同度量因素。首先,编制综合指数需要解决综合的问题,即如何将不能直接相加的三种产品的产量综合起来,以反映其变动。三种产品的产量指标是实物量指标,其使用价值不同,不具有综合性能,是不同度量现象,但它们的价值指标产值具有综合性能,是可同度量现象。因此,可以将产量转化成产值来进行综合。因为产量*出厂价格=产值,所以出厂价格在此是产量转化成产值的中间媒介因素,将这种能将不同度量的现象转化成可同度量的现象的中间媒介因素称为同度量因素。在此,就将产量的汇总问题转换成产值的汇总问题来研究,从而解决了三种产品的产量不能综合的问题。另外,通常将所要反映变动的因素称为指数化因素,在这个例子中,产量就是指数化因素。 k-----个体指数 k-------总指数 1-----报告期
计量单位 产量 出厂价格(元) q0 p0 总产值 q1 p1 p0 q1 q0 p1 基期q0 报告期q1 基期p0 报告期p1 0-------基期
p-----质量指标 q------数量指标
第3讲 平均指数
编制综合指数,需要全面的原始资料,但在许多情况下,某些资料是很难得的。 加权自述平均指数公式:
(例)利用以下资料,计算产量的加权算术平均指数。(P206)
产品名称 甲 乙 丙 合计
第4讲 指数体系及其因素分析
1.指数体系:在统计中,若干个系数由于经济上的相互联系以及数量上保持一定的对等关系而组成的整体。 2.指数体系的作用:
(1)利用指数体系,可以进行因素分析,测定某一现象的总变动中各个影响因素作用的方向、影响的程度以及影响的绝对额,以探索现象变动的具体原因。 (2)利用指数体系,可以进行有关指数之间的换算。 3.指数体系的种类:
(1)两因素指数体系和多因素指数体系 (2)总量指标指数体系和平均指标指数体系
总成本指数=产量指数*单位成本指数
职工平均工资指数=职工工资水平指数*职工人数结构指数
计量单位 千克 米 件 -- 基期产值(元) P0q0 16000 18000 50000 84000 产量个体指数(%) Kq=q1/q0 KqP0q0
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库江苏自考27871统计基础复习资料(包含计算公式)(5)在线全文阅读。
相关推荐: