第一章 概论
习题1.1 答:
(1)生物统计学(biostatistics)——是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。 (2)主要内容内容有:
试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法; 统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相关分析、协 方差分析等。 (3)生物统计学的作用:
①提供整理、描述数据资料的科学方法并确定其特征; ②判断试验结果的可靠性;
③ 提供由样本推断总体的方法; ④ 试验设计的原则。
习题1.2 答:
(1)总体(popilation):研究对象的全体,是具有相同性质的个体所组成的集合;
(2)个体(individual):组成总体的基本单元;
(3)样本(sample):由总体中抽出的若干个体所构成的集合,当n>30时属于大样本, n<30属于小样本;
(4)样本容量(sample size):样本中个体的数目;
(5)变量(variable):又称变数,是相同性质的事物间表现差异性的某项特征; (6)参数(parameter):也称参量,是描述总体特征的数量;
(7)统计数(statistic):描述样本特征的数量。由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数;
(8)效应(main effect):“主效”的简称;由因素而引起试验差异的作用; (9)互作(Interaction effct):两个或两个以上处理因素间的相互作用产生的效应;
(10)试验误差(experimental error):也叫误差,是指试验中不可控因素所引起的观测值偏离真值的差异。
习题1.3 答:
随机误差(random)也称抽样误差或偶然误差,他是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消除随机误差。
系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所差生的倾向性的或定向性的偏差。系统误差主要有一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的
习题1.4 答:
准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的
观测值与其真值接近的程度。精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。
第二章 试验资料的整理与特征数的计算
习题 2.1
答:对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其
数值大小列入各个相应的组别内,便可以出现一个有规律的表式。这种统计表称之为次数分布表。
次数分布图就是在次数分布表的基础上,把次数分布资料画成统计图形。
制表和绘图的基本步骤是:(1)求全距;(2)确定组数和组距;(3)确定租限和组中值;(4)分组,编制次数分布表,或根据需要绘制条形图、饼图、直方图等。
习题 2.2
x1?x2???xnn答:如果有n个数:x1,x2,?xn,那么这组数据的平均数x=,
这个平均数叫做算术平均数。
一般地,对于f1个x1,f2个x2,?,fn个xn,共f1+f2+?+fn个数组成的
x1f1?x2f2???xnfnf1?f2???fn一组数据的平均数为。这个平均数叫做加权平均数,其中
f1,f2,?,fn叫做权,这个“权”,含有权衡所占份量的轻重之意,即fi(i=1,2,?k)越大,表明xi的个数越多,“权”就越重。
算数平均数是加权平均数的一种特殊情况(当各项的权相等时),由于它们都反映的是一组数据的平均水平,所以实质上是一样的。
习题2.3
答:平均数(mean)的用处有: ① 平均数指出了一组数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;
②作为样本或资料的代表数据与其它资料进行比较。
平均数的特性是:①离均差之和等于零;②离均差平方和为最小。 标准差(standard deviation)的用处: ① 标准差的大小,受实验或调查资料中多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小; ② 在计算标准差时,如果对各观测值加上火减去一个常数a,标准差不变;如果给各观测值乘以或除以一个常数a,则所得的标准差扩大或缩小了a倍; ③在正态分布中,一个样本变量的分布可以作如下估计:x±s内的观测值个数约占观测值总个数的68.26%,x±2s内的观测值个数约占总个数的95.49%,
x±3s内的观测值个数约占观测值总个数的99.73%。
标准差的特性:
①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的大小判断平均数代表性的强弱;
②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准误,在计算平均数的标准误时,可根据样本标准差代替总体标准差进行计算; ③ 进行平均数区间估计和变异系数的计算。
习题2.4
答:总体和样本的平均数都等于资料中各个观测值的总和除以观测值的个数所得的商。二者区别在于,总体平均数用μ表示,μ=∑x/N,公式中分母为总体观测值的个数N,样本平均数用x=∑x/n,公式中的分母为样本观测值的个数n。样本平均数是总体平均数μ的无偏估计值。
总体和样本的标准差都等于离均差的平方和除以样本容量后的方根。二者的
区别在于,总体标准差用σ表示,σ= ,分母上总体观测值的个
数N,标准差用s表示,,分母上是样本自由度n-1。样本标准
差s是总体标准差σ的无偏估计值。 习题 2.5
100例男子血清总胆固醇(mol/L)的次数分布表 组限(mol/L) 组中值(mol/L) 次数 频率 2.50~ 2.75 1 0.01 3.00~ 3.25 7 0.07 3.50~ 3.75 9 0.09 4.00~ 4.25 23 0.23 4.50~ 4.75 25 0.25 5.00~ 5.25 25 0.25 5.50~ 5.75 1 0.01 6.00~ 6.25 7 0.07 6.50~ 6.75 1 0.01 7.00~ 7.25 1 0.01
累积频率 0.01 0.08 0.17 0.40 0.65 0.90 0.91 0.98 0.99 1.00
习题 2.6 答:
男子血清总胆固醇次数分布直方图3025201510502.533.544.555.566.577.5男子血清总胆固醇次数分布多边形图3025201510502.753.754.755.756.75
由直方图和多边形图像可以得出结论:该地区30-40岁健康男子血清总胆固醇在2.50-7.50(mol/l)之间的分布呈现 两头少 中间集中 的规律,即3.50-6.00(mol/l)之间较为普遍。
习题 2.7 答:
由SPSS统计分析可知: 平均数=4.7398 标准差=0.86616
变异系数:CV=(s/x)*100%=(0.86616/4.7398)*100%=18.27%
习题 2.8 答:
由SPSS统计分析可知:
中值(即中位数)=4.6600 ,与平均数=4.7398比较可知:样本数据中存在许多较大的极端值。
(1)相同点:都是用来描述数据集中趋势的统计量;都可用来反映数据的一般
水平;都可用来作为一组数据的代表。
(2)不同点 :均值反映了一组数据的平均大小,常用来代表一般数据的总体平均水平。中值像一条分界线,将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”。
均值由于和每个数据都相关,比较可靠和稳定,反映出来的信息最充分。既可描述一组数据本身的整体平均情况,也可用来作为不同组数据比较的一个标准。 中值可比性比较差,因为他只利用了部分数据。
习题 2.9 答:
由SPSS统计分析结果可知:
单养平均数为: x=42.70(kg);单养极差为: R=极大值—极小值=55-25=30(kg);
单养标准差为: S =7.078(kg);单养变异系数为: CV=s/x*100%=16.58% 混养平均数为:x =52.10(kg) 混养极差为: R=69-39=30(kg); 混养标准差为:S=6.335(kg);混养变异系数为: CV= s/x*100%=12.16% 从单养和混养的贻贝重量数据可以看出,混养贻贝平均重量大于单养。二者极差相等,说明最大值、最小值差距相等。但单养的标准差和变异系数都大于混养,说明单养贻贝的重量的整齐度没有与海带混养整齐度高。以上结果表明,贻贝与海带混养效果较好。
第三章 概率与概率分布
习题3.1
答:在一定条件下必然出现的事件叫必然事件;相反,在一定条件下必然不出现的事件叫不可能事件;而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件。例如,发育正常的鸡蛋,在39°C下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。
习题3.2
答:事件A和事件B不能同时发生,即A2B=V,那么称事件A和事件B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。事件A和事件B必有一个发生,但二者不能同时发生即A+B=U, A2B=V,则称事件A与事件B为对立事件,如抛硬币时向上的一面不是正面就是反面。事件A与事件B的发生毫无关系。反之事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件,如第二胎生男生女与第一台生男生女毫无关系。
习题3.3
答:事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库生物统计学作业在线全文阅读。
相关推荐: