77范文网 - 专业文章范例文档资料分享平台

学生成绩评价及预测模型(2)

来源:网络收集 时间:2020-03-26 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

4. 模型的建立与求解

4.1 学生成绩整体情况的总体分析

4.1.1 对学生成绩的描述统计分析及结果说明

本文采用统计学中描述统计的方法对学生总体成绩的原始数据进行详细分析,得到了学生成绩的基础数据,如表1所示:

表1 学生成绩整体情况的描述统计

学期1成绩 学期2成绩 学期3成绩 学期4成绩 总数 612 612 612 612 均值 72.55 74.37 73.17 75.06 中值 74.32 76.64 74.19 76.54 众数 59.48* 78.33* 83.24 16.50* 标准差 9.50 10.60 9.01 10.24 方差 90.25 112.31 81.24 104.90 偏度 -1.24 -1.92 -1.94 -2.93 偏度的标准误 0.10 0.10 0.10 0.10 峰度 2.50 7.04 8.14 14.48 峰度的标准误 0.20 0.20 0.20 0.20 极小值 24.34 0.00 16.25 0.00 极大值 89.45 90.85 90.62 89.63 25 67.94 69.44 68.89 70.95

百分

50 74.32 76.64 74.19 76.54

位数

75 79.41 81.85 79.20 81.55

(其中* 表示存在多个众数,显示最小的)

从描述统计结果可以知道,由于偏度值都为负值,因此可以判断学生每个学期的总体成绩分布都属于负偏态分布,即其波峰偏向于成绩较高的右侧,说明学生的总体成绩偏向于高分,且每个学期的偏度值的绝对值逐渐增大,因此偏态程度越来越严重。峰度值为正值,且每个学期逐渐增大,说明高分层的学生数量逐渐增多。均值分数都在72-76分之间,可以判断学生的总体成绩状况良好。极大值普遍保持在90分左右,说明高分层波动不大。

为了更直观地观测成绩分布情况,作出学生成绩波动图:

6

图1 学生成绩波动图

从图1可以清楚地看到,学生成绩基本分布在七八十分之间。不过仅仅以此图进行分析说明过于笼统,因此为了更精确地刻画成绩分布,本文依据现实情况,把学生成绩按照如下评定方法划分为四个等级:

I. 90-100分 优 II. 75-90分 良 III. 60-75分 中 IV. 60分以下 差

据此可以做出成绩等级饼状分布图:

图2 成绩等级饼状分布图

从图2可以准确地知道,90%以上的学生成绩都集中在良和中(即60-90分)两个等级之间,其中等级为良的人数占46%-57%,等级为中的人数占35%-48%,而差评的学生为数不多,在4%-10%之间。然而成绩占优的学生比率非常低,且第一和第四学期一个都没有。具体数值如图3所示:

7

图3 成绩等级分布柱状图

综合以上,可以总结出学生成绩整体情况的分析说明: A. 学生总体成绩分布属于负偏态分布; B. 学生总体成绩良好;

C. 绝大多数学生成绩分布在60-90分之间;

D. 90分以上的学生数量甚少,每学期只有1-2个,有两个学期甚至一个都没有。 E. 差评的学生为数不多,平均每学期只有43个,占总人数的6.9% 4.1.2 对结论的检验

首先,本文采用非参数检验方法Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk检验(w检验)两种方法进行检验,运用SPSS计算得到表2,如下:

表2 正态性检验

Kolmogorov-Smirnova Shapiro-Wilk

学期

统计量 df Sig. 统计量 df Sig. 学期1成绩 0.079 612 0.000 0.926 612 0.000 学期2成绩 0.098 612 0.000 0.869 612 0.000 学期3成绩 0.076 612 0.000 0.876 612 0.000 学期4成绩 0.110 612 0.000 0.774 612 0.000 a. Lilliefors 显著水平修正 根据表2可知,D检验和W检验的显著性水平Sig.都极小,小于0.05,因此可以判定为非正态分布。

然后,分别利用SPSS绘制直方图、Q-Q图以及箱式检验图对结果进行正态性检验,如图4、图5和图6(清晰效果图请查看附图1-附图12)所示:

8

图4 成绩频次直方图

从图4 可以直观地看出,波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成绩的总体分布并不服从正态分布,而是负偏态分布。

图5 成绩标准Q-Q检验图

从图5可以直观地看出,只有少部分数据集中在y=x直线上,而大部分数据都偏离了此直线,因此可以判定,该分布为非正态分布,且数据偏向y=x直线的左上方,因此可以推断负偏态分布的结论是正确的。

9

图6 成绩箱式检验图

在图6的箱式检验图中,方框中的区域表示50%的数据所处的范围,方框的上线边界代表了四分位数间距,方框中间的粗线表示中位数,而方框以外的上下两条横线分别代表了极大值和极小值。如果观测数据服从正态分布,那么50%的数据应该落在纵轴中间位置。从图6可以明显地观察到,方框处于纵轴片上位置,因此可以判定学生成绩分布为非正态分布,且为负偏态分布。 4.2 k-均值聚类分析评价模型

4.2.1 确定分类数K

虽然从理论上说,分类的多少并不会对结果的合理性产生较大影响,但是会对结果的精确程度造成一定程度的影响。因此,虽然k-均值聚类分析可以事先给定分类数目,但是为了使分类结果更为精确合理,本文根据统计学中损失函数的原理,利用Matlab编写了分类损失函数并画出图像(代码见附录二),通过观察图像来确定合理的分类数。分类损失函数图像如图7所示:

图7 分类损失函数图像

由于计算数值太多,因此图7显示的图像过于粗糙。由于左侧图像节点比较稀疏,

10

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库学生成绩评价及预测模型(2)在线全文阅读。

学生成绩评价及预测模型(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/jiaoyu/875627.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: