使得分析成绩系统更直观、有效地反映学生此课程这一阶段的表现,进而研究今后的教学重点,以及从教学到考试等一连串过程中的薄弱环节,从而达到教学相长的目的。
不论是对学生的整体学习情况还是单独考虑每个学生的学习情况都能够进行较好的评价。比起单纯的\绝对分数\评价学生的学习状况,忽略了基础条件的差异,我们运用了各种方法和模型来去避免这类现象的发生,动态的分析每个学生的情况,并从定性和定量两方面分别给出了数值与建议。
第二章 需求分析
2.1课程任务
本次课程需要用R软件完成对班级各科成绩的评测,内容包括对数据进行标准化、求平均值、方差、协方差、协方差矩阵,进行简单的画图(包括散点图,直方图,正态分布图),实验报告,总结,其目的主要是熟悉R软件的使用。 2.2运行环境
运行环境主要是R软件,辅助软件有word\\excel等
第三章 用R软件对班级成绩进行操作
3.1引用班级成绩数据
用R软件对班级成绩进行分析,首先要对班级成绩进行应用,如果进行纯手工输入会造成工作量过大,并且有可能会有数据错误或者缺失等不利之处,在这里 我们需要用到简单的R程序(读取外部数据)如下:
4
d=read.csv(\位置\d
(既先将需要调用的外部数据另存为csv或txt格式,然后记住位置使用以上函数进行引入)
结果如下:
部分数据
3.2.对班级数据进行标准化
为了下面实现 R 软件应用于主成分分析中的,现以研究我国 2008 各地区城镇居民家庭平均每人全年的消费情况为例。 首先收集能反映我们班成绩及排名情况的名称和数据, 这八个方面来描述学生成绩情况。收集到的数据于在上面,为有利于后面操作,及我们对我班成绩进行直观的认识, 需要将班级成绩数据进行标准化,在其命令行中输入下面的命令:
d=read.csv(\从存储位置读取数据 > sd=scale(d) # 对数据进行标准化
5
> sd #输出标准化后的数据和属性信息 结果如下:
6
标准化后的部分数据
数据属性
3.3.主成分分析
在分析现实的问题时,往往会涉及到很多的指标,这些指标如果都要考虑的话,会很复杂。 主成分分析方法通过降维的思想,在损失很少信息的情况下把多个指标综合成少数几个具有代表性的指标,通常把这些具有代表性的指标称为主成分。
对实际的问题进行主成分分析时,往往是要借助计算机软件来完成的,比较常用的是 SPSS 软件,但是这个软件是收费的。 而相比之下,最近几年发展很快的 R 软件也是一款功能强大的统计软件包,R 软件[2]是属于 GNU 系统的一个自由、免费、源代码开放的软件。 随着我国对于软件知识产权法规不断完善的情况下,学习、利用和基于 R 软件平台进行二次开发对于我国的科研人员来说越来越重要,同时也具有重大的现实意义。 2 主成分分析基本原理
设对于某个问题的研究涉及到 p 个指标,分别用 X1,X2,X3…XP 表示,这 个指标构成的 p 维随机向量设为 ,对X 进行线性变换,可以通过线性组合的方式形成新的综合变量,这里用 C 表示。 新的综合变量和原来变量之间的关系可以用下面的公式表示:
上式中的线性组合可以是任意的,由不同的线性变换得到的综合变量 的统计特征也是不一样的。 为了使综合变量可以较好的描述原变量的特征,应该要让 的方差尽可能的大,并且 Ci 之间相互独立。
3.4对班级成绩进行求方差和相关矩阵 1、提出猜想:
7
> x<-read.table(\ &&读取数据 > for(i in 1:5){cat(var(x[,i]))} &&各变量的方差 输出变量:
600.387251.73782148.2147151.0199302.9737>
上图看到变量3、变量4的方差较大,于是猜想:如果变量方差大并且变量所在的第一、第二主成分系数也大,那么变量的方差对班级成绩描述的贡献可能也大。 2、验证
> a<-cor(x) &&求相关矩阵(协方差)要求相关都为正
> eigen(a) &&输出特征值、特征向量 输出:
8
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库学年成绩分析 - 图文(2)在线全文阅读。
相关推荐: