1基于统计软件的试卷质量分析摘要通过介绍软件对考试数据进行实例分析的具体步骤揭示了分析成绩分布试卷难度区分度信度及效度等指标内涵论述出试卷质量分析应包含的内容总结了一套考试分析的一般模式旨在提供可行方案和数据决策提升教学质量监控水平的科学化关键词统计难度区分度信度效度中图分类号文献标识码文章编号试卷作为考试的一个重要载体是测评学生学习成绩的工具是教学质量检验的重要手段因而教学质量评估管理中越来越重视试卷分析试卷质量的分析结果客观地向教与学双方提供了反馈信息进而实现评价教育目的的实现教学效果的好坏等一系列质量要素今后应该成为教学工作中重要的常规环节之一软件简介软件是英文名称的首字母缩写即社会科学统计软件包它是目前世界上常用2的三大统计分析软件及之一是世界上最早采用图形菜单驱动界面的统计软件其界面友好功能强大和操作简便能方便地从其他数据库中读入数据是一款功能强大的教育统计软件既可以进行基本数据的统计分析还可以进行各种推断和检验统计试卷质量分析应用实例下面数据以安徽大学公共基础课程程序设计基础的期末考试成绩为样本利用软件分析说明考试质量分析的模式和各项指标试卷基本结构本试卷满分分由两部分组成客观性试题与主观性试题其中客观性试题共分占主观性试题共分占具体情况见表填写试卷基本结构可以发现题量尚可试卷题型不够丰富填空题可以细化为一般填空和程序计算填空客观性试题一般强调知识点考察常见类型为单项选择题多项选择题判断题和简单填空3题而主观性试题则根据学科的不同一般设有复杂填空题简答题问答题论述题和计算题等题型考试分析指标的定量分析成绩数据的录入与处理定义变量并输入数据这是直接方法启动软件后会启动数据编辑器界面通过單击标签进人变量名编辑窗口在名称下注明学号姓名各题型总分平时成绩和班级代码其中各题型总分平时成绩和班级代码均设置为数值类型小数点长度定义为其余各项使用默认第二步选择数据视图开始输入数据从第一行第一列起直接输入相关数据这样每行输入一个学生的记录各列输入数据为一个某种题型的成绩最后一列是班级代码等最后保存扩展名为格式的数据文件直接导人外部数据更改数据类型4为了更好地对数据进行共享还可以快速打开和编辑其他格式的文件可直接导入操作的数据文件包括文件等格式具体的操作步骤为依次单击此时要在文件类型下拉菜单中选择在出现的全部文件列表中找到关联文件双击在弹出对话框内选中其中的复选框此项设置为把表格中的第一行作为变量名导人否则第一行将作为数据导入单击按钮后会打开界面就能显示出刚才导人的文件内容随后也可依次单击将当前数据存为其他格式的文件比如格式方便下次使用本文实例数据先对考试系统自动生成的文件格式进行数据导入然后对变量属性作了适当修改如图所示成绩统计的基本描述性分析指标成绩统计分析的基本描述性指标主要有学生总数实考人数最高分最低分各等级的人数分布及百分比均值与标准差成绩分布图等相应的描述性统计量包括最小值最大值频数均值标准差偏5度和峰度等这些指标均要求按班级对试卷成绩及总评成绩进行分析其中均值用来描述数据集中趋势标准差强调数据的变异性即数据的差异量数进而反映数据全貌而对称偏斜及分布陡缓程度等数据分布的结构形态及特征则由频数偏度和峰度用来描述卷面成绩的集中和离散数据统计打开录入后的数据表依次单击出现频数对话框导入要建立频数分布表和直方图的项目同时选上和等参数得到表依次单击菜单显示出分数段分布图和直方图直方图如图所示一般而言学生成绩标准差在满分的以内属于正常从图表中得到的统计值可以发现本次考试的两个班的离散程度均较大表明学生成绩离散度太大可能是试题的问题也有可能是学生水平的两极分化比较严重学生成绩基本呈正态分布考生总分6偏度值为和依据偏度在数据分析中的意义本次测试数据显示考生所得总分相对集中于平均分左侧即大部分考生成绩小于平均分值在峰度的计算中计算结果可知在学生成绩的正态分布图有比正态分布更长的尾部不过盯为较小负值说明考生成绩在平均分附近的集中度虽低于标准正态发布曲线但也差别不大标准差差异较大但是结合对总分的直方图的观察可以发现低分段考生的成绩与平均分的差距较大这是造成即使大多数考生的总分集中于平均分附近最后标准差数值仍较大的主要原因难度指标分析对于课程考试来讲保持合适难度是保证试卷质量的前提观测得出总试题难度大概在之间难度值中等偏低试题适中相对较难区分度指标分析区分度是指测验题目对学业水平不同的学生的区分程度或鉴别能力区分度作为评价试题质量筛选试题的主要指标与依据是测验是否有效的指示器该指标对于选拔性考试7如高考竞赛尤为重要具有良好区分度的测验实际水平高的被试应得高分水平低的被试应得低分区分度与难度有一定关系在工具软件环境下我们一般求出总分与每个试题得分间的积差相关系数作为试题的区分度可以采用皮尔逊相关分析来对试题进行分析步骤为在弹出的对话框中选择各种题型和总分进人然后在中点击完成后得到了各个题目的区分度如表所示从表中数据看出由于三种题型的相关系数值达到了显著性水平表示试题的区分功能显著信度指标分析信度用来反映考生稳定水平可靠性即测验能否真实反映学生水平程度的数量化指标是测验的必要条件常用的有重测信度复本信度同质性信度荷伊特信度和评分者信度等因为影响测验水平的因素有很多导致信度的计算方法也不同实际使用何种信度要依据考试目的和性质而定从而选择其中一种或8几种由于高等教育测验中绝大多数混合了客观题和主观题所以软件中一般采用克隆巴赫系数计算信度取值左右即可达标这种计算方法是由于年提出的不要求測验题目必须是记分型也能计算任何测验的内部一致性系数在工具软件环境下依次运行出现对话框从中选择所有题型和总分在框的项目中单击选择模型并选中复选框计算出该试卷的信度系数如表所示通常仅系数的值在和之间如果系数不超过一般认为内部一致信度不足达到时表示量表具有相当的信度达时说明量表信度非常好对上机测试来说信度相对信度较高一般来说增加试题的数量保持所有试题的难度接近正态分布努力提高试题的区分度严格监考和按评分标准给分均可以提高信度效度分析9效度是指试卷准确地测量了考试目的的欲测内容的多少多大程度上效检了所要测定的功能或达到其测量目的具体地讲就是覆盖面和权重在教学大纲范围内的完成情况体现考试能力水平和反映教学大纲完成的情况有效程度公认的效度分类方法是将效度分为内容效度结构效度构想效度和效标关联效度确定使用何种效度要根据测验目的而定常用的效度检验方法是效标关联效度法这种方法首先是寻求一种可靠的效标然后求出测试结果与效标的相关系数该相关系数则为效标关联效度在工具软件环境下依次单击选择总分和平时成绩字段随后在相关系数中选择计算数据如表所示试卷质量控制的定性综合分析结合统计数据进行定性评价对试卷质量分析时的定性评价应有如下几个方面内容一是题量10和题型二是试卷语言的表述是否明确和准确如参考答案是否正确试卷内容是否有重复或是对后继题目有提示等专有名词表述是否准确选择答案设计是否均衡排列是否科学三是试卷内容的难易度四是试卷的内容效度覆盖面问题五是教学重点的突出程度结合教学实践进行教学反思建立一个长久稳定的指标体系通过长期分析这些指标可以更好地客观地指导我们的教学改革检验课程设置的合理性这些可以通过多因素变量的综合横向和纵向比较比如同一课程不同专业的学生的成绩是否有差异进而分专业更合理地优化我们的课程安排再比如通过长期比较同一课程不同授课教师的成绩数据可以分析出教师之间的差异进而去了解他们授课方法的不同之处取长补短促进教师的经验交流和快速成长体现学校管理的人性化和有效的监控通过长期分析不同课程的成绩分析间接分析出各院系或者个别学生在校期间的不同学习阶段的学习听课情况发现异动综合评价能做到及时提醒并引导学生的学习或对学生进行有效的辅导