欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第十章中学生物学教育评价课件.ppt

    • 资源ID:2111595       资源大小:1.53MB        全文页数:105页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第十章中学生物学教育评价课件.ppt

    第十章 中学生物学教育评价,第十章 中学生物学教育评价,教育评价是指一系列系统的、科学的和专业的过程,在这个过程中,包括鉴别、获取和提供教育或教学决策之需的资料、意见和价值判断。教学决策是指在教学中所做的各种决定。资料不仅包括评价所获得的学生成绩或名次,还包括事实的描述、记录和报告等;意见指看法、思想和观点;价值判断包括对某一事实或做法的批评、价值评估等;,教育评价是指一系列系统的、科学的和专业的过程,在这个过程中,,第一节 生物学教学评价概述,在学科教育中,教育和教学是融为一体的,所以学科的教育评价也就是教学评价。生物学教学评价包括2种过程:生物学教学中的评价:评价对象是学习过程,即学习过程中学生的学习状况。生物学教学的评价:评价的对象是教学过程,即教学过程中教师的工作状况。,第一节 生物学教学评价概述在学科教育中,教育和教学是融为一体,评价在教学中的地位,评价在教学中的地位,一、教学评价的目的,1.了解学生起点行为,适当配置学生2.规划教学活动,调整教学进度3.诊断学习困难,激发学习动机4.评定学习成就,报告学业成绩,研究预测功能、反馈调节功能促进激励功能、评定选拔功能,一、教学评价的目的1.了解学生起点行为,适当配置学生研究预测,二、教学评价的种类,(一)根据实施评价时所使用的工具和形式来分,1.纸笔测验指以书面形式的测验工具,主要侧重于评定学生在学科知识方面学习成就高低或在认知能力方面发展强弱的一种评价方式。包括:传统的考试、教师自编成就测验以及标准化成就测验或其他作为教学评价辅助工具用的各种心理测验等。共同特征是都使用纸张印刷品即测验卷来呈现要学生回答的试题,并要求学生以各种书写工具在该测验卷上填写适当的答案,因此被称为纸笔测验。,二、教学评价的种类(一)根据实施评价时所使用的工具和形式来分,2.实作评价 这是指使用多种工具或形式,评定学生在实际情景下应用知识的能力,以及在情感态度和动作技能领域学习成就的一种评价方式。评价工具或形式包括:观察与轶事记录、表演、作品、评定量表、检核表、档案袋、社交测量或投射测验等。,2.实作评价,(二)从教学评价的直接目的来划分 l.配置性评价旨在了解学生的背景、性格和学习兴趣,以便根据学生的个别差异,安排适当的学习过程,施予适当的教学和辅导.2.诊断性评价旨在发掘、鉴定学生的学习困难或教学缺失,供调整教学方案参考.,(二)从教学评价的直接目的来划分,3形成性评价旨在了解学生的学习进展状况以及教学的可能缺失,作为调整课程、改进教学和学习的依据.4终结性评价旨在评定学习的进展和成就,作为成绩报告或教育决策的参考.,3形成性评价,(三)从教学评价的标准来划分 1.效标参照评价(绝对评价)指以预先设定的、期待的教育目标为评价基准,来衡量评价对象达到程度的一种评价。评价的重心是在于:学生能做些什么与不能做些什么,是否达到了教育目标。学校内的教学评价多属效标参照评价。,(三)从教学评价的标准来划分,2.常模参照评价(相对评价)是指在某一集团中(班级、学校、地区或国家),以这个集团的平均状况为基准,来评价被评对象在这个集团中所处的相对位置的评价。评价的重心在于:学生之间的比较,而与教育目标没有直接的关系。适用竞争性的选拔考试。,2.常模参照评价(相对评价),三、教学评价的基本原则,1依据教学目标:根据行为目标决定2兼顾多重目标:不同种类、不同层次3采用多元方法:重心是形成性评价4进行多次评价:减少误差5重视反应过程:分析反应组型6善用评价结果:改进教学和学习的参考,三、教学评价的基本原则1依据教学目标:根据行为目标决定,第二节 教师自编成就测验:命题,自编测验多属于成就测验:随堂测验定期测验终结测验,第二节 教师自编成就测验:命题 自编测验多属于成就测验:,一、测验编制计划的制定,(一)明确测验目的和目标测验目的是要解决测验结果用来做什么的问题,是为了诊断教学缺失、学习困难还是评定学生等级?,教师一般所编制的纸笔测验,多半仅能适用于认知目标的评价,对于情感态度与动作技能目标的评价,则多采用实作评价的方法。,一、测验编制计划的制定(一)明确测验目的和目标教师一般所编,好的测验目标应该:以学生为中心 表述一个结果,而不是一项活动具有可测性 明确、清晰,好的测验目标应该:,布鲁姆“教育目标分类法”,布鲁姆“教育目标分类法”,1识记:这是最低等级的认知目标,它指对具体事物和普遍原理的回忆,对方法和过程的回忆,或者对一种模式、结构或框架的回忆。2理解:这是低层次的理解,以一种语言或一种。交流形式被译述或转化成另一种语言或另一种交流形式时的严谨性和准确性为依据,对材料进行初步的重新整理与排列,指出材料包含的意义和趋势。因此理解包括三个心理过程:转译、解释和推断。3运用:指在某些特定的和具体的情景里使用抽象概念只是对所学知识的初步运用,而非综合的、创造性的运用。,1识记:这是最低等级的认知目标,它指对具体事物和普遍原理,4分析:指将材料分解成各种组成要素或组成成分,弄清各种观念的有关层次,或者明确所表达的各种观念之间的关系,阐明材料各要素的组织原理即对材料内容组合起来的组织、系统和结构的分析。5综合:指对各种要素或组成成分加工,形成新的结构整体或新的模式;制定出合理的工作计划或操作步骤;确定一套抽象关系,用以对特定的资料或现象进行分类或解释;或者从一套基本命题或符号表达式中演绎出各种命题关系。6评价:这是认知领域教育目标的最高层次,是指为了特定目的对材料和方法的价值及符合准则的程度作出定量的和定性的判断。,4分析:指将材料分解成各种组成要素或组成成分,弄清各种观念,(二)设计双向细目表 教师根据测验目的及教学目标的需求,以教学目标为横轴,而以教材内容为纵轴,画出一个二维度的分类表,且平均分配好试题比重或题数于表中的每个细目里,并尽量使试题的取材能够充分涵盖所要评价的教学目标和教材内容的范围,以作为编拟成就测验试题的设计蓝图,这样的一个二维度分类表便叫做双向细目表(two-way specification table)。双向细目表是命题、编制试卷的蓝图,它具体规定了各部分教学内容考核的目标和要求,规定了各部分考核内容应该占的权重或分值。,(二)设计双向细目表,知识理解应用分析综合评价总计百分比细胞选择842626%简,教师在设计双向细目表时必须注意:第一,命题的范围在教学过的教材内容范围之内;没有教学过的教材内容范围,不应该有试题被命题出来。第二,双向细目表边缘小格中的数字,不可以为零,也就是说,双向细目表中列出的教材内容或教学目标不能没有适当的试题。第三,教师可以针对自己的命题及评分的习惯,选定双向细目表中所陈述的测验题型,变化或增减所预拟的试题题数或分值。,教师在设计双向细目表时必须注意:,(三)选定测验的题型,客观性试题(选择型试题),选择题 是非题配合题 填空题 解释性习题,(三)选定测验的题型 客观性试题选择题,客观试题与主观试题比较,客观试题与主观试题比较,二、编拟测验试题,(一)编拟试题的一般原则(P210)1试题取材均匀,并具有教材内容的代表性。2试题的叙述应力求简明扼要,题意明确。3各个试题宜彼此独立,互不牵涉,并避免含有暗示答案的线索。4试题宜有公认的正确答案或相对较佳的答案。5试题中某些错误,虽不影响答案的选择,也应当避免。6凡具有争议性的试题,应该注明命题参考资料的来源。7若要测量学生的高层次认知能力,则试题不一定要有固定答案。8试题的叙述应重新组织,避免直接抄课文或原来教材。9试题应重视重要概念或原理原则的了解与应用,要避免偏难琐碎及零碎知识的记忆。10避免使用与测验无关的叙述,增加作答困难。11命题不要超过单元教学的评价目标。12提早命题,以预留时间进行试题审查或修正。13命题数量尽量多一些,作为备用试题。,二、编拟测验试题(一)编拟试题的一般原则(P210),(二)主观型试题的命题原则(P211)1尽量使问题的预期答案在内容和形式上都能明确界定,避免使用缺乏明确内容要求的试题。2在问题中明确指出学生应回答的范围。3预期答案不要太长。4在每一试题之后,注明回答该题所需的时间和该题的分数,让学生能够根据命题者建议的时间和题分斟酌其答案的繁简和内容的深度。5命题完毕后,自己先试做一遍,以确定不会有题意不清或答案太繁的情况。6不提倡选题作答。,(二)主观型试题的命题原则(P211),(三)选择题的命题原则(P211)1题干本身是一个具有完整意义的句子。请比较下列两个例题。2题干要简洁,但要将题意表达清楚,不要包含不必要的信息,造成费解。3除非拟评价非常重要的科学概念,一般情况下,题干不使用否定。必须使用否定时,应在否定词下划线或加着重号,以提醒学生注意。否则学生因疏忽否定字眼而答错该题,并不是评价成就的本意。4每一题的选项以四或五个为宜,其中应有而且最好只有一个正确的或最佳的答案。5每一选项在语法、语气和句子长度等方面,尽可能保持一致。6所有的选项都应合理,不可不合逻辑,否则便失去诱答效果,学生也就会很容易猜出何者是正确答案。7正确答案的出现次序应是随意的,不可为了阅卷方便而以一定次序排列。否则,学生很容易猜对答案。8可适当使用“以上都对”或“以上都错”为选项。,(三)选择题的命题原则(P211),选择题,适用于:应用分析综合评价优点:效度较高适用于各种不同认知层次(通用性强)书写量小猜测几率降低知识覆盖面广不足编制较判断题要有一定的困难编制似是而非的选项较为困难,选择题适用于:,例题1,例题:山楂果实中富含糖分和维生素C,常食用的功效主要是()消食健胃止咳化痰降血压补气益血应考查核心概念,例题1例题:山楂果实中富含糖分和维生素C,常食用的功效主要是,例题2,2019年,我国部分地区出现了较为严重的非典型肺炎疫情,经过科研人员研究确认引起非典型肺炎的病原体是一种冠状病毒,为了控制非典疫情的传播,我国政府采取了一系列的措施。请问下列属于非典传播途径的是()A.空气传播B.血液传播C.水源传播D.接触传播,题干应简捷明了避免套话空话,例题22019年,我国部分地区出现了较为严重的非典型肺炎疫情,例题3,北方果树由根系吸收的水分主要用于()A 光合作用B 蒸腾作用C 植物的生长D 果实的形成,避免无用信息的干扰,例题3北方果树由根系吸收的水分主要用于()避免无,例题4,下列为成年人有关血液的正常生理数值,其中正确的是()A 白细胞:500010000个/毫升血液B 红细胞:男子平均为500万个左右/毫升血液C 血红蛋白:女子平均为12克/10毫升血液D 血小板:1030万个/毫升血液,例题4下列为成年人有关血液的正常生理数值,其中正确的是(,例题5,例题:下列哪项是正常成年女子血液中红细胞的数量()A 7109/升B 100109个/升 C 150109个/升D 4000109个/升,题目之间不能前后提示(self-contained),例题5例题:下列哪项是正常成年女子血液中红细胞的数量(),例题6,以下说法正确的是哪项?A.房室瓣位于心房与心室之间B.条件反射的反射弧是固定不变的C.寄生是一种生物生活在另一种生物体内的现象D.病毒通过不断地分裂来繁殖后代,题干意思明确,一个题目应围绕一个主题或思想,例题6以下说法正确的是哪项?题干意思明确一个题目应围绕一个主,例题8,_是人类的主要能源物质。维生素脂肪蛋白质糖类,空格不应放在句首,例题8_是人类的主要能源物质。空格不应放在句首,例题9,下列关于病毒的形态结构和生命活动特点的描述错误的一项是_。病毒比细菌小得多由蛋白质外壳和核酸组成的核心构成通过不断分裂来繁殖后代离开寄主细胞后不能独立生活,尽量避免使用否定式题干,若一定使用,则需将否定词用着重符凸出显示,例题9下列关于病毒的形态结构和生命活动特点的描述错误的一项是,例题10,下列哪些能够更准确地表示在降雨循环中水与太阳热能之间的关系?B.C.D.关照一杯冰红茶 时,杯子外壁上 有水珠凝集,各选项应保持格式一致,例题10下列哪些能够更准确地表示在降雨循环中水与太阳热能之间,例题11,下列哪些能够更准确地表示在降雨循环中水与太阳热能之间的关系?关照用玻璃片覆盖的 水槽时,玻璃的下表 面有水珠凝集B.光照密封的纸盒,里面 的植物偏向照光的一侧,例题11下列哪些能够更准确地表示在降雨循环中水与太阳热能之间,C.阳光照在人的脸上,当他运动时,他的 脸上会形成汗滴 D.关照一杯冰红茶时,杯子外壁上有水珠凝集,第十章中学生物学教育评价课件,例题12,研究人员测出玉米的体细胞中有20条染色体,那么受精卵中染色体的条数是_条。20 10 40 30,选项应按一定的顺序排列(如时间先后,数字大小等),例题12研究人员测出玉米的体细胞中有20条染色体,那么受精卵,例题13,下列有关寄生的叙述正确的是_。寄生是一种生物取食另一种生物的现象。寄生是一种生物生活在另一种生物体内的现象。寄生是一种生物生活在另一种生物体内、体表、或体外并获取营养维持生活的现象。寄生是一种生物生活在另一种生物体表的现象。,选项长度和复杂程度保持一致,避免提供暗示,例题13下列有关寄生的叙述正确的是_。选项长度和,例题14,鸡的品种很多,但它们的祖先都是原鸡。原鸡被培育成现在各种良种鸡的正确原因是_。原鸡产生了多种不遗传的变异,经自然选择变异逐代积累而形成各个品种。原鸡产生了多种可遗传的变异,经自然选择变异逐代积累而形成各个品种。原鸡产生了多种不遗传的变异,经人工选择变异逐代积累而形成各个品种。原鸡产生了多种可遗传的变异,经人工选择变异逐代积累而形成各个品种。,使用学生熟悉的词语,例题14鸡的品种很多,但它们的祖先都是原鸡。原鸡被培育成现在,例题15,下列结构属于植物细胞的是_。细胞壁细胞膜细胞核液泡以上都正确,下列关于动物在自然界中的作用叙述正确的是()A 可维持生态平衡B 可帮助植物传粉和传播种子C 可维持维持碳氧平衡D 以上都正确,例题16,尽量不要过多使用“都正确”“都不正确”作为选项,例题15下列结构属于植物细胞的是_。下列关于动物在,例题17,绿色植物合成有机物、贮存能量的生理过程是_。呼吸作用光合作用蒸腾作用同化作用,避免选项之间相互包容,例题17绿色植物合成有机物、贮存能量的生理过程是_,(四)是非题的命题原则(P213)1避免使用一般性叙述来命题,而应尽量详细说明题意,以免题意不明,学生无法明确判别。2避免零碎、不重要或纯记忆性的命题。3避免使用否定,尤其是双重否定的命题。4避免以冗长而复杂的叙述来命题。5除非有因果关系存在,在同一命题中,应避免包括两个或两个以上的科学概念。6答案为是与非的命题应约各占一半,否则相差太多时,有考试技巧的学生便可借助是与非出现的频率来猜题,使评价结果信度偏低。,(四)是非题的命题原则(P213),判断题,适用于:回忆和识记;有两种选择的概念(或对或错)优点量大答题速度快,每分钟可完成3-4题不足容易作答区分度问题 猜测答案信度较低,判断题适用于:,例题1,蛇无四肢,体表有鳞片,能够感受温度的变化。应考查核心概念(key concept),例题1蛇无四肢,体表有鳞片,能够感受温度的变化。,例题2,养鱼缸内充满了水,养了一些水生植物和小鱼,缸内还加了一些浮游动物,将鱼缸密封后放到有阳光的窗台上,经过一段时间,鱼缸就成了一个平衡系统。其中水生植物是生产者。应简捷明了(concise),例题2养鱼缸内充满了水,养了一些水生植物和小鱼,缸内还加了一,例题3,出芽生殖是由母体生出形态结构与母体相似的芽体,芽体长大后与母体脱离,形成新个体。不能从课本上直接引用原话,例题3出芽生殖是由母体生出形态结构与母体相似的芽体,芽体长大,例题4,所有的变异都是有害的。只有绿色植物才是生产者。避免具体的限定词,例题4所有的变异都是有害的。,例题5,两只雄盘羊为争夺食物而发生的争斗不属于攻击行为。蕨类不是无维管束植物。尽量避免否定式陈述,如果需要,应将否定词用着重符标示出来,例题5两只雄盘羊为争夺食物而发生的争斗不属于攻击行为。,例题6,转基因食品对人类有害,我们应该拒绝食用。应尽量避免有争议的话题(controversial issues),例题6转基因食品对人类有害,我们应该拒绝食用。,例题7,农业上若施肥过多,易造成烧苗现象,这是因为土壤溶液的浓度小于作物根毛细胞的细胞液的浓度。细菌的个体一般比真菌小。神经元的基本结构包括细胞体和轴突两部分。静脉血管的特点是管壁薄、弹性小,血流慢。生物的变异是定向的。一对夫妇生了一个色盲男孩,那么下一个孩子则不一定是色盲。,应避免答案的规律性,例题7农业上若施肥过多,易造成烧苗现象,这是因为土壤溶液的浓,(五)配合题的命题原则(P213)一组配合题,通常可分为前提和选项两个部分。是在要求学生寻求两件事实或叙述之间的关系。1在一配合题中,前提与选项的内容均应是同质的,不可将不相关的内容勉强凑合。2前提与选项的数目应不同,同时应说明清楚选项可以使用的次数,如:每一个选项只能使用一次或两次或两次以上或一次都不选。3前提的句子通常应比选项长,而且将选项置于右方。4选项应依合理或合乎逻辑的方式排列,避免与前提之间有任何顺序上的相关存在。5每一配合题应附一作答说明,使学生对作答方式能一目了然。6同一配合题的所有前提和选项应置于同一页内,不要分开在两页上,以免增加学生答题时翻页的麻烦,甚至因疏忽而造成错误。,(五)配合题的命题原则(P213),匹配题,适用于知识 理解优点覆盖面广,占用空间小对事实性知识较为适用不足费时 不利于测查高阶思维能力,匹配题适用于,填空题,优点知识覆盖面广考查低阶认知能力猜测几率大大降低不足编制困难:让学生清楚所要考查的内容考查的能力低容易包含与答案相关的暗示评分耗时,填空题优点,例题1,鸟类有很多结构适于飞翔,如胸肌_、直肠_,不能储存粪便、前肢_等。以下属于鸟类适于飞翔的结构特征有_胸肌发达前肢变为翼 长有绒羽长有爪身体呈流线型,要考查核心概念,例题1鸟类有很多结构适于飞翔,如胸肌_、直肠_,例题2,维生素_与_的代谢有关,缺乏时,会产生_病。维生素D与人体内_的代谢有关。,留有足够的答题信息,例题2维生素_与_的代谢有关,缺乏时,会产,例题:开始使用杀虫剂时,对某种害虫效果显著,但随着杀虫剂的继续使用,该害虫表现出越来越强的抗药性。实验证明害虫种群中原来就有存在具抗性的个体。这证明:(1)害虫种群中个体抗药性的_体现了生物的变异一般是_的。(2)杀虫剂的使用对害虫起了_作用。而这种作用是_的。,设问不明确,限定不严密,第一空有“作用”一词限定,题意明确。而第二空则指令不强,缺少限定。,例题:开始使用杀虫剂时,对某种害虫效果显著,但随着杀虫剂的继,(六)简答题的命题原则(P214)1命题题意要明确,限定要严密。2不能从教科书上直接摘录一段句子来命题。3一般来说,问题型的命题比填空型的命题对答案的要求更明确。4假如期望的答案要带有单位,应将单位标示出来。5假如题干使用填空型,原则上以一题一空格为原则,尽量不要在一个题目内,要求学生填两个或两个以上的空格。因为空格愈多,通常题意愈模糊。,(六)简答题的命题原则(P214),(七)解释题或实验题的命题要领(P215)制作这类型试题时,应先设计或转录一段科学概念、科学实验结果或图表等,再根据其内容,设计一些客观型试题,(七)解释题或实验题的命题要领(P215),综合题,适用于应用综合评价优点不能猜测 可使学生展示能力以组织知识,表达观点等可激励进一步的学习不足考查的知识面窄,效度较低编制难度较大主观性,评分的可信性评阅耗时,综合题适用于,三、试题与测验的审查,教师必须对试题进行审查、剪辑,再汇编成正式的测验卷。逻辑的审查:评阅试题与教学内涵(或教学目标)间的关联性,又可称作形式审查;实证的审查:评阅学生的反应组型是否是所期望的,又可称作客观审查。,三、试题与测验的审查教师必须对试题进行审查、剪辑,再汇编成正,逻辑的审查,(一)逻辑的审查 1测验的一致性(试题与教学内容是否一致)试题是否能代表所要测量的行为目标?试题是否与教学目标一致?试题是否与教学的呈现方式相一致?请校内任教相同科目的其他同仁过目,以学科专家的眼光去察看各试题是否与上述三项审查重点相符合。,逻辑的审查(一)逻辑的审查,逻辑的审查,2测验的适当性检查重点在于查验试题的格式、问题陈述的方式以及其他可能的影响因素,是否能够适当地反映出试题所要测量的行为目标。试题内容、题数、范围是否遵照双向细目表的计划,试题类型是否符合应有的命题原则?题意表达是否清楚?试题呈现方式与作答说明是否明确,试题是否代表所要测量的行为目标;问题的叙述有无前后矛盾、提供暗示答案的线索或重叠出题等等。,逻辑的审查2测验的适当性,(二)实证的审查 以实证的方法审查测验试题,主要是试题功能的分析和教学敏感度的分析。通过预试的方式进行实证的试题审查,(二)实证的审查,1试题分析试题分析的目的在于审查试题品质是否符合所要测量的学习领域和测量理论的要求,以一些量化的指标作为挑选试题的依据。难度是指试题答对人数占总人数的百分比,亦即是指试题正确反应的几率。区分度则是指试题能够区别答对和答错人数的百分比,也是指试题能够区别高低不同能力组群的功能。,1试题分析,2教学敏感度分析教学敏感度是指不同难度的试题具有代表教学效能的倾向,它可以用来判定教学是否有错误或试题本身是否有暇疵及不适当之处。教学敏感度是评判试题鉴别功能好坏的参考指标。,2教学敏感度分析,较常用教学敏感度指标是前后差异指数(pre-to-post difference index,简称PPDI),定义:PPDI=(后测的难度)-(前测的难度)该指数的值域介于-1.0到1.0之间。在正常的教学情境里,PPDI指数值介于0.10到0.60之间。PPDI指标被用来帮助教师检查每个试题与教学之间的品质关系,以便作出下列三种决定之一:保留;删除;修改该试题。,较常用教学敏感度指标是前后差异指数(pre-to-post,四、试题与测验的分析,大规模的或正式的标准化成就测验必须经过严谨的试题分析和测验分析后才能使用。试题分析是针对每一个试题的分析,其内容主要包括:难度的分析;区分度的分析;诱答力的分析等。测验分析是针对整个测验试卷的分析,其内容主要包括:信度的分析;效度的分析;差异度等基本描述性统计分析。,四、试题与测验的分析 大规模的或正式的标准化成就测验必须经过,五、试卷的编辑,试卷编辑是依据测验目的将适当的优良试题编辑成一整份测验试卷。,五、试卷的编辑 试卷编辑是依据测验目的将适当的优良试题编辑成,(一)试卷的长度试卷长度是针对测验题数的多少而言。可以考虑下列六个因素。1.测验的目的:单元应比整学期少;形成性评价比终结性评价多;效标参照测验比常模参照测验的多。2.试题的类型:客观测验应比主观测验多;选择型比补充型多。3.信度的高低:宜增加复本试题的数目。4.学生的年龄:年龄愈小应愈少。5.学生的能力:适用于能力较低学生的比较高学生的少。6.作答的时限:速度测验比难度测验的题数多。,(一)试卷的长度,(二)试题的难度 测验试题的难度选择,取决于测验的目的。常模参照测验,使用难易适中的试题,而淘汰太难或太易的试题。效标参照测验,决定试题的难度因素是学习材料与学习涵盖的范围。,(二)试题的难度,(三)试题的排列1根据试题难度来排列将简单的试题排列在前,困难的试题排列在后,以符合作答的心理原则 2根据试题类型来排列3根据教材内容来排列4根据教学目标或测量能力来排列,(三)试题的排列,(四)编制试卷指导语 说明包括:测验目的;作答时间;记分方法;答题要求;试题分数的分配,猜题是否扣分;是否可以携带及使用教科书、讲义、笔记、尺、圆规、或计算器等;答案纸与试题册是否分开作答,分别交卷;是否允许学生在答案纸或试题册上注记或补充说明事项;考试中途是否可以举手发问等,以及其他需要特别说明的事项。,(四)编制试卷指导语,第三节教师自编成就测验:阅卷和评价结果的统计分析,第三节教师自编成就测验:阅卷和评价结果的统计分析,一、试卷的评阅,(一)评阅主观题应注意的原则(P221)确定明确的分值给分系统:计点法、分级法阅卷中保持平行,减少误差(二)评阅客观题应注意的原则(P222)客观题是否倒扣,一、试卷的评阅(一)评阅主观题应注意的原则(P221),二、试题分析,试题分析是对试卷中单个试题的测试结果进行分析,从而确定试题的品质。可以作为正式试卷确定前预试阶段的一项基础性工作,作为实证审查的组成部分,可以在正式测试后作为整个测试工作评价的一个方面。内容包括:难度分析;区分度分析;针对选择题的诱答力分析。,二、试题分析 试题分析是对试卷中单个试题的测试结果进行分析,,(一)试题分析的步骤(P223)1将试卷按得分的高低排列。2由最高分向下取全部试卷数的27%或1/3,称为高分组。3再由最低分向上取与高分组相同份数的试卷,作为低分组。4分别计算高、低分组,选答各试题每一选项的人数,记录在试题卡上,5计算各试题的难度(P),以百分比表示,其计算方法如下:难度(P)=(RU+RL)/2N RU:高分组答对该题人数 RL:低分组答对该题人数 N:高分组或低分组人数,(一)试题分析的步骤(P223),6计算各试题的区分度(D),其计算方式如下:区分度(D)=(RURL)/N7评价每一试题的选项的有效性或诱答力。作为选择题中一个有效的选项,应该做到:至少有一位低分组学生选择该不正确选项;选择该不正确选项的低分组学生人数应该比高分组学生人数要多。8将所有试题依其难度与区分度制作综合分析表.,6计算各试题的区分度(D),其计算方式如下:,(二)如何评价和改进试题 制作试题卡简便方式,(二)如何评价和改进试题,三、试卷分析,试卷分析是对整个测验的品质作出分析。通过试卷分析确定本测验是否达到测验目的,是否真实有效可信。试卷品质的分析包括试题分析、基本的描述性统计(descriptive statistics)分析,以及信度和效度分析。,三、试卷分析 试卷分析是对整个测验的品质作出分析。,(一)试卷的综合分析计算出测验试卷的每个试题的难度(P值)和区分度(D值),然后分别以试题的P值和D值两个维度作坐标,根据各试题的P、D值,将题号填人坐标内的空格,形成一个综合分析表。综合分析表可以简单明了地了解在某一次测验评价中,有多少试题和那些试题的P、D值达到理想,那些试题的P值或D值或两者都没有达到理想而需要改进。,(一)试卷的综合分析,1难度(P)分析 常模参照评价中,希望将受试者的得分尽量分散开来,以便比较学习成就的优劣。难度以在50%左右为最好。实施学习成就评价时,希望学生的平均得分落在满分与机遇得分的中间,理想的P值以“期望平均得分”为准。,1难度(P)分析,P0.8 试题太易;P0.8、P0.4、0.6的中等难度试题应占60%。整套试卷平均难度在0.40.6之间。,P0.8 试题太易;,2.区分度(D)分析 D值是介于-1与1之间。理想的试题应该是所有高分组的学生都答对,而低分组的学生都答错,此时,D值为1;相反则D值为-1;常模参照评价而言,D值愈大,学生得分便愈分散,相应地,试卷标准差(SD)也比较大,试题品质较高,信度也较大。在学习成就评价上,我们通常以一定的标准来评价(P227表10-5)。,2.区分度(D)分析,鉴别指数题目性能0.4以上很好0.20-0.29尚可,仍需修,(二)试卷的基本描述统计分析 1平均数(mean)2标准差(standard deviation)3相关性分析(correiation Study),(二)试卷的基本描述统计分析,(三)试卷的信度分析 信度是指评价的结果(分数)与其拟评测的学习成就的一致性。评估信度的资料来自评价的结果而非评价工具本身。当我们要评估某一评价工具所测得的结果(分数)的信度有多大时,便往往通过观察本次评价结果(分数)是否与其他类似目标的评价结果,(即另一次评价的分数)一致来判断,若一致性颇高(即高分者仍得高分,低分者仍是低分),便可认为该评价结果(分数)应可测得学生的真正学习成就。,(三)试卷的信度分析,影响评价结果信度的因素:试题的数量分数的分散度试题的难度试题的区分度评价工具的客观性,影响评价结果信度的因素:,2信度系数的估算方法(1)重测法:以同一份试卷测一群学生两次(2)对等法:制作两份在内容、难度和题型上尽可能类似的试卷(3)分半法:在实施测验之后,将每一份试卷的奇数和偶数题分别计分(4)库李法:KR20和KR21,2信度系数的估算方法,提高测验信度的方法适当增加测验长度;与能力有关的测验,其难易程度要适中;测验的内容不应过于复杂;测验的实施和评分方法要标准化。,提高测验信度的方法,(四)试卷的效度分析 效度(validity)是指测验分数的正确性。就是指一个测验能够测量到它所想要测量的特质的程度。就学习成就评价的范围来说,所谓效度是指评价工具是否精确地测出了该工具期望评测的成就。,(四)试卷的效度分析,评定内容效度的方法首先,请所测学科的专家检查双向细目表是否符合课程大纲或课程标准的要求,各章节的内容比例是否合理;然后,然后对测验题目与双向细目表进行比较,如果吻合程度高,则内容效度高。,评定内容效度的方法,实际工作中需要注意下列事项(P230):1.答题说明应明确详尽,使学生不至于有任何混淆或误会。2编题所用的词汇和句子不可艰涩深奥,以致学生因无法看懂而无从下笔答题。3语意要清楚明确,不可稍有模糊。4试题数量不可太少。5编题时不可有意无意地在题目中提供任何与答题有关的线索,导致学生猜题。6试题难度应适当。7试题应尽可能评侧重要的概念、思考过程、知识的理解、分析和综合,而不宜故意设置陷阶,评测一些琐碎、零星的记忆性知识。8试题的排列次序应先易后难,以免学生花大多时间在较难的题目上,以致时间不足而放弃了一些容易的试题。9信度是效度的必需条件,因此,效度高的评价、首先信度要够。10同一试卷重复使用多次,效度会逐渐降低。,实际工作中需要注意下列事项(P230):,第四节 实作评价,实作评价可定义为:具相当评价专业素养的教师,编拟与学习成果应用情境相类似的仿真测验情境,或真实的测验情景,让学生表现所知、所能的学习成果的评价过程。实作评价的重点,通常是放在实际表现的过程、作品或这两者的组合上,具体情况视实际表现活动的性质而定。在教学之初,教师会比较重视正确的表现过程;学生逐渐熟悉正确的表现过程后,则会将注意力逐渐转移到强调完成作品的品质上。介于评价认知能力所用的纸笔测验和将学习成果应用于真实情境中的表现二者之间。,第四节 实作评价 实作评价可定义为:具相当评价专业素养的教师,实作评价的特点,实作评价的特点,一、实作评价的类型,根据施测情境的真实性程度来分:(一)纸笔表现(二)辨认测验(三)结构化表现测验(四)仿真表现(五)样品模板,一、实作评价的类型 根据施测情境的真实性程度来分:,二、实作评价的实施步骤,(一)确立实作评价的目标 典型的方法是使用工作或作业分析来确认影响表现的最重要的特殊因素是什么,或明确地列出更细节的表现行为是什么。,二、实作评价的实施步骤(一)确立实作评价的目标,(二)确认实作评价的标准 1.在下列情况下,实作评价应该将其重点放在过程评价上:没有作品成果可以产生,或作品成果评价不可行。过程能够排序,并且可以直接进行观察;正确的过程对最后的成功有重大作用;过程步骤的分析有助于提高成果品质。,(二)确认实作评价的标准,2.实作评价将重点放在作品或成果的评价上适合下列情况:不同的过程可以导致相同的作品或成果;无法提供过程的观察资料;学生对表现过程和步骤已经驾轻就熟;作品或成果具有可被辨认及判断的品质。,2.实作评价将重点放在作品或成果的评价上适合下列情况:,3.在某些情况下,过程及作品成果二者都是构成表现的两个重要层面,缺一不可,并且二者都可以被观察得到,此时,实作评价应该强调何者,应视被评定的技能及技能发展阶段而定。,3.在某些情况下,过程及作品成果二者都是构成表现的两个重要层,为了达到明确界定表现标准,教师可参考下列建议:确认即将被评价的整体表现或作业之前,教师自己先实际表现看看,然后记录及研究自己的表现或任何可能的表现成果。即教师先做预试,并将可能的情况记载下来。列出构成这些表现或成果的重要方面和因素,它们是指导进行观察和评价的表现标准。将这些表现标准的数量,限制在1015个之间,以方便进行观察和判断。如果可能的话,集合一群教师共同决定一项作业应该包含哪些重要的表现标准。以可观察到的、测量到的及进行数字量化的学生行为或成果特质等术语,来界定表现标准。不要使用含糊不清的字眼(如:正确地、适当地、良好的)来混淆表现标准的意义。依序排列表现标准,以方便进行观察和判断。检查是否已有现成的实作评价工具,若没有的话,再自行编制。,为了达到明确界定表现标准,教师可参考下列建议:,(三)提供适当的表现情境 可以是教室内自然发生的,也可以是教师特别设计仿真真实的情境;判断原则:教室中自然发生的表现频率:不频繁则设计依据评价所做决定的重要性:重要性大,评价情境要结构化到底需要多少信息才能作出决定:收集多次资料是必需的,(三)提供适当的表现情境,(四)确定计分和评定的方法整体评分法评价只是决定一般性质分析评分法 是诊断学习困难及了解学生熟练表现水准,(四)确定计分和评定的方法,三、实作评价的方法,实作评价的方法:是指可以用来收集和记录学生表现行为的工具。(一)系统的观察和轶事记录自然情境下观察学生表现;通常依据检核表和评定量表进行。(二)检核表是一组列出表现或成果的测量维度,并提供简单记录和判断的资料表(三)评定量表评定某个表现出现频率大小,属于连续性变量资料。(四)作品量表是一列反映不同品质程度的样本作品;使用整体判断法(五)档案夹用以显示有关学生学习成就或持续进步信息的一连串资料的汇集。使用整体评分法或分析评分法。,三、实作评价的方法 实作评价的方法:是指可以用来收集和记录学,

    注意事项

    本文(第十章中学生物学教育评价课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开