学生评价需要专业化(改).ppt
《学生评价需要专业化(改).ppt》由会员分享,可在线阅读,更多相关《学生评价需要专业化(改).ppt(90页珍藏版)》请在三一办公上搜索。
1、三个人,您最看好谁?,候选人A:跟一些不诚实的政客有往来,而且迷信,向占星术士咨询。他有婚外情,是一个老烟枪,每天喝8-10杯的马丁尼。候选人B:过去有两次被解雇的纪录,睡觉睡到中午才起来,大学时吸过鸦片,而且每天傍晚会喝一夸特的威士忌。候选人C:他是一位受勋的战争英雄,素食主义者,不抽烟,只偶尔喝一点啤酒,从没有发生过婚外情。,评价与偏见,候选人A:富兰克林 罗斯福候选人B:温斯顿 丘吉尔候选人C:亚道夫 希特勒思考:为什么会有这样的结果?“偏见”在我们的教学中造了什么孽?您的评价体验?,看到什么:取决于你站在哪里看?,克莱波说:“每一回你观察世界的角度有所移动时,无论是多么轻微的移动,你就
2、会看到此前未曾看过的事物”。每一种评价手段,都是一种缺陷的存在。每一次评价都是一种偏颇的理解和解释。当前学校的评价:现在主要站在什么样的角度看学生?应该站在什么样的视角看学生?,互动工作坊:我看“学业评价”,讨论以下问题(可以用小纸条回答):.您认为什么是学业评价?学业评价具体有哪些形式?.评价对于学生而言,有什么用?.教师在什么时候做评价?您是怎么做学生评价的?.当前,学业评价的主要问题有哪些?,学生评价需要专业化,谢 翌 博 士 江西师范大学基础教育研究中心 副主任江西师范大学教育学院 教授2011-12-16E-mail:,分享提纲,一、无反专业的评价现实二、要有专业的评价理念三、要有与
3、理念一致的评价技术四、教师要有评价素养五、重建专业化的评价文化,一、“无去反”专业的评价现实,评价不规范:成了教育改革的瓶颈评价的追求评价结果的误用评价工具的经验性评价技术的不成熟评价文化的俗化、功利化教师评价能力的缺失,评价时时刻刻发生在教育教学活动中发展性评价更多地表现为对评价对象的关注和关怀评价不等同于考试,评价的形式是多种多样的,不一定都要有正式的结果或报告,我们需要了解,测量、考试与评价,考试是一种测量而非评价!测量:客观事实的描述;量化的表达;数字评价:主体价值的表达;对人/物的价值评判;表达价值的结论评价是对测量结果进行解释并运用作为证据进行价值判断。,除了测验和考试“评价”时时
4、刻刻发生在教育活动中,李辉做完了作业,然后显得自豪地将作业交给老师。在阅读课上冯楠大声地朗读课文,但有几处单词发音错了。王露的学习很好,却对新开设的探究课感到沮丧和无奈。刘晓东放学的时候向老师说“恨”他的父母。大家都在做实验,只有苏雯仿佛不知所措。在一次探究活动中,马乐递交了一篇非常精彩的报告。罗刚拒绝参加科学实验课,因为他觉得杀害活的生物,还进行解剖,很令人不道德和恶心。老师注意到当其他孩子取笑赵凯、把他撇在一旁、不让他和他们玩时,李兰就会像好朋友一样和他在一起。陈枫的语文总也考不好,但他写的诗很有感染力,老师被深深地感动了。,back,评价:教育改革的瓶颈,评价的尴尬:高考英语试题让英藉教
5、师和语言专家考试不及格;考试成绩与评价期望相悖时造假为什么?评价工具的“测试能力”;评价研究的滞后;评价人才的缺失;教师评价能力的缺失PISA(学生能力国际评价)为何能得到世界范围的公认?工具的科学性(运用已有知识和技能综合解决实际问题的能力;支撑评价理念的评价技术。PISA 评价关注四个子目标的实现:学习成果的质量;学习成果的等价性和学习机会的均等性;教育过程的有效性和效率;教育对社会经济的影响。)芬兰的优秀 上海的第一:中国教育真的好了?日本的差异(两极),上海2009 年PISA 测评结果,质疑:结果的可靠性或考试结果所反映的能力1.样本是否有代表性?2.中国学生成绩好是因为应试能力强,
6、中国学生缺少创造性。3.成绩好的代价是课业负担重,牺牲了其他内容的学习。4.上海成绩好是精英教育或拔尖教育的结果。5.上海不代表中国,一次考试也不能说明全部问题。,爱迪生曾因学习成绩不良被拒之于校门外巴顿将军被认为是学习无能者牛顿小时候是校长经常提到的成绩不好的学生拿破仑读小学时教师和家长都认为没有出息英国首相梅杰16岁辍学,高中没有毕业波兰前总统瓦文萨只有小学文化,“偏颇的”评价,刘海洋小的时候父母就离异了。海洋是一个听话,用功的孩子,不看电视,不出去玩,就是一天到晚看书、学习。海洋从来不抱怨,也没有什么不高兴的事。他参加各种数学比赛,一参加就能拿奖,家里的奖状、证书、奖牌几十个,这就是他的
7、快乐。海洋什么都不会干,到大四了,裤衩、袜子都是妈妈给他洗,妈妈知道海洋生活能力差,曾经跟他说过,清华要是在天津咱都不能报,咱只能在北京念书。海洋考大学的时候想报考生物系,可是在妈妈的坚持下报考了计算机系。海洋的妈妈也认为海洋的22年太单调了,但她认为自己作为一个工人,把海洋从小学送到清华,只能这样做。海洋不但考上了清华,还是全校第一名,教师付出了多少的心血,这么优秀的学生出了这样的事,海洋的中学老师教师感到非常难过并对他的行为感到难以理解。,学生的错误还是评价的悲哀?,评价:堕落为伤害人的利器,前体操世界冠军街头卖艺 曾行窃专业队获刑丁俊晖已经出现三次有关劳动的堕落事件。而且,这三次堕落事件
8、都以表面的进化出现(刘良华):第一次堕落是劳动技术的堕落。第二堕落是劳动教育的堕落。第三次堕落是出现了奴隶和不劳而获的人。人类的运动史上也出现了三次堕落事件。运动原本是人的本能,就像劳动是人的本能。运动的目的是为了满足人的性欲。性欲(好色)与食欲(好吃)并列为人的两大欲望,为了满足人的性欲,人(男人)不得不打架。后来,人不再从事暴力的竞争(打架),逐步转向非暴力的竞争:先是运动,在运动会上展示身体的力量;然后是财富,以财富来显示人的实力;后来是权力,以权力意志来炫耀人的控制力。竞争形态的变化似乎显示了竞争的进步,但是,几乎每一次竞争形态的“进化”都带来了人类的堕落。第一次堕落是较量形态的堕落。
9、第二堕落是运动教育的堕落。第三次堕落是出现了职业运动员和看客。职业运动员是用戕害身体的方式来满足看客的欲望。这样看来,职业运动员与人妖是类似的职业。,高考的六大问题,将高考定位为选拔性考试,是造成试卷实际难度逐步加大的原因。单一的笔试形式造成对学生全面发展的忽视。封闭式试题影响了高层次的认知能力的发展。唯一的考卷加重了学生的负担,不利于学生特长的培养。计分方法不合理。以省为单位排总分划分数线的做法,极度夸大了考试分数的价值,负面影响极大。,评价研究与实践操作滞后,首先,我国当前课程测量与评价领域及其相关领域的研究相对薄弱,无法回应新课程推进过程中所提出的众多理论和实践问题。其次,作为课程测量与
10、评价的核心成分,我国当前教育考试的测量学水平亟待提高。这里的教育考试,包括了从中考、高考,到各种学习质量监控考试,再到各种课堂学习评价等学业成就考试。在整体的设计思路上我国教育考试目前的实践与国际上同类测验相似,但在具体环节的实施上还有很大差距,直接影响到测验目的的达成和测验结果的质量。例如:现有的课程标准过于概括抽象,只规定了最后的目标,缺乏描述各年龄阶段学生实际表现程度的水平标准,直接影响到教育考试框架的制定水平和质量保障。在测验题目开发方面,我们更多的依赖命题专家的经验和判断,较少严格遵循详尽系统的测量学规范和步骤。较少组织测验题目的预测,并根据学生实际回答的数据进行测量学方面的分析,检
11、验题目选项是否符合了预期功能、是否测量了应该测量的东西、是否对不同性别或地区的学生是公平的等等。这种经验式的命题和组卷模式直接影响到最终测验的稳定性和准确性,降低了对学生学习情况进行推断的有效性。,评价研究与实践操作滞后,第三,我国教育考试多以教育行政部门为主导,缺乏独立的专业性的考试研发机构。我国教育考试的行政化色彩使得当前的学生学业评价客观上过分强调了考试评价如何为教育管理和决策服务,而忽视了如何为学生学习和教师教学服务;客观上强调了考试的选拔功能,而忽视了对学生学习的发展性功能。行政的手段有时会直接干预到对学业成就考试的技术要求,如考试的分值、题型、题量、难度、等第划分方式等等,从而使得
12、教育测验的设计开发无法按照科学、正确的程序进行。第四,考试开发和教育实践队伍的教育测量和评价素养有待提高。在我国,中高考等总结性测验的设计开发通常是由教育考试机构组织学科专家进行命题和组卷。学科专家具有的更多的是学科本身的知识,通常缺乏心理与教育测量方面的知识来理解测验所要考察的心理属性,更缺乏相应测量技术和方法来验证测验题目的质量。,呼唤教育测量与评价的专业化,量的随意:测量理论与技术的落后导致命题不专业,经验主义2009 年11 月6 日8 日,“课程评价改革国际研讨会”:着重探讨了“高考、中考专业化的体制与机制;学生学业质量监测;考试命题与测验编制;旨在改进的课堂教学评价;发展性课堂学习
13、评价”等我国当前测评研究与实践中面临的重要议题。,当前评价中存在的一些突出问题,1过分强调评价的甄别与选拔功能,忽视改进与激励的功能2.过分关注结果而忽视过程,不利于发挥评价促进发展的功能3.评价内容过于注重学业成绩,忽视学生的全面发展,有些评价内容存在偏颇之处。4、评价方式单一5、忽视学生的参与:成人霸权式的评定6、标准单一,城市小学和乡村初中“经常”或“总是”在全班公布考试成绩的比例在60%左右,城市初中学生的这一比例已达75%。,经常公布考试成绩和排名次的百分比,对考试结果的处理,对于公布考试结果和依据考试结果排名次的做法,70%的初中和小学生感到紧张、或害怕或讨厌。,学生对公布成绩、排
14、名次的感受(%),校长、教师认为学生身上体现得较好的目标,19961998年的调查,对全国9个省市城镇和农村的16000名学生,2000名校长、教师和全国政协、教科文卫委大部分委员,对1993年的九年义务教育课程实施状况进行了问卷、访谈调查。,校长与教师认为教材中体现得较好的目标(%),教育教学评价应关注的内容,教育教学评价要关注:1、学生的民主法制精神和社会责任感;2、初步的创新精神、科学精神、人文素养、实践能力、合作精神和环境意识;3、适应终身学习的基础知识、基本技能和科学方法;4、良好的身体和心理素质;5、高尚的审美情趣和积极健康的生活方式等。学会做人、学会做事、学会合作、学会学习已成为
15、对一个公民的基本要求。,二、要有合理的评价理念,PISA的启示评价:应该为了什么而评价?应该由谁来评价?应该评价什么?应该怎样评价?,评价的三个前提(雷斯纳克),你测你所追求的东西评价理念;你没有评价的你就得不到以评价促进学生学习;评价的内容要值得教师去教所评价的内容对于教学改进和学生发展具有重要意义。,评价的一般过程,根据一定的评价目标和评价内容,运用一定的方法,收集与评价相关的数据和资料,并对此进行分析和判断。相应地,需要关注以下问题:评价目标;评价标准;评价方法与评价工具;评价资料的分析和处理;评价结果的反馈与运用,评价的旨归:为了发展,而非甄别,发展是一个动态的过程。发展性评价即对发展
16、的动态过程的评价。发展性评价:重结果,更重过程。如:数学课程标准指出:1、评价的目的是为了全面了解学生的学习历程,激励学生的学习和改进教师的教学;2、应建立评价目标多元、评价方法多样的评价体系;3、要关注学生学习的结果,更要关注他们学习的过程;4、要关注学生学习的水平,更要关注他们在数学活动中所表现出来的情感与态度,帮助学生认识自我,建立自信。,好的评价:三维一体的整合性观照,好的教学:传道、授业、解惑好的评价也应该是三者融合的整体关注。好的试题应该体现了三个目标维度的观照!知识与技能,方法与过程,情感、态度和价值观等三个方面是三位一体的,我们不应将其肢解为三类目标。,PISA经典试题,(一)
17、阅读能力测试题蜜蜂靠蜂蜜生活,蜂蜜是蜜蜂的基本食物。如果一个蜂房有6000只蜜蜂,则将有三分之一的蜜蜂负责采蜜。一小部分蜜蜂将担负侦察兵的角色,它们探察花蜜源并将其告诉其他工蜂。这些侦察兵靠跳舞告诉其他蜜蜂花蜜源的方向和距离。跳舞时它们抖动身体并跳“8”字型的舞,如图所示(略)。它们在蜂房中在与蜂巢垂直的平面上跳舞。如果数字8的中间部分是直的,则蜜蜂只要朝着太阳飞去就能找到食物。如果数字8的中间向右,则食物在太阳的右边。食物距蜂房的距离由蜜蜂抖动腹部的时间指示,如果食物很近,则蜜蜂只抖动很短的时间;如果食物很远,则蜜蜂抖动的时间就长。当工蜂将花蜜带回蜂房后,蜂房内的工蜂将将花蜜在蜂房内搬动,暴
18、露在蜂房内干燥温暖的空气中。开始花蜜除了含有糖分和矿物质,还含有80%的水分。10-20分钟后,大部分多余的水分被蒸发了,工蜂将其放在蜂巢中继续蒸发。三天后,蜂蜜大概含水20%。这时,工蜂用蜂蜡将蜂巢密封。问题1:蜜蜂跳舞的目的是什么?()A、庆祝成功生产了蜂蜜 B、指示“侦察兵”发现的植物的类型;C、庆祝蜂王的诞生 D、指示所发现的食物的地点问题2:花蜜和蜂蜜的区别是在()A、水的比例 B、糖对矿物质的比例 C、采集的植物 D、负责生产的蜜蜂问题3:在跳舞时蜜蜂怎样指示食物距蜂房的距离?()问题4:写出三种花蜜源。,PISA经典试题,(二)科学能力测试题一本书给出了巧克力的营养价值,每100
19、克巧克力营养成分含量如下:根据右表,100G巧克力含32脂肪,提供2142KJ能量,营养学家说:“脂肪为生命提供能量。”如果一个人吃了100克巧克力,那么2142KJ能量都是由32G脂肪提供的吗?应用上表的数据解释。假设杰西吃的巧克力的营养成分符合上表,营养学家说杰西没摄入足够的维生素,其中缺乏的一种维生素是维生素C。她可以通过日常的饮食补充维生素C。下面有四种食品:1、鱼;2、水果;3、米饭;4、蔬菜你将为杰西推荐哪两种食品以补充体内的维生素C()?A、1、2;B、1、3;C1、4;D、2、3 E、2、4;F、3、4,PISA经典试题,(三)数学能力测试题一只海豹即使睡觉的时候也要呼吸。马丁
20、对海豹观察了一个小时。开始时,海豹沉到海底睡觉。8分钟后,慢慢浮出水面开始呼吸。3分钟后,它又回到海底,整个过程从开始到结束都非常有规律。一小时后,海豹()A、在海底 B、在上浮的过程中 C、在呼吸 D、在下沉的过程中,PISA的启示,PISA 测试义务教育阶段结束后15岁学生在阅读、数学和科学方面所具备的应用知识、技能和解决问题的能力。PISA 除认知测验外,还包括了问卷调查,目的是收集有关社会、文化、经济和教育因素的指标,这些指标与学生的成就相联系,从个体学习者、教学、学校及教育体制四个层面进行分析。,PISA的启示,PISA不基于学校课程,不是评价学生掌握学校课程内容的程度,而是评价学生
21、能否应用学到的知识和技能解决现实生活中遇到的实际问题。PISA 把这种应用能力称为素养。PISA 阅读测评中,非文学性内容占了70%左右,考查的不是语文学科的阅读能力,而是涉及其他多个学科领域的阅读,把阅读作为生活、工作和学习新知识的工具,体现了大阅读的观念。,PISA的启示,为了全面测评与现实生活相关的阅读能力,PISA 阅读框架覆盖各种不同目的的阅读内容,包括:为个人使用而阅读(个人的):例如小说、传记,占测试内容的30%;为公共的目的而阅读:例如官方文件、公告,占测试内容的30%;为工作的目的而阅读:例如说明书,时间表,招工广告等,占测试内容的15%;为教育的目的而阅读:为了学习新知识而
22、阅读,例如其他学科的教材,占测试内容的25%。,一种新的评价范式:关注全人的评价,新的评价标准意味着一种新的评价理念和教育追求好的评价建基于对学生的尊重和了解。关注学生个性化、多元化的发展必然要求多元化的评价标准和评价手段。需要有专业化的资料收集、处理与解释。评价结果的表述也是需要专业智慧。,三、要有与理念一致的评价技术,评价是一种复杂的、跨学科的专业技术!(一)探索建立适合我国国情的教育评价模式。建立完整的从命题、分析到反馈的教育评价理论与实践操作体系,通过严谨的抽样和教育成效测量,使各级教育行政部门了解本地区教育教学发展的状况,从而制定出相应的措施,同时监测教育目标的实现情况。利用现代教育
23、测量理论,可以在小样本、大覆盖、成本低、学生焦虑少、学校负担轻的教育评价模式下探索建立学校校内自主评价和地区统考成绩校准参照系。(二)关注影响学生成绩的因素。PISA 十分关注学生与学校的背景,更加关注学校和教育政策在提升学生发展方面的作用。从教育公平与均衡发展的角度出发,PISA 提供了学生成绩差异的社会经济根源及教育资源投入效益预测等更深层次的分析报告。(三)开展追踪研究促进教育质量提高。教育质量评价所关注的问题不仅仅是教育质量已经达到的水平,而且还应该关注教育质量趋势发展走向,需要什么样的政策调整。,ACT 大规模考试的题目设计和测验开发,题目设计和测验编制是一个非常复杂的、多周期的过程
24、,是一种艺术与科学相结合的过程。命题专家的创造性和经验体现在题目设计中,而测量学的理论和技术则从科学上保证题目的质量。在ACT 的大规模考试中,一道题目从设计伊始到最终进入考试试卷,需要经历至少16 道程序的检测,历时2 到3 年。这其中既有包括学科专家、测量学专家在内的题目评审小组的审核,也有基于预测数据的测量学分析。题目质量的评审涉及到内容、认知、题型、反应时间、公平性以及常见的难度和区分度等测量学指标。,试题库建设的理论与技术,美国著名测量公司CTB/McGraw Hill 首席研究专家,前国际心理测量学会主席Wim Vander Linden:国际上有关题库建设的理论和技术的最新进展;
25、根据题库进行自动化组卷的基本原理与具体技术。随着计算机技术的不断普及以及现代测量理论的迅猛发展,构建大型的教育测量和考试的题库已成为可能。例如,他所在的CTB/McGraw Hill 目前已经开发了一个容纳有70000 个题目的大型题库,包括了美国中小学阶段的各个学科的内容。,大型题库:自动化组卷技术的物质前提,大型题库的存在是自动化组卷技术的物质前提。自动化组卷可以在几秒之内完成几十、甚至几百套试卷的组卷任务,并能严格保证每套试卷满足多达上百种的技术要求,或者保证不同试卷间的一致性,为我国大规模考试提供了很好的借鉴。目前,国际上所提倡的连续性评价的做法就是建立在计算机化的题库建设和自动化组卷
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学生 评价 需要 专业化
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5959695.html