百道网
 您现在的位置:Fun书 > 促进教学的测验与评价 大夏书系
促进教学的测验与评价 大夏书系


促进教学的测验与评价 大夏书系

作  者:赵德成

出 版 社:华东师范大学出版社

丛 书:大夏书系·教师专业发展

出版时间:2016年07月

定  价:36.00

I S B N :9787567550261

所属分类: 教育学习  >  教育学    

标  签:教育理论/教师用书  课堂教学/课堂管理  中小学教辅  

[查看微博评论]

分享到:

TOP好评推荐   [展开]

TOP内容简介

测验与评价是教学的有机组成部分。在我国,无论是师范生培养,还是教师职后发展,都没有对教育评价培训给以足够的重视,导致不少教师对评价的理解失之偏颇,测验与评价技能有很大缺失。教师既要精通教学,又要钻研评价,“用两条腿走路”,才能真正成为专家型教师。

《促进教学的测验与评价》用通俗易懂的语言,结合生动具体的案例,阐释了测验与评价的基本原理,详解了测验与评价设计的各种技能,可以使教师们掌握各种常用评价工具和方式,对评价实践进行批判性反思与针对性改进,从而大幅提升评价及教学的有效性。

TOP作者简介

赵德成,北京师范大学教育学部副教授、博士生导师,2015年被评为中国人文社科具影响力青年学者。主要研究领域为教育测量与评价、学校评估、影响力评估等。近年来主持教育部、北京市教科规划办、北京市教育学会等单位委托课题多项,在SSCI及CSSCI期刊上发表中英文学术论文40余篇,出版及合作出版著作5部。

TOP目录

推荐序(李希贵) 1

自 序 3

第1章 走近测验与评价 1

教学离不开测验与评价。教师只有在教学中不断通过测验与评价分析学情,诊断学生达成预期目标的程度,才能使教学更有针对性和吸引力,更能有效地促进学生发展。

概 览 2

初步认识教育评价 3

几种经典的教育评价模式 9

教学中的测验与评价 16

为什么重视测验与评价 25

参考文献 30

 

第2章 如何设计测验与评价 33

测验与评价需要精心设计。教师只有以严谨的态度设计或选编测验,确保测验的准确性和有效性,测验才能为教学提供有价值的信息。

概 览 34

明确测验与评价的目的 35

编制测验细目表 38

选择评价任务类型 48

设计评价任务 56

汇编测验 63

参考文献 66

 

第3章 什么样的评价是好的评价 69

好的测验与评价首先要确保其效度,要能测到所欲测的目标学习成果,能依据所收集的信息做出准确而有效的推论。此外,好的评价还需在信度、难度、区分度、公平等方面符合测量学要求。

概 览 70

效 度 71

信 度 81

难度和区分度 90

公 平 95

参考文献 98

 

第4章 表现性评价 99

表现性评价克服了传统测验仅能测试低水平知识和孤立技能的弊端,能测量出学生在真实世界中的复杂成就和情意表现。加强表现性评价的应用,是当前我国中高考命题改革的基本方向,也是世界范围内教育评价学科发展的共同趋势。

概 览 100

什么是表现性评价 101

表现性评价的历史性分析 104

好的表现性评价案例 107

表现性评价的优势与不足 112

我国表现性评价实践中的常见问题分析 114

未来进一步推进表现性评价的建议 125

参考文献 129

 

第5章 成长记录袋 131

成长记录袋是一种新兴的质性评价方式。这种评价方式将评价与教学有机整合起来,能有效考查学生在真实、复杂情境中自主思考、积极建构、分析问题和解决问题的能力。

概 览 132

成长记录袋的定义及特点 133

成长记录袋的优势与不足 135

成长记录袋的创建与使用 140

案例:阅读成长记录袋的创建与使用 145

实践中应用成长记录袋的主要问题 153

成长记录袋的未来发展方向 156

参考文献 160

 

第6章 情意领域的评价 163

新课程实施以来,情感态度与价值观的发展成为课程目标的重要组成部分,它涉及学习情感、对学科的态度、对自我的态度,以及价值观等关键变量。教师要掌握观察、访谈、里克特量表等多种常用评价方法。

概 览 164

情意领域的目标 165

情意评价的重要意义 172

常用的情意评价方法 175

学习情感评价:一个实例分析 183

情意评价的改进建议 188

参考文献 190

 

第7章 评价结果报告 191

在发展性评价理念指导下,评价结果报告方式也要推陈出新,与时俱进。好的结果报告要采用定量评价与定性分析相结合的方式,向阅读者描绘学生学习与发展的主要轮廓与关键细节。

概 览 192

学业成绩评定 193

评语写作 200

评价报告单 212

家长会 218

参考文献 224

TOP书摘

编制测验细目表

无论教师出于何种目的使用测验与评价,最后都要基于学生在测验中的表现来对学生的学习和发展做出推论,所以每一个测验都必须保证能测到自己想测的东西,题目能代表预测的范围,要确保测验的内容效度(内容效度是一个专业术语,第3章会对它进行专门讨论)。在教学中使用测验与评价,特别是带有达标验收性质的终结性评价,如单元测验、期末测验以及教育质量监测,一般要根据课程标准和教学目标编制测验细目表。

课程标准

课程标准是确定一定学段的课程水平及课程结构的纲领性文件,[1](280)是教材编写、教学、评价与考试命题的依据。2001年,国家基础教育课程改革将我国沿用已久的教学大纲改为课程标准,加强了课程管理的规范性。随着课改的逐步推进与深入,18个学科课程标准已于2011年由实验稿修订为正式版本,课程标准走进每一个教师的工作。

以义务教育语文课程标准(2011年版)为例,[2](5)它采用9年一贯制整体设计,在“总目标”之下按1~2年级、3~4年级、5~6年级和7~9年级四个学段,分别提出“学段目标与内容”,体现了语文课程的整体性与阶段性。而各学段则从“识字与写字”、“阅读”、“写作(写话、习作)”、“口语交际”和“综合性学习”等五个领域提出本学段应达成的基本要求。第一学段(1~2年级)“阅读”领域的目标是这样描述的。[2](6)

(二)阅读

1.喜欢阅读,感受阅读的乐趣。养成爱护图书的习惯。

2.学习用普通话正确、流利、有感情地朗读课文。学习默读。

3.结合上下文和生活实际了解课文中词句的意思,在阅读中积累词语。借助读物中的图画阅读。

4.阅读浅近的童话、寓言、故事,向往美好的情境,关心自然和生命,对感兴趣的人物和事件有自己的感受和想法,并乐于与人交流。

5.朗诵儿歌、儿童诗和浅近的古诗,展开想象,获得初步的情感体验,感受语言的优美。

6.认识课文中出现的常用标点符号。在阅读中体会句号、问号、感叹号所表达的不同语气。

7.积累自己喜欢的成语和格言警句。背诵优秀诗文50篇(段)。课外阅读总量不少于5万字。

每个学科都在课程标准中明确列举了各学段应达成的基本要求,不仅有结果性目标,而且有体验性目标。教师要认真阅读所任教学科的课程标准,并经常参照课程标准评价反思自己的教学,确保所教学生能达成标准。

教学目标

课程标准在学段水平上界定学习要求,相对而言比较概括,教师在实践中还需要结合所使用的教材进一步明晰教学目标,要“以一种较特定的方式描述在单元或学程完成之后,学生应该能做(或生产)什么,或者学生应该具备哪些特征”。[3](17)教学目标的表述必须操作化。只有将目标转化成明确的操作性定义,才能从目标着手,否则只能留下美好的希望或只是一些陈词滥调而已。

在表述教学目标时,很多教师经常使用一些语义模糊的语句。布卢姆曾举例如下:[3](31)

1.学生具有……的知识。

2.学生领会……

3.学生批判性地思考有关……

4.学生理解……

5.学生对……表示欣赏。

6.学生对……感兴趣。

7.学生完全欣赏……

8.学生掌握了……的意义。

9.学生能够记忆……

10.学生学会……

11.学生重视……

12.学生开阔了眼界。

13.学生有效地工作。

14.学生有效地讲话。

15.学生正确地讲话。

16.学生顺利地阅读。

17.学生会使用基本技能。

这里,前12项目标表述中所使用的术语都是难以直接测评的,人们看不到“理解”和“记忆”,也触摸不到“批判性思考”。而后面5项目标似乎可以观察,但它们的表述却容易引发歧义。有效、正确与顺利的标准究竟是怎样的,每个人的理解可能差异很大,甚至人们对“基本技能”是什么也会有不同的看法。要充分发挥教学目标的导向作用,其表述需要字斟句酌,深入研究。

布卢姆是教育目标分类学研究的权威专家。他和同事于1956年将教学活动所要实现的整体目标分为认知、情意、动作技能三大领域,并从实现各个领域的最终目标出发,确定了一系列目标序列。当然,将目标分为三个领域并不意味着不同领域之间是完全独立的。比如,当一个学生讲话的时候,可能同时涉及了三个领域。如果教师关心的是语言组织的内容,他强调的是认知目标;如果教师关心的是透过语言所反映出来的兴趣和情感,那他强调的是情意目标;如果教师关心的是学生的表现形式(姿态、动作),那他涉及的是动作技能目标。因此,如果让教师在每个单元甚至每节课的教学计划中都将三方面目标分开表述,存在一定困难,教师可以侧重于最主要的一个目标领域来表述。

认知发展长期以来都是教学的重要目标,所以布卢姆等人对认知领域的教学目标进行了更为细致的描述和例释,将其分为识记、理解、运用、分析、综合和评价六个层次。[4](390-412)这一目标分类体系自发表以来,在美国乃至全世界产生了巨大的影响。为了更好地回应教育改革的需求,更加有效地指导教学与评价实践,这一分类体系也在不断地修订。最近一次大型修订是由安德森(Anderson L.)领衔的一个团队于2001年完成的。

与布卢姆等人原来的一维度分类不同,新修订的教育目标分类学采用了“知识”和“认知过程”二维框架。[5](21)知识指学习时涉及的相关内容,包括从具体到抽象的四种类型:事实性知识、概念性知识、程序性知识和元认知知识。认知过程的分类与旧体系差别不大,从低到高分成六个水平,即记忆、理解、应用、分析、评价和创造。表2-2是新版认知目标分类框架,这种新的定义方法使教学目标更加清晰,更便于教学和评价。

表2-2 新版认知目标分类框架

知识维度

认知过程维度

记忆

理解

应用

分析

评价

创造

事实性知识

概念性知识

程序性知识

元认知知识

安德森等人还对两个维度的目标做进一步的分解,使之更加操作化。以认知过程维度下“理解”为例,他们将理解又分为解释、举例、分类、总结、推断、比较和说明七种情况,每种情况都提供了同义词、定义及例子,[5](51)参见表2-3。

表2-3 新版认知目标分类学解释目标说明

认知过程

同义词

定义及其例子

2 理解(Understand):从口头、书面和图像等交流形式的教学信息中构建意义

2.1 解释

(Interpreting)

澄清(Clarifying)

释义(Paraphrasing)

描述(Representing)

翻译(Translating)

将信息从一种表示形式(如数字)转变成另一种表示形式(如文字)(例如,阐释重要的演讲和文档)

2.2 举例

(Exemplifying)

示例(Illustrating)

例示(Instantiating)

找到具体的例子解释概念或说明原理(例如,列举各种绘画艺术风格的例子)

2.3 分类

(Classifying)

分类(Categorizing)

归类(Subsuming)

确定某事物(如概念)属于同一个类别(例如,将观察到的或描述过的精神病案例分类)

2.4 总结

(Summarizing)

概括(Abstracting)

归纳(Generalizing)

概括一般的主题或要点(如简短总结录像带中描述的事件)

2.5 推断

Inferring

断定(Concluding)

外推(Extrapolating)

内推(Interpolating)

预测(Predicting)

从呈现的信息中推断出合乎逻辑的结论(例如,学习外语时从例子中推断语法规则)

2.6 比较

(Comparing)

对比(Contrasting)

对应(Mapping)

配对(Matching)

发现两种观点、对象或其他类似物之间的一致性(例如将历史事件与当代情形进行比较)

2.7 说明

(Explaining)

建模(Constructing models)

建构一个系统的因果关系(例如说明法国18世纪某重要事件的原因)

以教育目标分类学为指导,无论是单元水平的教学目标,还是一节课或相互联系的几课时的教学目标,教师的表述都要清晰具体。目标表述越SMART,即Specific(具体),Measurable(可测量),Attainable(可达成),Realistic(现实的),Time-bounded(有时间限定),它就越能为教学和评价设计提供有价值的参考。

以人民教育出版社8年级下册语文《藤野先生》一课的教学为例,某老师在第1课时已带领学生阅读全文,学生们知道这篇散文表达了作者对藤野先生的感激之情。在第2课时备课中,她提出教学目标:感悟写人叙事散文中表达感情的方法。这样的目标表述不够具体和难以测量,如果修改如下:

至第2课时教学结束时,学生应该能够:找出《藤野先生》一课作者表达感情的方法,写出方法名称并标记出典型段落;从已学散文中找出运用上述方法的典型文章和段落。

这样的表述就基本达到SMART水平。学生要达到的知识目标是“写人叙事散文中表达感情的常用方法”,属于学科技能类的程序性知识;在认知过程上,学生不仅要在《藤野先生》一文中找出使用某种特定表达方法的典型段落,而且要从已学散文中找出典型文章和段落,要举例说明,属于“理解”(Understand)中的“举例” (Exemplifying)。有这样的目标,教师不仅知道教学的努力方向,而且知道如何评价自身教学的有效性。

测验细目表

很多时候,教学目标既多样又复杂,涵盖很多知识和认知过程。一个测验不可能评价所有的内容。测验通常抽取一个有代表性的题目样本,用它代表整个评价范围,然后基于学生在测验题目上的表现,推论学生达成预期目标的程度。为了保证题目样本的代表性,编制测验细目表用以指导题目设计就显得十分重要。

双向细目表是比较常用的一种细目表,它从两个维度上绘制测验蓝图。其主要步骤是:(1)列出教学内容要点。将整个教学内容划分成多少个内容要点。这带有一定的主观性。一般来说,内容要点要足够详细,以保证对每一块内容的充分取样。(2)列出教学目标清单。教学目标代表了学生经过学习后应达成的学习结果,一般采用布卢姆等人提出的认知目标分类体系或安德森等人修订后的新体系予以分类和表述。(3)填写双向细目表。确定测验题目的构成,通过内容和目标两个维度的双向列联表予以表示,就构成了一份双向细目表,成为命题的蓝图。表2-4列举了国外某中学地理课天气单元的双向细目表。[6](67)这个表说明了天气单元测验题目的总数及内部构成。

表2-4 国外某中学地理课天气单元测验的双向细目表

目标

内容

知道

理解

解释

题目

总数

题目

比例

(%)

基本

术语

天气

符号

具体

事实

影响天气形成的因素

气象图

气压

1

1

1

3

3

9

15

1

1

1

10

2

15

25

温度

1

1

1

4

2

9

15

湿度和降水量

1

1

1

7

5

15

25

2

2

2

6

12

20

题目总数

6

6

6

30

12

60

题目百分比(%)

10

10

10

50

20

100

随着教育问责制度的兴起与发展,教育质量测评、监控和分析受到越来越多的关注,细目表的制作也越来越细致,有些测评项目开始使用多向细目表。表2-5呈现的是2009年PISA项目[1]阅读测试所使用的多向细目表。[7](187)对这个命题细目表做进一步分析会发现很多有价值的信息。比如,PISA2009阅读测试题中,学生需要阅读的文本有多种类型,除连续文本之外,非连续文本、混合文本和多重文本涉及的题目有50个,占总题量的38%;又如,PISA2009阅读试题中答案不确定、具有开放性的题目有56个,占总题量的42.7%。

表2-5 PISA2009阅读测试命题多向细目表

题目

数量

单选

题数量

多选题

数量

封闭式

问答题

开放式

问答题

简答题

不同类型文本的阅读题分布

连续文本

81

36

6

4

31

4

非连续文本

38

10

3

7

12

6

混合文本

7

4

1

0

1

1

多重文本

5

0

2

2

1

0

小计

131

50

12

13

45

11

不同任务类型的阅读题分布

访问与检索

31

6

3

9

3

10

整合与解释

67

38

6

4

18

1

反思与评价

33

8

1

0

24

0

小计

131

52

10

13

45

11

不同应用情境的阅读题分布

个人生活

37

10

2

5

17

3

公共生活

35

19

2

2

10

2

职业生活

21

4

3

3

10

1

教育生活

38

19

3

3

8

5

小计

131

52

10

13

45

11

当然,需要指出的是,细目表并不是越细致越好。有时候,一些小型测验,特别是教师自编测验,不需要耗费那么多精力,只需使用简单的单向归类系统即可。比如,在阅读测验中,只要列举出一系列的阅读技能以及每一种技能上的题目数量(参见表2-6),[6](70)就可以很好地规划和设计测验了。

表2-6 阅读测验单向归类系统

阅读技能

题目数

识别文章中的细节

10

概括文章的中心思想

10

判断文章中时间出现的先后顺序

10

辨别文章中多个表述之间的关系

10

对文章内容进行推论

10

总 数

50

不难发现,测验细目表明确了评价内容及其构成,使试题分布合理,覆盖面广,体现重点,是规范命题、确保评价效度的重要手段。有合理、清晰的测验细目表,可以有效克服教师命题随意、试题取样不当、题型单调、覆盖面窄或失之偏颇等弊病。[8]

但需要指出的是,在我国,细目表在测验与评价实践中尚未受到足够的重视,很多教师在自编测验中往往是凭经验编制试卷,甚至随意挑选题目组编试卷,缺乏规范性。即便在一些大规模、关键性考试中,有些机构和教师应用了测验细目表,但也存在一些亟待关注的问题,主要问题如下。

首先,细目表不够细。大型考试一般内容覆盖范围比较广,所以需要对评价内容进行全面、细致的梳理,但有些考试对测验内容的分析过于简单。比如,某份高考政治卷命题的双向细目表中,知识维度仅列举了3个领域,分别是“经济常识”、“哲学常识”及“政治常识”,各领域内部究竟有哪些内容要点,哪些要点是重点,细目表没有细致分析。

其次,对教学目标的分析不够深入。有些考试在细目表中只涉及内容和题型两个维度。不同题型适用于不同能力目标的考查,究竟这份试卷考查了学生的哪些能力表现?哪种能力最重要?某道特定的题目考查了学生的什么能力?这些原本是测验编制者需要清楚回答的问题,但当被询问时,却没有确定、清晰的答案。

第三,不能体现学科特点。很多机构和教师在编制测验细目表时参考布卢姆等人或安德森等人的认知目标分类学体系,结构清晰,但对学科特点的分析和回应不够。测验编制者不能简单照搬目标分类学体系,需要根据学科特点进行调整和改进。比如,物理学科是一门注重实验的自然科学基础课程,所以物理课程“应注意学生经历实验探究过程,学科科学知识和科学探究方法,提高分析问题及解决问题的能力”,[9](2)那么在物理学科测验的细目表中就需要强调程序性知识、探究能力和科学精神等。又如,英语学科是一门工具性学科,“英语课程承担着培养学生基本英语素养和发展学生思维能力的任务,即学生通过英语课程掌握基本的英语语言知识,发展基本的英语听、说、读、写技能,初步形成用英语与他人交流的能力”,[10](2)那么英语学科测验在细目表中需要将“应用”做进一步的分解,使之体现英语学科特点。

第四,对当前评价与考试改革的趋势呼应不够。随着课程改革的持续推进,学生实践能力、结合实践分析与解决问题的能力成为考试评价的重点。比如,北京市高考文综命题“注重考查学生运用所学的基础知识、基本原理、基本观点和基本方法从不同角度发现问题、分析问题和解决问题的能力,重视发展学生参与社会生活的能力”;[11]又如北京市高考理科综合命题要求“从学生已有的经验和将要经历的社会生活实际出发,通过生产、生活中的一些真实情境和实验观察、自然体验,考查学生联系实际深化、应用知识的策略和学科素养”。[11]这一改革趋势与国际学生学业成就评价理念基本一致。那么,测验细目表的编制可以参考PISA项目经验增设“应用情境”维度,以强有力地引导命题者关注实践,并使各种应用情境都得到相应的关照。

细目表是测验与评价设计的重要依据,无论是大规模、高利害的关键考试,还是教师在日常教学活动中的自编测验,都需要编制测验细目表,使测验能准确、有效地评价学生在学习中的成就与不足。 

 

TOP插图

插图

插图

插图

插图

TOP 其它信息

装  帧:平装

页  数:240

开  本:16开

纸  张:胶版纸

加载页面用时:79.5861