英语考试质量分析【热选5篇】

由网友分享时间：2024-08-24 16:55:32

【阅读指引】阿拉题库网友为您分享整理的“英语考试质量分析【热选5篇】”范文资料，以供您参考学习之用，希望这篇文档对您有所帮助，喜欢就下载分享给大家吧！

英语考试质量分析范文【第一篇】

一、试卷的基本情况分析

本次初一期中考试英语试卷主要考查七年级Starter Unit1-- Unit4单元的教学目标及部分新目标课本后半部分的内容。注重考查英语基础知识和基本技能，又强调学生在实际中运用英语的能力，所涉及的知识点的面比较广，题目设计比较灵活，涉及词汇超前。试卷组成和中考题型一样分两大部分：听力部分和笔试部分，共七大题型，总分120分，考试时间为120分钟。笔试部分中的各题型不仅考查学生的课本词汇和句型的相关知识，同时也考查学生语言运用能力。其中阅读理解A篇题型新颖，是一个促销广告，另两篇是两个故事，在我看来难度较大，对学生词汇量要求高，注重全篇理解能力。完形填空有3道题考查角度比较细致，成为学生的易错题。首字母填词也有2-3个难点，另外重点考查了学生对于名词单复数的掌握，有三个答案都需要采用复数形式。

本次试卷命题有以下几个导向：

1.七年级英语课堂教学中应重视基础知识的积累和听、说、读、写技能的训练；

2.要注重培养学生的综合语言运用能力；

3.课堂教学中要面向全体学生，基础内容反复练习，单独辅导，减少两极分化。

二、本次考试成绩情况：

全年级最高分111,七2班最高分110。班级100分以上4人，90分以上8人，80分以上4人，72分以上2人，不及格12人。平均分为,我校的均分为。听力均分，单选均分，完型均分，阅读均分，阅读理解填词均分，首字母填词均分，作文均分。

七3班最高分111。班级100分以上4人，90分以上4人，80分以上3人，72分以上3人，不及格15人。平均分为,我校的均分为。听力均分，单选均分，完型均分，阅读均分，阅读理解填词均分，首字母填词均分，作文均分。

三、存在问题及原因分析

1、听力部分难度不大，但总体得分不高，主要是平时每周练习2次，练习次数还是相对较少，并且有时未仔细讲解易错部分，听力技巧讲授较少。导致有学生在做题时未提前读题，或是题目理解错误，或是听的时候只听单独的关键词，未理解全对话的含义。在后期教学过程中，重视每一次午间听力练习，听完就重点题目仔细讲解并重听。同时在授课过程中重视听力部分的练习和听力技巧的下放。

2、单选题其实难度不大，考了3题音标读音，大部分题目都是考查的词汇的基本含义和用法。但学生错题较多，体现出平时对于词汇的记忆和基本用法的掌握还存在很大知识漏洞。讲过的知识点也未完全掌握，例如a set of是单数，依然有很多学生做错。同时部分学生平时只是机械地去记忆单词，不会在语境中运用所记的词汇。在后期教学过程中要更加重视词汇的记忆，拓展词汇相关知识点，加强对学生笔记记忆的落实监督，同时准备相关词汇练习题，加强题目操练。

3、完型填空难度不大，但学生失分较多，阅读理解文章生词较多，有些句子结构也很复杂，问题设计也很灵活，有一定的难度，但学生做题情况还可以。反思平时的教学，对于阅读的练习和讲解较多，因为10月月考完型难度小，学生做的情况较好，所以在本阶段忽视了完型和训练和讲解。在后期教学过程中一方面要加强各题型的训练，减少短板，另一方面平时拓展词汇，注重学生词汇的积累，增加阅读素材的多样性。例如本次阅读A篇就是一个促销广告。

四、今后英语教学建议

1、英语教学应该立足于基本知识和基本技能，平时应注意学生基本知识的灵活应用能力的培养。

英语考试质量分析范文【第二篇】

第一题完全属于送分题，10个字母的大小写，90%的学生都写得不错，极少数同学因粗心丢分。

这次考试考的前三单元的内容，方位介词，生日，数字。第二大题是考察词汇量的，这个题做得不好。反映出孩子们整个词汇储备很匮乏。

本试卷中丢分最多的是第九题，很多同学都不能做对，这也反映了一个问题，平时情景对话较多，翻译练习较少。只让他们背了，却没有及时去监督，去检查。真的很自责。

选词填空也出现错误，原因是他们不能较准确的用英文表达答案，英也充分说明了他们英文逻辑思维的不完整，甚至是没有建立英文阅读思维，基础太薄弱。

1、创造有利于学生学习英语的环境和氛围。学习英语除了学生自己要经常练习外，还应有良好的环境和氛围，多给学生创造一些无意识记忆和学习的环

2、对于基础知识的掌握(26个字母的书写；常用单词以及日常交际用语的掌握；常见的读音规则等)，教师要加大关注力度。

3、教师要注意自己角色的转变。教师通过各种生动活泼的活动进行课堂教学，根据低年级学生模仿力强、求知欲强、表现欲强的心理特点，教学中应采用多种教学手段，通过听，做，说，唱，玩，演等方式吸引学生积极参与到教学活动中，使学生在活动过程中接受英语语言的熏陶。

4、教师应建立新型的学习策略

(1)准确把握英语课程标准的理念、目标和内容，运用教育学和心理学理论，研究语言教学的规律。根据学生的心理特征和实际情况，选择和调整英语教学策略。

(2)发展课堂教学的调控和组织能力，灵活运用各种教学技巧和方法。

英语考试质量分析【第三篇】

关键词英语专业四级考试反拨作用基础英语教学

中图分类号：G424 文献标识码：A

Positive Washback Effect of TEM4 to Basic English Teaching

WANG Lifeng

（Zhongnan University of Economics and Law， Wuhan College， Wuhan， Hubei 430079）

Abstract Science language tests can provide accurate and objective description of the status quo of teaching; provide a lot of feedback for teaching， to improve teaching， improve teaching quality. TEM4 English teaching has an irreplaceable role in guiding. This paper explores the positive backwash effect of TEM4 to basic English teaching， made to correctly handle the relationship between exams and teaching， the use of positive backwash effect， promote and improve the quality of teaching basic English courses.

Key words TEM4; washback; basic English teaching

0 引言

语言测试对教学和学习所产生的作用被称作 “washback”，即“反拨作用”。正面的反拨作用是指考试对教学产生人们所希望达到的影响。英语专业四级考试是英语专业学生基础阶段的标准化和权威考试，对英语专业的教学有非常重要的作用。在过去20多年实践中，四级大纲经历了三次修订，旨在提高考试的科学性、命题的规范性、实施的合理性以及分数解释的公正性。使考试能更有效地测量考生的语言技能和知识水平，加强测试对教学的正面反拨作用（秦秀白 2012a）。基础英语课程是英语专业的核心课程，直接影响专四考试的结果。本文将探讨专四考试对基础英语课教学的正面反拨作用，达到改进基础英语课堂教学的目的。

1 积极的反拨作用

（1）改变教学模式。传统的教学模式中，教师控制课堂，学生只是被动地接受。基础英语课程是英语专业基础核心课程，其主要目的是培养和提高学生综合运用英语的能力。从实际教学情况来看，基础英语的教学应该是通过对语言的基础训练和篇章的讲解分析，使学生逐步扩大词汇量和熟悉英语常用句型，了解英语各种文体的表达方式和特点，提高语篇阅读理解能力，具备基本的口头与笔头表达能力。在传统的英语专业基础英语课程教学活动中，教师主要采用演示（presentation）-操练（practice）-成果（production）的3P教学法，授课的基本模式是教师先举例讲解词汇的意义和用法，然后解释课文中重点的短语、句子和语法现象，最后通过课后练习来巩固本课的相关语言点。学生在整个教学过程处于被动学习的地位，总是忙于抄写老师讲解的内容。最后导致的结果是，翻开笔记，什么都知道，关上笔记，什么都不记得。这就导致学生丧失了学习的主动性和积极性，也失去了提高综合运用英语能力的机会。而英语专业四级的考试结果也显示：学生的英语语言基本功不扎实，英语综合运用能力偏低。在这种情况下，我们要反思：传统的教学模式是否能真正使学生达到英语语言综合运用能力标准以及英语专业知识的要求？什么样的教学模式才能使扩招环境下英语水平参差不齐的英语专业学生达到英语专业教学大纲的要求？把语言教学真实化和课堂社会化的任务型教学法值得尝试。任务型教学法以意义为中心，不是以操练语言形式为目的。以学生为中心，根据任务完成情况来评估教学。这种教学模式适合英语专业基础英语教学，能激发学生学习英语的主动性和积极性，使学生在相互交流、观察和比较中不断调整学习方法，提高了学习效果。同时，学生的语言技能明显进步，叙事能力有较大的提高，而且课堂上用英语主动交流的愿望明显提高，语言质量也有明显好转（马平 2011）。

（2）促进教师提高教学质量。四级考试是监测教学效果的重要手段，对改进教学和提高教学质量具有不可替代的促进作用（秦秀白 2012b）。在多媒体和网络技术成为重要课堂教学辅助手段的今天，如果没有一定的考试压力，课堂极易出现娱乐化倾向。有的老师会忽视教学目标和教学内容，随意使用多媒体课件。虽然课堂上气氛活跃，但实际并未实施有效教学。多媒体可以辅助教师在课堂上实施有效教学，但不能代替教师的主导作用。教师组织设计课堂，是提高教学质量的关键。为了达到预期的考试结果，教师会努力钻研教材，认真备课上课，有针对性地对学生进行辅导。同时，专四考试的结果也是一种衡量教学质量的信息反馈，帮助教师改进教学方法，明确教学重点，提高教学质量。在基础英语课程的讲授中，教师要重视文章中所涉及的基本语言点，并对文章的背景文化进行讲解。这是帮学生打好语言基础的第一步，但基础英语这一英语本科专业重要课程教学并非止于此。语言的掌握在于实践的检验。实践所检验的不仅是形式，还有内容。有的学生语法知识掌握得相当好，但口语的内容和写作的表达都不尽如人意。大部分情况是因为教师更重视语言知识的操练而忽视了文章内容的挖掘。学生的理解能力得不到提升，表达能力自然有限。因此，教师要针对课程设置情况及各种文章的不同内容，寻找学生的关注焦点及欠缺点，有的放矢，理论与实践并重，以激发学生兴趣和给予学生考试压力等多种教学手段相结合，在课堂教学中，保证正常教学进度的同时，从多种角度挖掘文章主旨，启发学生思考，提高学生的辩证思维能力，并进一步挖掘语言背后所传达的文化内涵，使学生真正理解语言作为文化载体的作用，也使学生在文化学习中了解语言的发展，从而真正规避基础英语课程教学现有的诸多误区，真正使基础英语课程的教学改革落到实处，并最终真正提高课程的教学效率（张凤 2014）。专业四、八级考试中心每年都会反馈四、八级考试的分析报告，包括考试内容的分析，数据统计和抽样分析。很多测试专家和阅卷工作者会根据考试情况对教学改革提出具有指导意义的建议，有助于各个学校改进教学措施、提高教学质量。这对于基础英语课程的任课老师来说，是重要的信息来源。基础英语课程包含了最基本的听、说、读、写、译。专四和专八考试也正是围绕这几个要点进行考核的。根据实际情况来看，学生的听力能力，尤其是把听到的内容转化成文字的技能训练需要进一步加强。而很多学校所采用的基础英语教材是现已更新成第三版的梅德明主编的《新编英语教程》，在这个教材所配套的练习册中，有关于听写的训练，教师应该仔细分析练习册内容，有选择地要求学生进行练习。在这个教材的每一单元中，都有分项写作练习，教师可以在日常教学中使用类似于专四考试的作文的评分标准，使学生能有的放矢地进行写作训练，提高写作水平。写作是最能考核学生语言基础的考核方式。“当前学生在英语写作方面存在着审题问题，语言结构问题，思辨能力薄弱问题，中式英语问题，语言语法问题，滥用成语谚语和名人名言，套路化问题以及抄袭编造等八方面的问题”（颜静兰 2012）。其实存在这些问题的原因很多，其中有一部分就是任课教师造成的。有的教师的写作教学是速成式的，只要求学生背诵经典的文章结构，包括常用句子，最后导致了作文的雷同。这样的写作是没有意义的，只有真实地准确地表达学生的有深度的思想的作文才是有价值的。学生的写作能力也才能得到真正的提升。

（3）促进学生自主学习。从学生自身发展的需求来看，学习的最终目的并不是拿到专四考试的合格证书，而是实现学生自主学习能力的培养。专四考试为英语专业学生在基础阶段的学习设定了一个明确的目标，使学生端正学习态度，积极主动地学习英语。学生课堂学习时间有限，必须充分利用课余时间进行自主学习。在备考过程中，学生可根据自己的实际情况，按照专四大纲制定学习计划，摸索出适合自己的学习方法，培养自主学习能力。笔者通过对所任教班级的学生进行调查，发现专四考试对于学生的自主学习认识有很大的促进作用。在备考时，学生会制定学习计划，定期自查学习效果。学生会有意识地按照考试大纲要求，把课余时间分为几个板块，分别对听力、词汇、阅读和写作进行专项训练。在自我测试后，还会根据实际情况进行调整。由此可见，专四考试对学生的自主学习动机、自主学基础英语课程对专四考试的影响是最大的，因此，担任此课程教学任务的教师，可以利用专四考试的反拨作用，从语言学习目标和测试目标上对学生进行引导。给学生提供自主学习材料，培养学生的自主学习能力，督促学生在考试结束后能保持自主学习习惯。

2 结论

考试是外语教学过程中的一个重要组成部分，既能衡量教学成效，也能促进教学改革。但考试是为教学服务的，应始终坚持以教学为中心，考试为教学服务的原则，积极利用考试的正面反拨作用，促进外语的教与学。为了充分利用考试对教学的积极反拨作用，结合专业四级考试和基础英语课程的特点，笔者提出以下两点建议：

（1）明确语言学习目的。不能为了应付考试而打破常规教学，应在常规教学中有意识地给学生传授学习策略，使学生有扎实的语言基础及良好的自主学习能力。

（2）利用测试反馈来调整教学重点与策略。专四考试题目的设计是科学合理的，考生的模拟测试能反映出知识的掌握程度，教师可以根据测试结果帮学生查漏补缺。

参考文献

[1] 马平。任务型教学法与英语专业基础英语教学[J].外国语文，2011（4）.

[2] 秦秀白。充分利用四、八级考试的反拨效应，抑制教学质量滑坡[J].外语界，2012a（3）.

[3] 秦秀白。警惕课堂教学娱乐化[J].当代外语研究，2012b（7）.

[4] 孙秋月。专业四级考试与英语专业学生自主学习能力发展的相关性研究[J].河北科技师范学院学报（社会科学版），2011.

[5] 吴锋针。论英语专业四级考试对教学的反拨作用[J].黑龙江高教研究，2008（8）.

英语考试质量分析范文【第四篇】

[关键词]技术人员职称英语等级考试；效度；专门用途英语测试；阅读测试

一、引言

自1978年以来，随着国际合作与交流的日益频繁，中国政府对英语的教与学给予了越来越多的关注。全国专业技术人员职称英语等级考试（以下简称职称英语考试）是由国家人事部于1999年开始组织实施的一项部级英语考试。专业技术人员必须通过该考试才能获得其专业技术职务的晋升。对这样一项与职称挂钩的全国范围内的英语考试进行质量调查和分析，不仅对专业技术人员个人及单位具有重要意义。对社会也将产生广泛的影响。

二、理论基础

现有的职称英语考试共分三个专业类别：综合类、理工类和卫生类，每个专业类别的考试各分A、B、c三个等级。该考试重点考查应试者的阅读理解能力。因此，本文首先需要详细论述专门用途英语测试、阅读测试以及效度、信度等测试质量标准的有关文献资料，在此理论基础上对职称英语考试进行效度研究。

专门用途英语测试

与专门用途英语或专用英语（EnglishfDrSpecificPurposes：ESP）相对的是通用英语（EnglishforGeoeral;EGP），两者的区别纵乎在于目的不同——是“专用”还是“通用”。但事实上，用相对的概念来区分专用英语和通用英语必然会导致两者的界线不明。Hutchinson和waters（2002：53）明确指出，区分两者的不是目的的不同而是对目的的意识，也就是对学习者需求的意识（theawaremeasoftheneed）。其实，早在1980年Robinson就认为，对学习者需求的注意（attentiontotheneedsoftheleamer）肯定是。专用英语“定义中的一个关键要素。

这种对目的或需求的意识决定了专门用途英语测试考查的是应试者使用语言实现其专门目的的能力，即语言交际能力。很明显，应试者的需求不同，他（她）所应具备的交际能力也相应的不同，那么，专用英语测试的内容和方式也应有所不同——任何一次测试都应是为需求相同或基本相同的应试者专门设计的。测试的设计者的最初工作必须是对应试者的语言交际需求。或称目语真实使用情况（Targetlangungeuse）进行分祈和确定。然后测试内容（包括语域、语体、主题、语言技能等）、测试任务、评分标准的确定都应建立在需求分析的基础之上。测试的整个设计过程需要语言专家和专用英语使用领域的专家之间的密切合作。

阅读测试

阅读是一个过程，例如，Hedge（2002）将阅读过程描述为一个有目的的（purpossful）、阅读材料与读者的背景知识相互作用的（intemctive）、读者对阅读材料作出评价的（critical）过程。阅读也可以被看作是这一过程的结果——理解，例如，Nuttall（2002）强调，阅读的关键在于理解——从阅读材料中获得意义（makesenseofthetext）。阅读是一个复杂的心理过程，对这个过程进行测试显然是非常困难的，而对其结果进行考查则容易得多（A1-deroen，2000：3—7）在考查阅读理解时，有两点值得注意：一是阅读是有目的的活动，测试者应考查读者为了达到阅读目的对阅读材料是否有充分的理解（adeqllaleunde—tanding）；二是不同读者的背景知识会有差异，不同的知识系统与阅读材料相互作用以及不同读者作出自己评价的过程可能会产生不同的结果，测试者应认识到可能有一种以上的理懈是可以接受的。

在影响阅读测试的诸多因素中。有三个主要因素：阋读技能、阋读材料测试质量标准B”hmaIl和Palmer（1999）从六个方面比较全面地阐述了如何评估测试质量，这六大质量标准是：信度（reliability）、效度（validity）、真实性（authenticity）、互动性（intersctiveness）、冲击（impact）、实用性（practicality）。其中，信度和效度是保证测试质量的两个主要的标准。

信度是考试分数的基本质量，如果测试成绩具有稳定性，那么这样的测试是有信度的。具体地说，同样的考试或平行卷考试对同样的应试者分两次进行，如果两次考试的分数接近，考试是有信度的，但如果两次的分数相差太大，考试就缺乏信度。效度强调的是考试分数在多大程度上反映了测试者的测试目的。也就是说，如果测试的内容与测试者想要测试的内容不一致时，这个考试的效度是低的，甚至是没有效度的。Bachman和Palmer（1999：23）认为，信度是效度的必要条件。但不是充分条件。因此，设计出对路的考试内容是关键，在此基础上应尽可能地提高测试信度。

三、分析与评价

基于以上所述，笔者认为，对职称英语考试进行效度研究实际上主要是具体分析考试内容是否反映了应试者的目的语真实使用情况。尤其是他们的阅读需求。信度是效度的必要条件。对它的评价也不可忽视。

分析

笔者参照职称英语考试大纲，从近几年的试卷中具体了解到了考试内容和任务：职称英语考试中的不同专业的区分在于阅读材料的不同，不同的等级表示阅读材料的难度和阅读量的大小，而其它方面的设计是一样的。

效度

职称英语考试重点考查应试者的阅读理解能力。这种不分专业、不分等级考查相同能力的做法本身就是有问题的。

下面笔者从三个方面来分析现行的阅读考试：

a.阅读技能

根据职称英语考试大纲。应试者应具备六种阅读技能。如果这反映了应试者的实际需求。那就意味着参加各级各类考试的人员在现实生活中所需求的阅读技能是完全一样的，很明显这是不可能的。

b.阅读材料

不同专业、不同等级的职称英语考试所选择的阅读材料是不同的，但是这些材料也不能完全反映出应试者平时使用英语的真实情况。笔者发现了以下凡个问题：

问题1.阅读材料在试卷上的呈现方式体现不出文章类型，如书籍、杂志、报纸、文件、信函或电子邮件等；

问题2.阅读材料中插有某些英语词汇的汉语解释；

问题3.职称英语考试要求应试者能够理解本专业或一般的英语书面材料，因此选择了一些主题与专业相关的文章，但是笔者细读内容之后发现，这些文章大多写的是科普知识，明显与应试者的真实阅读情境不符。

其实。这个问题的存在是不可避免的，因为考试只分三个专业类别，所选的阅读材料不可能太专业化。

c.阅读任务

职称英语考试有六个题型：词汇选项、阅读判断、概括大意与完成句子、阅读理解、补全短文和完形填空。而在现实生活中，应试者不大可能会碰到第一、第五、第六种阅读任务。

更为严重的问题是答题方式：应试者从头到尾只需选择就行。首先，这种测试方式不符合现实。而且选择题存在助“猜”的潜势，可能考查不出真正的阅读理解能力。

此外，各级各类的职称英语考试全是以60为及格分数，这个统一的分数线无法反映出不同行业中的不同等级的应试者在真实语言情境中完成蒯读任务时所需的不同程度。

信度

因为笔者不可能对相同的应试者进行两次同样的职称英语考试或平行卷考试，所以这里对信度的分析中，笔者将重点放在评分标准上。职称英语考试中全部是客观题，这就决定了评分的客观性，整个评分过程丝毫不会受到阅卷者主观判断的影响，得出的分数应该具有相当的稳定性。

评价

职称英语考试分类别、分等级，从表面上来看，设计者是考虑了应试者实际需求的，而且客观的评分过程也可能使考试有比较高的信度。但是，上面笔者所进行的还不够全面、不够深入的分析已经说明了该考试的效度比较低，因此，该测试手段质量不高、意义不大。

四、建议

职称英语考试的设计者有必要采取一些有力措施提高测试的效度，但同时也不可忽视信度。设计者要开发真实考试模式，真正测到想要测的能力。能从考试结果中了解和预测应试者在真实情境中的语言能力。显然。

对应试者的语言交际需求的分析是关键，这样的需求分析需要设计者、应试者、该领域的专家等的参与。

在这里，笔者就现行的阅读考试提出几点具体的建议：

a.设计者应尽可能充分建考虑应试者不同的阅读需求，这样的需求分析在每次考试之前都要进行，因为应试者的需求不是一成不变的。

在本文中。由于有限的水平和能力，笔者未能对阅读文章的难度进行分析。实际上，文章的难度是一个复杂的问题，mderson（2000：74）指出。在很多情况下，难度并不能够被绝对地确定下来，测试者可以从应试者的目的语使用情境中选择真实的阅读材料。

b.选取的阅读材料要真实，设计者不必在文中提供汉语解释，因为应试者可以使用词典。设计者可根据实际情况来确定考试时间的长短。

c.测试中的阅读任务要尽可能地真实。不过，要测试情境与真实情境相一致是相当困难的，对此，Robin（1980：79）通过引用波哥大研讨会（BogotaSemimr）报告中的内容提出，这种任务型语言测试的操作可以是非正式的——在真实生活中，让考查对象在不知情的情况下得到测试。

d.应试者应有机会表达个人的观点和态度。主观题的存在要求评分标准的制定要准确、细致，阅读考试的评分标准的制定应围绕所测的阅读能力，面非写作能力，笔者甚至认为。应试者也可用自己的母语来回答主观题。此外，对阅卷者的培训和监督一定要严格。当然，为了提高信度，客观题也许可以不要放完全排除。设计者可以采取措施阻止”猜“的行为，如选错答案比不选答案扣分要多。

上文中提到过职称英语考试只分三个专业类别，有些闯题是不可避免的。笔者感觉到，如果划分的专业越多，考试的效度就可能越高。其实，一次真正意义上的专门用途英语测试只能是为一个应试者而设计的，因为每一个人的语言真实使用情境都是不尽相同的。

英语考试质量分析范文【第五篇】

关键词：构念效度验证；因子分析；口陈报告

一、构念效度验证理论

在语言测试中，专业化和效度研究是现在和未来研究的两个重点领域（Bachman， 2000）。构念效度研究又处于效度研究的核心地位。构念是测验所要测量的概念或特性。构念效度是测验代表语言学习基本理论程度的指标。构念效度验证研究测试所测量的能力，为测试提供理论基础。构念效度证据的来源包括考试内容、反应过程、内部结构、与其他变量之间关系和测验影响，这反映了从多种渠道积累效度证据的重要性。效度证据的不断积累有益于使用和解释分数、完善测验构念和测验本身、提出新的研究问题。精心编制的测验、命题的理论框架、测验的实施和计分过程、分数等值、及时纠正测验过程中的不公平因素等是构念效度得以实现的根本保证。

但是，作为构念效度验证基础的构念难以确定（Chapelle et al.， 2010），收集的各种证据也没有连续性，基于论证的效度验证模式（Bachman， 2010）应运而生。在该模式中，测试的发展形成了一个推论链，每一个论证会形成下一个论证的出发点，第二个论� 在这个连续统一体中，每一部分都需要收集多种证据，而每一种证据，都会对构念效度产生影响，各种证据成为了一个整体中的部分。

二、国内的构念效度验证实践

1.量化的构念效度验证研究

量化的构念效度研究主要运用结构方程模型、因子分析、多质多法分析、问卷等工具进行。其中因子分析包括探索性因子分析和验证性因子分析。

结构方程模型能够帮助测量构念的解释力。例如，为计算机自动评分的前期人工评分提供较为精确的“作文内容”分项指标及其评定标准，文秋芳（2007）运用结构方程模型检验了限时英语议论文“内容”的构念效度。她发现，代表“内容”构念的四个观测变量：文章切题性、观点明确性、说理透彻性与篇章连贯性能够解释作文质量56%的差异。运用同样的过程，高霄（2009）发现，由同样四项指标反映的“写作内容”能够直接解释“写作质量”成绩变异的%；由流利性、准确性与复杂性反映的“写作形式”能够直接解释“写作质量”成绩变异的%，总和为%，说明“写作内容”与“写作形式”能够有效预测“写作质量”，这证实了该研究所提出的“写作质量”构念效度比较好。研究结果对二语写作评估标准的改进具有一定的启发意义。

验证性因子分析是在已知测试的理论假设的因子构成的情况下，来分析数据是否与理论假设的因子结构拟合。例如，邹申等研究者（2009）发现，英语专业八级试题中二阶单因子模型的拟合数据可以用于解释人文知识项目的构念以及内部各因子间关系：社会文化知识、文学知识和语言学知识反映了人文知识构念；同时，三个因子之间的关联也较紧密。因子负荷值也说明这些题目对其相应的因子都有显著贡献。也就是说，题目成功测试了考试规定的知识结构。

多质多法分析旨在确定在多大程度上测试结果是考生的能力所致还是测试方法所致。陈慧麟（2009）通过英语国家概况测试的案例研究，使用多质多法验证了基于纸笔的测试和基于计算机的测试所考查的构念的对等性。结果表明，纯文字的纸笔测试和相应的纯文字的基于计算机的测试具有几乎相同的能力结构。

探索性因子分析一般在未知所测构念因子结构的情况下探索实际数据的因子结构。刘国忠和秦晓晴（2010）随机抽取的英语专业四个年级320名学生的240篇限时作文，按15个指标评分后，将15个判断写作准确性的指标通过探索性因子分析缩减为12个，然后提取了三个主因子，这三个主因子初始特征值都超过了的可接受值，累计方差解释率达到了%。因此，这12个变量有较好的结构效度。他们得出结论：二语写作的准确性是可测的。贺莉（2012）结合语言测试的构念效度对测试结果所体现出的性别差异现象进行研究，作者运用了探索性因子分析发现，该测试对于男生概念效度较好，而对女生来说构念效度较差，作者从“构念体现不足”和“构念无关因素”两个方面对原因进行了解释。

采用多种问卷调查的方式可以调查在何种程度上考试考查了欲测的构念。基于构念整体观和建构主义对读写构念的描述，张新玲和曾用强（2009）从构念效度入手对读写结合写作任务在广东省高考英语考试中所得分数进行效度验证，运用专家预测、教师备考过程调查和考生应考过程调查，分析考生对考试过程应答数据。发现所取样本考生的读写结合写作测试应答数据和构念理论拟合，相关证据能够较充分、适当地支持基于该考试分数的大学录取决策。

2.质性构念效度验证研究

针对构念效度研究的质性研究方法主要集中在专家判断、口陈报告和语料库研究。

邹申等研究者（2009）在研究大学英语专业八级考试人文知识测试的构念效度时，首先参照《高校英语专业八级考试大纲》分析了2005年考试中的人文知识题部分的关联性和代表性。分析结果表明，该题涉及了社会文化、文学和语言学三个方面。考查内容与大纲有较强的关联性。张新玲和曾用强（2009）请25位写作教育专家做了读写任务质量判断，结果显示，绝大多数专家都认为该试题能够考查学生完成任务所需的元认知和认知能力。

口陈报告是当前构念效度验证中使用的最广泛的质性研究方法。高怀勇等研究者（2011）使用口陈法检验了PETS的口语评分，研究者让评分员听口试现场录音，听完录音后尽可能地说出评分时的真实想法和心理活动，回忆当前考生在内容、语法与词汇上的表现，加以口头评论。研究者对口头报告进行录音，之后进行文字整理和定性分析，看给考生口语的评分是基于构念有关因素还是基于构念无关因素。李绍山和陈晓扣（2006）从考生答题过程的角度对TEM―4完型填空测试进行结构效度研究。学生每做完一题后，立即口头陈述选择某一选项的理由。然后研究者分析考生是否通过正确理解短文和四个选项正确地回答了题目，而不是靠猜测正确地回答了题目，从而判断试题是否考查了打算考查的能力。

潘鸣威和徐欣幸（2010）运用语料库的分析手段，借助语言测试构念效度的验证模式，从考生所反映出的问题中研究了上海高考英语测试汉英单句翻译的构念效度。翻译测试的构念应包含对语言本身的掌握以及对于源语和目标语之间存在不对应处的切换意识。对于第一点，研究者观察语言错误类型；第二点观察汉英切换中的汉语冗余信息和汉英不对等性的处理。然后研究者列出了符合高考实际情况的各项验证指标。据此研究者提出了三个问题，汉英单句测试考察了什么内容？这些内容与构念的拟合度如何？汉英单句测试的总体构念如何？研究者为此建立了汉英句子翻译语料库，通过分析发现，考生在每句话中的出错点都可以分门别类地划归到汉英单句翻译测试构念的操作定义中去。换言之，高考中汉英单句翻译测试能较好地拟合衡量翻译任务所应具备的语言能力和翻译能力，因此具有较好的构念效度。但是，研究者只注意了一个方面，这类主观试题最致命的地方在于评分员，如果评分员信度低，那么其效度无论如何也不会高。

三、结束语

本文仅综述了国内外语核心期刊上发表的关于构念效度验证的文章，没有涉及已出版的博士论文，所以还很不全面。但是，从现有的文献来看，我国语言测试学者还和国际语言测试领域构念效度验证的理论和实践有一定差距，例如，未见到利用语篇分析来进行构念效度验证的文章；现有的积累起来的针对某一测试构念效度的证据太单薄；未见到系统运用“以论证为基础的效度验证”理论的文章。在这些方面，国内的测试研究者可以做出自己的贡献。

参考文献：

[1] Bachman （2000）. Modern language testing at the turn of the century： assuring that what we count counts. Language Testing ： 1- 42.

[2] Bachman （2010）. Language Assessment in Practice. Oxford： Oxford University Press.

[3]Chapelle， Enright， Jamieson （2010） Does an Argument-Based Approach to Validity Make a Difference？ Educational Measurement： Issues and Practice Spring， 29. 1： 313

[4]陈慧麟。基于纸笔的语言测试和基于计算机的语言测试之间效度对等性验证模式初探[J].外语界，2009（3）.

[5]陈晓扣，李绍山。 TEM-4完型填空测试结构效度研究―答题过程分析法[J].现代外语，2006 （1）.

[6]高怀勇，戢焕奇，刘锋，汪定明。基于试题内部结构和评分过程的口试构念效度研究――以PETS四级为例[J]. 山东外语教学， 2011（4）.

[7]高霄。二语写作质量构念效度的结构方程模型分析[J] . 山东外语教学， 2009（6）.

[8]贺莉。语言测试构念效度的性别差异研究[J] .外国语学院学报，2012（9）.

[9]刘国忠，秦晓晴。二语写作准确性结构效度研究[J] . 外语与外语教学， 2010（2）.

[10]潘鸣威，徐欣幸。基于语料库汉英单句翻译测试的构念效度探究――以全国高考（上海卷）翻译题为例 [J] . 中小学英语教学与研究， 2010（4）.

[11]文秋芳。“作文内容”的构念效度研究――运用结构方程模型软件AMOS 5的尝试[J] .外语研究，2007（3）.

上一篇：小学四年级英语教学计划【5篇】

下一篇：入职申请书【优秀5篇】