英语语音量具质量研究范文

本站小编为你精心准备了英语语音量具质量研究参考范文，愿这些范文能点燃您思维的火花，激发您的写作灵感。欢迎深入阅读并收藏。

英语语音量具质量研究

语音是英语交际能力的一个基本组成部分[1]。上世纪80年代，语言学者们达成共识，即使学习者语法全面，词汇丰富，如果语音不能达到基本可理解的水平，交际同样会失败[2]。语音能力的考察离不开科学的语音测量工具，然而目前我国高校的英语语音测试仍以单一的朗读口试为主，教师评分主要依赖综合印象，不依据必要的评分细则，因此测试的可信度和有效性较差，无法体现学习者真实的语音能力，并对语音教学产生有益的反拨效应。鉴于此，本文将以笔者编制完成的一套英语语音测量工具为例，具体阐述量具的设计方法、内容、施测、评分与质量分析过程。

一、语音量具的设计

（一）设计方法

二语语音测试有两种基本的设计方法：整体法（holisticapproach）和元素法（atomisticap-proach）。整体法长于考察学习者语音的综合水平，便于操作，但测验结果易受评判者主观因素的影响，也不利于了解受试语音的具体特点。元素法比较费时，但此法将语音系统分解为若干独立的项目予以考察，从而提供一系列关于受试语音的定量指标，有助于减少评判者主观因素的干扰，对受试语音的具体特点做出诊断。相比较而言，元素法为研究语音状况提供了一个定量检测手段，更能客观真实地反映出受试的语音能力[3-4]。本文中量具的设计就基于元素法。

（二）量具构成

量具构成取决于对所测量的语音能力的界定。英语语音学可分成音段语音学和超音段语音学。音段又叫音段音位（segmentalphonemes），指从话语序列中分离出来的、可识别的离散语音单位，即元、辅音；超音段（suprasegmentals）指话语中大于单个音段的发声单位。Dalton&Seidlhofer[5]等研究表明，重音、节奏和语调决定话语的可理解性，是最重要的超音段特征。英语语音能力的发展存在“接受性”和“产出性”，“音段”和“超音段”能力发展不均衡的现象。譬如，学习者能辨认出语调模式的异同，但未必能正确地将其读出；学习者的音位听辨能力很强，但未必能准确听辨出重音位置。因此语音能力的界定应包括接受性、产出性、音段和超音段这四个层面。以该定义作为命题的基础，量具由接受性英语语音测试和产出性英语语音测试构成，较全面地考察受试者的接受性英语音段、超音段能力及产出性英语音段、超音段能力。

（三）测试内容每份测试都涵盖音位、重音、节奏和语调四项分测试，由笔者参照相关英语语音的理论阐述及实证研究设计而成。

1.接受性英语语音测试音位分测试考察英国标准发音（ReceivedPro-nunciation，简称RP）中的辅音、元音和2个RP系统外的音位。测试词选自孟宪忠[6]和王桂珍[7]，不写在答题纸上，以免给出音位-字位上的提示。题项由对应于编号“A、B、X”的三个单词构成，“A”、“B”为音位最小对，受试者需判断“X”的音位类型与“A”还是与“B”相同。单词包含的音位数量相等，区别性音位的位置相同。重音分测试考察受试者能否听辨出单词中主重音以及单调群句中主重音的位置。题项由一对拼写一致，但主重音位置不同的单词或短句构成（如''''applicant/a''''pplicant；Ilike''''blueties/Ilikeblue''''ties）。测试词的选择参考Cruttenden[8]和Roach[9]提出的词汇分类表及例词，并考虑单词的词性、后缀类型、音节数、主重音位置等因素。测试句的选择参考Speer等[10]。节奏分测试考察受试者对节奏模式和停顿位置的听辨能力。在连贯语流中，重读和非重读音节的交替形成了固定的节奏模式，该测试涉及九种典型的节奏模式。题项由一对短陈述句构成，由受试者听辨其节奏模式的异同。测试句选自孟宪忠[6]和王桂珍[7]，包含同等数量的单音节词。考察停顿位置的题项由一对停顿位置不同的短句构成，一个短句包含呼语，另一个包含同位语（如Henry,thelittleoneeatsalot/Henry,thelittleone,eatsalot），测试句选自Patel等[11]。语调分测试考察受试者对调核音调类型及语调模式的听辨能力。英式传统将一个完整的调群切分为调冠、调头、调核和调尾，调核是唯一不可或缺的部分。调群的语调模式包括调核前调（调冠+调头）和调核音调（调核+调尾），调核音调传达调群的核心意思。该测试中针对调核音调的题项选自Dankovicov觃等[12]，测试高降、低降、高升、低升、降升、升降、升降升等七种类型。受试者需判断三个单音节词和三个短语中调核音调的类型。短语包含四个单音节词，调核位于第一个音节。每个单词或短语分别以四种调核音调读出。针对语调模式的题项由一对拼写相同，包括调头、调核和/或调尾的单调群句构成，但以相同或不同的语调模式读出供听辨。句子选自卜友红[13]，测试四种语调模式，涉及高平/低平、递降、递升三种调头和上述七种调核音调类型。接受性语音测试的语料由笔者和一名英语本族语者通过CoolEditPro2.0录制而成，录音采样率为16000（16kHz，16bitmonoPCM）。本族语者朗读除语调分测试外的其他语料。语调部分的测试词句朗读完毕后，立即输入Praat4.4.20检验，确保获得理想的调核音调类型和语调模式。

2.产出性英语语音测试音位分测试的设计参考Knickerbocker[14]，内容为选自外语学习软件“TellMeMore”的10个句子。句子由简易的单词构成，考察受试者对辅音、元音以及其他3个RP系统外的音位的朗读能力。重音分测试考察受试者能否准确地按标注读出词、句重音。测试内容选自Cruttenden[8]、孟宪忠[6]和Roach[9]，为18个单词和一个置于5种语境下的陈述句，句前附有中文提示。节奏分测试的测试内容是一首韵律诗，选自王桂珍[7]，考察受试者能否在篇章层面上运用弱读、连读等手段读出英语重音-节拍型的节奏特点。语调分测试考察受试者对句子语调的模仿能力。6个测试句选自用于产出性音位分测试的句子，时长最多持续2.5秒，在Fraisse[15]建议的短时记忆广度上限5秒以内。句子语调变化丰富，涉及陈述句、感叹句、一般疑问句和特殊疑问句四种类型。

二、预测试与题项分析

（一）受试和施测

笔者在南京农业大学非英语专业一年级抽取45名学生作为受试对象进行了预测试。施测分两步进行。第一步，在语音室随堂进行了约50分钟的接受性语音测试。测试前向受试者介绍音位、节奏模式等语音概念，并播放范例试做。测试时题项播放一遍，受试者在答题纸上作答。第二步，在课后进行一对一的产出性语音测试，人均5分钟。受试者测试前可出声练习，测试时按照书面指示朗读，注意发音的清晰度、重音标注和节奏感。语音产出由CoolEditPro2.0录制保存。语调模仿基于“TellMeMore”句子发音的界面完成，每个句子听两遍，听完一遍立即模仿一次，共模仿两遍。

（二）测试评分

评分采用综合法和分析法相结合的形式。接受性语音测试为客观题，由笔者根据答案评判。产出性语音测试中的语调分测试由“TellMeMore”的内置系统自动评分。每模仿一次，系统就比对受试者与目标语朗读者语调模式的相似度在7个等级内打分，受试者最终得分为模仿总分的均值乘3。其余分测试由两名语音教师根据评分细则和参考录音独立评定。评定音位产出时，首先判断单词发音是否准确，如不准确，需进一步听辨出读错的音位。音位读错一个扣除0.5分，最终得分取两名评分员给分的均值。评定重音产出时，只有当两名评分员一致判定该读的音节或单词予以了重读才能得1分。节奏产出用综合法评定，根据受试者朗读的节奏感与本族语者的接近程度在5个等级内打分，最终得分为评分员给分的均值乘3。

（三）题项分析

评分结束后，笔者将每名受试者的题项得分逐一输入电脑，运用SPSS16.0对两份语音测试试卷做题项分析，以便客观地检验每道试题的质量，为改进量具提供必要的依据。接受性语音测试由163道客观题组成，针对调核音调的24个题项是四选一的多项选择题，其余题项均为二选一的是非选择题，笔者计算了每个题项的难易度和区分度。难易度用易度值（FV）表示，计算公式为（corrrectU+correctL）÷2n，n表示每个组别的人数，CorrectU和CorrectL分别表示高分组和低分组中答对题项的人数；区分度用区分指数（D）表示，计算公式为（:correctU-correctL）÷n。实际计算时，将受试者按总分高低依次排列，选取最前面和最后面27%的试卷归入高分和低分两个组别[16]180[17]255-257。易度值越高，题项就越容易。选择题的作答可能存在猜测因素，导致难度降低，因此Nitko提出易度值在0.75~0.85之间的是非选择题就可以接受[18]72-74。在题项难易度的基础上，还应进一步考察其区分指数，因为一道非常容易的试题尽管无法区分优秀与良好的考生，却有可能将较差与特别差的考生区别开来。一般来说，区分指数越高，说明题项区分考生之优劣的能力就越强，区分指数低于0.3的题项须经改进后使用或弃而不用[17]256-257。题项分析后，接受性语音测试符合要求的题数降至76（见表1）。整份试卷的平均难度和区分度为0.599和0.478，比较理想。表1接受性语音测试的题项筛选情况产出性语音测试共有40个题项，属于主观测试。笔者以独立样本t检验分析了针对重音、节奏和语调的题项区分度，发现98%的题项区分度高，近80%的题项能在0.001的水平上显著地区别英语语音能力强和弱的受试者，因此所有的题项得以保留。

三、正式测试与信度、效度分析

（一）受试

参加正式测试的有效受试者为南京农业大学216名学生，其中61名为英语专业二年级学生，另外155名为非英语专业一年级学生，来自不同的文、理专业。受试者平均年龄20岁，男生81人，女生135人。语音量具是经过题项分析和筛选的接受性与产出性英语语音测试，施测和评分过程与预测试相同，最后使用SPSS16.0进行信度和效度分析。

（二）信度分析

信度指测试结果的可靠性或一致性，在很大程度上取决于测试和评分的客观性[20]45-46。测试信度可用不同的方法验证。笔者采用内部一致性信度检验来评价和衡量测试各部分之间的一致程度。接受性语音测试的信度检验法为折半法，即将试卷按题项编号的奇、偶数分成几乎等值的两半，计算出这两半试卷测试结果之间的相关系数，然后通过Spearman-Brownprophecy公式进行调整，计算得出折半信度系数为0.823；产出性语音测试的信度计算公式为N÷（N-1）×［1-m×（N-m）÷Nσ2］，其中N为测试的题项数，m为测试均分，σ为测试分的标准差[16]164，结果得出信度系数为0.897，说明语音量具的信度较高，质量可靠。主观性测试的评分不可避免地受到评分员主观因素的影响而导致误差。评分员信度研究就是针对评分员所评的分数进行探讨。评分员信度主要分成两类：评分员之间的信度和评分员自身信度。本文主要涉及前者，考察在评价产出性音位、重音和节奏的过程中评分员之间评分的一致性。结果发现重音分测试的评分一致率达85.1%（评判一致的题数÷受试朗读的总题数），音位和节奏分测试的评分员组间相关系数分别为0.889和0.845（p=0.000），评分的一致性较高。

（三）效度分析

效度指测试所能测出预定要测量的事物的程度。效度与测试目的密切相关，所以有的学者明确将效度定义为成功地实现测试目的的程度。如果旨在考察口头交际能力的英语口试中出现了要求考生“谈谈普通列车和悬浮列车异同”的试题，这种测试的效度就应受到质疑，因为所测试的主要不是语言而是相关的背景知识[17]41-42。效度具体可细分为内容效度、结构效度、同期效度、预测效度和反拨效度。结构效度是各种效度之本，指测试所能反映作为其基础的相关理论假设的程度[17]43[19]。结构效度的验证通常通过相关矩阵和因素分析来考查测试试卷各大项之间的关系。语音量具服务于测试语音能力这一目的，对语音能力的理论阐述和界定构成了笔者所设计的语音测试试卷结构效度的理论基础。接受性和产出性英语语音测试各涵盖四项分测试，分测试的内部相关系数及其与总分之间的相关系数见表2。一般来说，如果两部分间的相关系数太高，说明两者考的是相同的能力，是一种不必要的重复，只要保留其中一个部分即可；如果两部分间的相关系数太低，则又说明考的是完全不同的能力，可能是语言之外的其他因素在起作用。杨惠中、Weir[20]认为各部分间的相关系数应该在0.3~0.7之间才合适。从表2可见，两份测试试卷各分测试之间以及各分测试和总分之间均在0.01的水平上显著相关，超音段（重音、节奏、语调）测试与总分之间的相关性更高，说明和音段能力相比，超音段能力更能体现学生的语音水平。为进一步探讨各分测试之间的关系，需进行探索性因素分析，因素的提取采取主成分分析法。接受性和产出性英语语音测试的KMO（测度值分别为0.612和0.797，>0.5）和Bartlett球型鉴定（显著值均为0.000）结果表明，测试的数据特征符合因素分析的要求。由表3可知，对两份测试而言，按特征值大小可依次找出四个因素，其中“因素1”的特征值远大于1，其贡献分别达到62.2%和69.6%。表4显示，在四项分测试的考试内容中，“因素1”的负荷系数最大，接受性语音的各分测试分别在0.471~0.645之间“，因素1”可以看作是“接受性英语语音能力”；产出性语音的各分测试分别在0.554~0.781之间，“因素1”可以看作是“产出性英语语音能力”。上述数据说明，语音量具的效度较高。语音能力可以分解，又相互有关，各部分的综合能较好地反映出学生总体的语音能力。

四、结语

经过对英语语音能力的界定、命题、构卷、预测、题项分析、题项筛选、正式测试、信度和效度分析等诸多环节的操作后，笔者编制的英语语音量具的质量已经有了相当的保证。但是，有效、准确地测量大学英语学习者的语音能力是一个十分值得研究的课题，本文未涉及的问题还很多，例如：如何考核学生在真实语境中语音产出的应用能力？如何开展主考和评分员的业务培训？如何解决施测过程中学生人数多、语音设备不足、测试成本高等实际困难？如何建立学生的语音档案，以便进行针对性教学？等等。希望更多的同行专家能对该课题进行深入的探究，共同构建和完善我国大学英语语音测试体系。

英语语音量具质量研究范文

扩展阅读

推荐期刊

棒棒英语

英语广场

海外英语

校园英语

精品推荐