前言:我们精心挑选了数篇优质统计学的标准差文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
【关键词】孕妇;步行;步态;胸部;骨盆;生物力学
ABSTRACT:fortablewalkingvelocity,amplitudesofpelvicandthoracicrotations,andtheircoordinationwerecomparedbetweenthetwogroups.ResultsComfortablewalkingvelocitywassignificantlyreduced.Therotationalamplitudesofpelvisandthoraxweresomewhatreduced,withsignificantlysmallerintraindividualstandarddeviations.AlsopelvisthoraxRelativeFourierPhasewasalittlesmaller;itsintraindividualstandarddeviationwassignificantlyreducedatvelocities≥1.06m/s.ConclusionThegeneralpatternofgaitkinematicsinpregnantwomenisverysimilartothatofnulligravidae.Pregnantwomenexperienceddifficultiesinrealizingtheharderantiphasepelvisthoraxcoordinationthatwasrequiredathigherwalkingvelocities.
KEYWORDS:pregnantwomen;walking;gait;pelvis;thorax;biomechanics
长期以来,人们一直认为妊娠影响孕妇的步态运动。Foti等研究发现,孕妇步行时跖屈的动量减少,髋关节外展的动量及骨盆的倾斜度均增加,骨盆的倾斜度的改变存在较大的个体差异[1]。Nagy等报道孕妇最舒适的步行速度显著性降低,亦存在较大的个体差异[2]。但Foti等认为这种变化并无统计学意义,并发现怀孕对步长或步周期长无显著性影响[1]。上述研究显示,孕妇的步态发生改变,但研究结果并不一致。大约25%患有妊娠相关骨盆痛的孕妇和5%产后患者需要就诊治疗,重症患者常常出现步行障碍[3]。对正常孕妇运动协调的研究可作为今后研究妊娠相关骨盆痛的步态运动的基础。笔者研究怀孕对步行时水平面上骨盆和胸廓运动协调的影响,以期有助于从生物力学的角度进一步了解妊娠相关骨盆痛患者的步态运动。
1对象与方法
1.1对象选取年龄20~45周岁的健康未孕妇女(对照组)和健康孕妇(孕妇组)作为观察对象。对照组13例,年龄中位数27岁(22~36岁),体质量中位数75kg(45~95kg),身高中位数172cm(157~190cm);孕妇组12例,年龄中位数32岁(30~38岁),体质量中位数76.5kg(67.5~89kg),身高中位数172cm(162~180cm)。
1.2方法
1.2.1仪器步行仪(BiostarGiant,荷兰AlmereBiometrico公司);三维运动捕捉系统(Optotrak,加拿大NDI公司)。
1.2.2方法受试者以不同速度在步行仪上行走。骨盆、胸廓和足部的运动由三维运动捕捉系统光学镜头拍摄记录。2组光学镜头位于受试者的身后。在受试者的胸背部第6胸椎棘突的位置和骶骨两髂后上棘之间各有一轻金属架,用尼龙束带将金属架固定其上,金属架上有3个可发红外光装置,构成一个刚体。为了捕获步行时足跟着地和足趾离地时的瞬间,在每侧足跟和第五跖趾关节处各安装一可发出红外线的装置。实验装置见图1[4]。实验开始时先让受试者在步行仪上行走3~5min,接着步行速度从0.17m/s每间隔1~2min增加0.11m/s,至1.72m/s。步行过程中,测试受试者最舒适步行速度和最大步行速度。每个速度下的数据采集共30s,抽样频率为100Hz。
图1测量步行时胸廓和骨盆运动的实验装置(略)
Fig1Experimentalsetupformeasuringthethoracicandpelvicmovementsduringwalking
1.2.3指标胸廓和骨盆的刚体在空间的运动代表各自的三维运动。设定刚体x、y、z轴的正方向为人体解剖位的前、上、左方位。通过计算xy象限上的反正切角度得出骨盆和胸廓在水平面上旋转角度的时序。骨盆和胸廓的旋转运动幅度(rotationalamplitude,RA)是从各自的运动时序上确定每一个步周期内最大与最小的角度差的绝对值。躯干的旋转运动时序是将骨盆运动时序与胸廓的运动时序相减而生成。在每一速度下对骨盆、胸廓和躯干的所有步周期的RA进行计算,取均值,分别确定为骨盆、胸廓和躯干的RA,并计算各自标准差。
应用快速离散傅立叶变换计算公式计算出每个运动时序的连续傅立叶相的时序。骨盆和胸廓的傅立叶相差时序是由胸廓的傅立叶相时序与骨盆的傅立叶相时序相减而产生。运用圆周统计学计算出骨盆和胸廓运动的傅立叶相差(relativefourierphase,RFP)及其个体内标准差。若RFP为0,表示同相协调运动;若RFP为180°,则表示反相协调运动。
1.3统计学处理应用SPSS10.0软件,采用方差检验,P<0.05为差别有统计学意义。
2结果
2.1步行速度正常孕妇的最舒适步行速度中位数1.06m/s(0.72~1.28)m/s,对照组为1.17m/s(0.83~1.50)m/s,2组比较差别有统计学意义(P<0.05)。
2.2骨盆和胸廓RA及其个体内标准差骨盆RA先是随着步行速度的增加(0.94~1.06m/s)而逐渐减小,然后随着步行速度的增加而逐渐增加(图2A)。孕妇组和对照组骨盆RA分别为(9.1±福建医科大学学报2008年5月第42卷第3期吴文华等:正常孕妇步行时骨盆与胸廓水平面的旋转运动3.5)°和(7.7±3.2)°,其速度效应差别有统计学意义(P<0.05)。孕妇骨盆RA的个体内标准差较对照组减少(P<0.05),孕妇组和对照组的值分别为(1.3±0.4)°和(1.6±0.5)°(表1)。
图2对照组和孕妇组在不同步行速度下各部位的旋转运动幅度(略)
Fig2Rotationalamplitudesofthepelvis,thethoraxandthetrunkduringgaitatdifferentwalkingvelocitiesofthecontrolsubjectsandthehealthypregnantwomen
表1各变量的速度效应和组别效应(略)
Tab1Theeffectsofvelocityandgrouponthevariables(repeatedmeasuresANOVAs)
胸廓RA基本维持稳定而变化不大直至步行速度增至0.8m/s时,然后随着步行速度的递增而渐减少(图2B)。经方差检验,速度的效应差别有统计学意义(P<0.05)。孕妇胸廓RA的个体内标准差比对照组减少(P<0.05)。孕妇组和对照组的均值分别为1.2°和1.7°,其速度效应差别有统计学意义(P<0.05)。
躯干RA是随着行步速度的增加而递增的(图2C),孕妇的躯干RA较对照组约小1°,其速度效应有统计学意义(P<0.05),孕妇躯干RA的个体内标准差较对照组小(P<0.05),孕妇组和对照组的值分别为(0.7±0.3)°和(1.0±0.4)°,其速度效应有统计学意义(P<0.05)。在最舒适的步行速度下,孕妇骨盆和躯干RA较对照组小(P<0.05)。
2.3RFP及其个体内标准差
图3对照组和孕妇组在不同步行速度下的傅立叶相差及其个体内的标准差(略)
Fig3Relativefourierphaseanditsintraindividualstandarddeviationbetweentransversepelvicandthoracicrotationsatdifferentwalkingvelocitiesofthecontrolsubjectsandthehealthypregnantwomen
2组RFP均随着速度的增加而增加(图3A),呈一条S形曲线,在速度为0.83,1.17m/s的区域内最为陡峭。孕妇的RFP较对照组小7°。其步行速度效应有统计学的意义(P<0.05)。RFP的个体内的标准差与速度的关系有点不规则(图3B),随着速度的递增而增加,直至速度到达0.94~1.17m/s;接着是一个平台或稍有点下降,在最舒适的步行速度时,达到最高值。孕妇的RFP的个体内标准差较对照组小(P<0.05),其速度效应差别有统计学意义(P<0.05)。
孕妇的孕周数与RFP的个体内标准差相关系数为-0.68,差别有统计学意义(P<0.05)。在最舒适的步行速度下,孕妇的RFP及其个体内标准差均比对照组小(P<0.05)。
3讨论
3.1总体上孕妇的步态运动正常在2组中,速度对RA、骨盆胸廓RFP及其个体内的标准差的影响相似(图2~3),由此得出结论,孕妇的步态运动从总体上讲是正常的。怀孕和行走本身就具有高度的相容性,从进化学的角度而言,这并不难理解[5]。尽管如此,孕妇的最舒适的步行速度明显的下降,RA变小,尤其是在最舒适的速度下骨盆和躯干RA的减少具有显著性差异。他们的个体内标准差减少,具有统计学意义。骨盆和胸廓RFP变小,在最舒适的速度下具有显著性差异,其个体内标准差变小,在快速行走的速度下(≥1.06m/s),这种差别有统计学意义。孕周数与此个体内的标准差呈显著性负相关。孕妇必须适应怀孕的改变,比如体质量的增加。本研究揭示在孕妇身上发生了轻微但是连贯一致的运动学变化,这点与以往文献报道的有所不同[12]。
3.2孕妇骨盆胸廓旋转运动的RFP孕妇选择在低速下步行不能用节约能量的观点来解释,因为当步行速度低于(或高于)最舒适的速度时,须消耗更多的能量[5]。尽管如此,低速行走获得了更多时间来对微扰进行反应[6],这也许是孕妇由于额外的载荷或本体觉受干扰而选择低速行走的原因,目的是为了避免出现快速步行时的运动协调模式。
本研究表明,未怀孕妇女的最舒适步行速度出现在RFP的曲线上的平台起始段,而孕妇最舒适步行速度则是出现在曲线陡坡的半山腰处,此时2组间的RFP的差值为44°。当孕妇快速步行时,RFP值较高,但其变异性很小,这提示了对孕妇而言,完成大的RFP的步态是有困难的,这种现象同样发生在背着负荷的受试者、慢性下腰痛患者、妊娠相关骨盆痛产后的患者[4,78]。出现较小RFP的步态运动可以由许多种不同的限制性因素造成,妊娠便是其中之一。
比较骨盆、胸廓和躯干旋转运动的个体内标准差,他们的平均值分别为1.25°,1.29°和0.66°。如果骨盆和胸廓的旋转运动的控制是相互独立的话;而实际上,它的值小得多。因此,骨盆和胸廓的旋转运动似乎是同时受到控制的,虽然躯干的旋转运动在快速行走的协调方面不是一个“必须的变量”[9],因为躯干的旋转缺乏时间维。显然,RFP是和时间变量有关,它也许是快速步行时的必须变量,以确保快速行走时骨盆的旋转运动必须被胸廓的反向旋转运动所平衡[10]。就孕妇的步态而言,快速行走时骨盆和胸廓的惯性冲量将会增加,这也许是孕妇无法实现大的RFP步态运动的原因。
3.3孕妇步态运动的变异性自从Bernstein引入了“探索变异性”以来,对运动的变异性研究渐渐兴起。运动的变异性常常被认为是具有功能性,才有可能有灵活性、适应性;然而变异性会消耗能量及增加损伤的可能性,因此变异性的功能性必须看是针对何种情形而言[1114]。
一个较为奇怪的现象是骨盆与胸廓间的RFP的个体内的变异的最大值在非常靠近最舒适步行速度的地方出现。Masani等人发现地面作用力的变异在最舒适步行速度时最小[15],也许在最舒适的速度下,身体重心的垂直运动是必须的变量,而在水平面上的骨盆和胸廓间的RFP在快速步行时则变成是必须的变量。撇开RFP的变异性是如何发挥作用的,在怀孕期间,尤其在怀孕晚期,RFP的变异性是如何在最舒适步行速度下增加并且在快速行走时减少有待于进一步研究。
笔者认为,正常孕妇的步态运动学特征与未怀孕的妇女相似。尽管如此,2组间存在着许多细微的差别。孕妇的最舒适步行速度较对照组显著性下降。骨盆、胸廓和躯干的RA较对照组小。他们的个体内的标准差则较对照组低。在最舒适步行速度下,骨盆和躯干的RA较对照组小。孕妇组的RFP较对照组小,在速度≥1.06m/s,个体内的标准差呈显著性减少,尤其是在怀孕晚期表现更为明显。
【参考文献】
[1]FotiT,DavidsJR,BagleyA.Abiomechanicalanalysisofgaitduringpregnancy[J].JBoneJointSurgAm,2000,82(5):625632.
[2]NagyLE,KingJC.Energyexpenditureofpregnantwomenatrestorwalkingselfpaced[J].AmJClinNutr,1983,38(3):369376.
[3]WuWH,MeijerOG,UegakiK,etal.Pregnancyrelatedpelvicgirdlepain(PPP),I:Terminology,clinicalpresentation,andprevalence[J].EurSpineJ,2004,13(7):575589.
[4]WuW,MeijerOG,JuttePC,etal.Gaitinpatientswithpregnancyrelatedpaininthepelvis:Anemphasisonthecoordinationoftransversepelvicandthoracicrotations[J].ClinBiomech,2002,17(910):678686.
[5]McNeillAlexanderR.Energeticsandoptimizationofhumanwalkingandrunning:the2000RaymondPearlmemoriallecture[J].AmJHumanBiol,2002,14(5):641648.
[6]MakiBE,McIlroyWE.Theroleoflimbmovementsinmaintaininguprightstance:the"changeinsupport"strategy[J].PhysTher,1997,77(5):488507.
[7]LaFiandraM,WagenaarRC,HoltKG,etal.Howdoloadcarriageandwalkingspeedinfluencetrunkcoordinationandstrideparameters[J].JBiomech,2003,36(1):8795.
[8]LamothCJ,MeijerOG,WuismanPI,etal.Pelvisthoraxcoordinationinthetransverseplaneduringwalkinginpersonswithnonspecificlowbackpain[J].Spine,2002,27(4):E9299.
[9]Gel''''fandIM,TsetlinML.Theprincipleofnonlocalsearchinautomaticoptimizationsystems[J].SovietPhysicsDoklady,1961,6(3):192194.
[10]LamothCJ,BeekPJ,MeijerOG.Pelvisthoraxcoordinationinthetransverseplaneduringgait[J].GaitPosture,2002,16(2):101114.
[11]BongaardtR,MeijerOG.Bernstein''''stheoryofmovementbehavior:historicaldevelopmentandcontemporaryrelevance[J].JMotBehav,2000,32(1):5771.
[12]HeiderscheitBC.Movementvariabilityasaclinicalmeasureforlocomotion[J].JApplBiomech,2000,16:419427.
[13]VanDienJH,DekkersJJ,GroenV,etal.Withinsubjectvariabilityinlowbackloadinarepetitivelyperformed,mildlyconstrainedliftingtask[J].Spine,2001,26(16):17991804.
(陕西学前师范学院,陕西 西安 710100)
摘 要:平均差优于标准差这一观点一直以来都存在一定支持者,但仔细分析不难发现这一观点根本不能成立。从计算方式、数学关系、敏感性和正态分布下的换算公式推导四个方面对标准差与平均差展开研究,可以得出以下结论:第一,标准差与平均差有着统一公式和数学关系。第二,平均差计算过程有低估变异性问题。第三,平均差难于动摇标准差在统计学中的重要地位。
关键词 :统计学;平均差;标准差
中图分类号:O212文献标识码:A文章编号:1673-260X(2015)08-0003-02
1 问题的提出
标准差与平均差都是人为构造出来,使用统计学手段,反映统计样本或总体的离散程度的统计指标。一般来说,标准差在实际应用中要比后者广泛一些。多数国内统计学教材在编写时对两者采取了平行介绍的方式进行处理,并从实用角度出发,偏重介绍应用更广的标准差,并认为平均差计算存在不便。对此,十余年来一直有学者提出反驳意见,认为平均差优于标准差,相关论文和著作较多但观点较为相似,试总结如下:
(1)认为在数字计算时,平均差计算不存在乘方和开方计算,计算量低于标准差,由此认为平均差更简便,并使用例题举证;
(2)从自己的实际工作经验出发,发现标准差计算结果往往大于平均差,由此提出观点,认为标准差存在高估变异性的问题,并使用例题举证;
(3)从测量离差一般水平的思路出发,进而认为标准差是平均差的代替,所以标准差不如平均差;
(4)认为在高性能计算机大量普及的情况下,平均差即使有计算不便,但两者在计算上的差异是可以被忽略的,使用哪种区别不大。
由以上观点,进一步得出了平均差优于标准差,并且应当大力推广平均差的结论。
2 平均差优于标准差的观点不能成立
对于此种观点,笔者作为一名从事高校统计学教学的教师,委实不敢苟同,现将以上所列论点进行逐条分析:
(1)对于平均差计算更简便的问题,上述论证只能说明平均差在进行具体数字的手工算术计算时计算量要小于标准差,而对代数计算只字不提,对于具体数字来说,绝对值计算不需要讨论正负问题,当然计算量要小,但对于不涉及具体数字的代数计算来说,绝对值的讨论当然要复杂一些。平均差计算更简便的观点只在算术领域成立,在代数领域难以成立。
(2)标准差计算结果往往大于平均差是一个实际计算观察的结果,而且也确实符合实际情况,后面笔者也会对此进行代数证明。但是标准差计算结果大于等于平均差这一现象其实无法得出标准差存在高估变异性的问题的结论,只能说明两者对变异性的测量存在差异,到底是标准差高估了变异性还是平均差低估了变异性,这一现象是不足以说明的。
(3)与其说是标准差代替了平均差,不如说是由于标准差的优点获得了广泛使用,变异指标的意义在于衡量分布的变异性,并不是说越接近离差的一般水平变异指标就越好。
(4)即使在高性能计算机大量普及的情况下,平均差与标准差的差异也是不能忽视的。首先是标准差函数可导,平均差函数不可导,这一区别导致两者在微积分处理上存在巨大差异。其次,标准差对应的是二阶矩,对所有平方可积的函数适用,平均差对应的是另一种范数,其适用函数的空间不同于平方可积函数的空间。而平方可积函数的空间具有许多更好的性质。平均差与标准差函数的可导性和可积空间上有很大差异,没有了导数存在且连续的标准差,大量的数学推导都无法展开,所以建立在标准差基础上的数理统计体系很难使用平均差代替。因此平均差与标准差的差异不光在算术计算上,更重要的是在数理推导上的差异,而后者与计算机性能的高低并没有太大关系。
综上所述,认为平均差优于标准差的观点无法成立。
3 平均差与标准差的数理关系分析
3。1 平均差与标准差的计算方式的联系
平均差和标准差的计算方式都是以离差概念为基础的,离差是单项数值与平均值之间的差,公式可写作,离差是一个向量,其绝对取值代表了单项数值偏离平均值的程度,正负号代表了单项数值偏离平均值的方向,如果想要构造一个衡量总体变异性的统计指标,使用离差来作为构造的基础是很自然的选择,但是也很容易证明,由于离差取值的方向性,其数学期望恒为零。因此,取消离差的正负号后再来构造统计指标才有意义,从这个角度出发,我们可以构造出方差和标准差两种指标,即和。前者是离差平方的数学期望,后者是离差绝对值的数学期望,而方差本身计算出来的指标要比统计量高一阶,所以可以对其求平方根进行标准化,就得到了标准差。由此可见,平均差和标准差的计算方式存在着密切联系,其中,平均差的计算公式可以转化为,而标准差的计算公式可以转化为,所以,平均差和标准差的计算公式可以统一为:,其中平均差为该统计量取一阶的结果,标准差为该统计量取二阶的结果。因此,平均差和标准差应当看作同源、同类但不同阶的统计量,不存在谁是谁的替代品的问题。
3。2 平均差与标准差的相互关系
在得出平均差与标准差的一般公式之后,我们可以看出两者的计算过程存在比较紧密的关联,但两者呈现的数量关系却无法直接显现,前面提到,实际数据观察似乎支持标准差大于等于平均差的观点,但直接对两者进行相减的话,绝对值号又影响了进一步的讨论。但是,既然平均差和标准差都大于等于零,如果可以证明标准差的平方即方差与平均差的平方之差大于等于零,其实也就证明了标准差大于等于平均差。计算如下:,所以标准差确实大于等于平均差,其中只有在离差绝对值的方差等于零时两者相等。但这一结果不能说明标准差高估了变异性,前面的证明可以看出,方差之中包含了平均差包含的所有用离差反映的变量值的变异性信息之余,还包含了离差本身的变异性信息,进一步来说,既然方差可以被分解为变量值的平均差的平方与离差绝对值的方差之和,那么离差绝对值的方差也可以被分解为离差平均差的平方与离差的离差绝对值的方差之和,由此可以形成一个关于平均差的无穷级数,而这一无穷级数之和收敛于变量值的方差。由此可以看出,其实方差包含了变量值各级离差的平均差所反映的所有变异性,而且这些变异性之间不存在重复计算问题,而标准差正是方差的标准化,所以,并非是标准差高估了变量的变异性,而是平均差只测量出了变量值包含的所有变异性的一部分。
3。3 平均差函数与标准差函数对变异性敏感程度的比较
如果从平均数的角度观察平均差函数与标准差函数,不难发现其中的一些区别,平均差函数可做如下变化:A.D.=,可以看出平均差函数即离差的简单算术平均数,离差的大小并不影响其权重,所以对于平均差来说,极端变量值的变异性被同等看待了。而标准差可做如下变化:,可以看出根号内的公式可以看成以离差本身大小为权重的加权算术平均数,所以越极端的变量值会被给予越多的关注,这一点更符合人们对于数据变异性的直接感觉。可以直观的构造如下两组数说明这种区别:1,1,0,-1,-1和2,0,0,0,-2,两者拥有相同的均值0和平均差0。8,但直观感觉前者的变异性较小,如果使用标准差,则前者标准差为0。89,后者为1。26,就有效的衡量出了这种变异性。
3。4 在正态分布下平均差与标准差的取值讨论
如假设X服从正态分布,,则有,由此可以看出,在正态分布下,平均差与标准差的取值存在稳定的倍数关系。同理其实不难证明,在参数确定的特定分布下,平均差与标准差的取值都存在该分布特有的稳定关系。至于是否可以在具体数字计算时结合这种稳定关系,使用平均差估算标准差,还有待后续研究证明其可靠性。
4 总结
由以上分析可见,标准差与平均差是有着统一公式和数学关系的两种变异指标,并不存在排他性问题,其中平均差在具体数字计算时有一定优势,但不利于代数运算和数学推导,同时平均差在计算变异性时存在信息损失低估变异性的问题,因此难于动摇标准差在统计学中的重要地位。
参考文献:
(1)韩兆洲,杨林涛。极差、平均差和标准差之间测度关系研究[J]。统计与信息论坛,2008(04)。
(2)桂文林,伍超标。标准差和平均差的内在关系及应用研究[J]。数理统计与管理,2005(02)。
(3)赵海燕,陈立秋,张晓方。平均差和标准差在变异指标中的代表性浅议[J]。统计与咨询,2002(04)。
【关键词】统计学;财务管理;财务能力分析
统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。由于统计学不仅运用了数学知识而且也涉及到许多其他专业的只是,因此统计学被应用到了许多学科的各个领域。随着统计学的发展,统计学作为一种有力的分析工具逐渐被应用于各个领域,财务管理在公司运行中一直承担着重要的角色,而且财务管理涉及到许多数据,作为分析数据的工具,统计学必然要运用于财务管理。
一、统计学在财务管理学习中的应用
(一)利用概率分布图进行数据分析
在财务管理中分析数据时有时需要做概率分布图,如通过收益率概率分布图可以得到各种可能结果的收益率,进而进行更好的财务决策,风险相同的情况下选择收益较高的方案。概率分布图越集中、越尖,那么预期值与实际结果接近的可能性越大,背离预期收益的可能性越小。由此,概率分布越集中,股票对应的风险越小。
(二)预测企业的收益率
通过企业以往的相关数据,建立模型,可以预测企业未来的收益率,因此便可以帮助企业更好地投资或者选择经营方案。
(三)通过计算标准差和变异系数来判断
数据的精确度利用标准差这一度量概率分布密度的指标来准确度量数据的精确性,标准差反映的是样本内的个体的离散程度,通常作为判断分布程度的指标,标准差是方差的平方根,在企业进行投资的过程中,需要根据标准差的大小来判断收益的稳定性,一般情况下,标准差越大,代表企业的回报稳定性越差,投资该项目的风险越高,相反,标准差数值越小,表明企业投资该项目的回报稳定性越好,投资该项目的风险越低。同样标准差也可以用于企业资本结构分析,基金股票分析等。然而,有时候进行比较的两组数据的参考标准相差过大或者测量尺度相差太大,此时运用标准差进行比较便没有太大意义,误差会很大,因此需要用变异系数,所谓变异系数是指用原始数据的标准差除以原始数据的平均数,得到的数值,用变异系数进行比较可以排除标准或者参考性不一致的特点,反映数据离散程度的绝对值,其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响。变异系数可以同时反映收益和风险,因此,故在处理两个或多个具有显著不同预期收益的投资项目时,他是一个更好的风险度量指数。
(四)在财务能力分析中的应用
1.偿债能力分析
企业偿债能力就是指企业偿还账务的能力,企业偿还债务能力的高低直接可以体现企业的财务风险的大小。按债务偿还期限的长短,又将其分为短期偿债能力与长期偿债能力。短期偿债能力通常设置以下指标:流动比率;速动或酸性测验比率;现金比率。长期偿债能力指标有:已获利息倍数;资产负债率;产权比率;有形净值债务率。
2.盈利能力分析
盈利能力分析是指企业获取营利或者利润的能力,以及对经营成果分配的能力,企业盈利能力的高低直接体现了企业的财务结构和经营成果,盈利能力好的企业具有更优良的财务结构和经营能力。企业盈利能力高意味着企业的经营与规模就会有更好的发展。一般企业盈利能力指标有:销售利润率;成本费用利润率;资产总额利润率;资本金利润率;权益利润率。股票上市公司除上述指标外,还可借助以下指标:每股盈余;每股股利;市盈率;股东权益报酬率;股利支付率;留存盈利比率。
3.资产运用效率分析
资产运用效率是指企业对自身资产的运用能力,良好的资产运用效率可以使企业的现金流和长期资本得到良好的循环和回报,资产运用效率体现的是企业的利润获取能力,资产运用效率越高表明企业的资产周转速度和质量越高,获取利润的能力越大,反之,企业的利润也就越低。资产运用效率指标有:存货周转率;应收帐款周转率;流动资产周转率;固定资产周转率;总资产周转率。
4.综合财务能力分析
综合财务能力分析是结合企业各项财务状况和经营成果的总体的变化趋势进行综合分析,得出企业整体的财务状况,上述的三个指标只是从某一方面来判断企业的财务状况而综合财务分析是进行的整体的全面的系统的分析,具有更高的参考价值。综合财务能力分析的指标有杜邦模型中的权益报酬率和计分综合分析法的实际得分。以上企业财务能力分析指标的计算和分析都离不开统计学的相关知识和工具。
二、在财务管理学习中如何更好地学习统计学
(一)重视统计学的学习
由于财务管理专业的学生对于统计学的认识程度不够,无法深刻认识到统计学在财务管理学习中的重要性以及掌握好统计学的方法论对于财务管理数据处理的便利性,大家只是普遍认为统计学是统计学专业应该掌握的知识,因此大家往往不会认真去学习统计学,而且财经类学院开设的统计学课程往往只是把统计学比较简单的只是或者与财务管理比较相关的知识介绍给大家,往往学习程度太浅。因此,为了提高学生的统计学知识,更好地学习财务管理,必须强调统计学专业的重要性,把统计学重视起来,才能更好地在财务管理学习中运用好统计学,在企业财务分析中,运用好各种指标。
(二)将统计学与财务管理更好地融合起来
长期以来,财经类开设的统计学课程主要是介绍统计学的基本原理和基本方法,以,统计整理,统计调查,统计指教,综合指标,时间序列,抽样推断,相关分析等社会经济统计学内容为主,与财经类学科的专业知识联系不够,而且大多数情况下,只是选择性地讲解一部分知识,原理性的内容有时候并不会去介绍或者学习。如此以来,便不能把统计学只是学好,只是学个皮毛。统计学只是介绍一种方法,如何将这种方法运用到财务管理中,需要将统计学的方法论与具体的实例或者案例相结合,如此以来便能更好地理解统计学与财务管理的内容,既能学会处理数据的方法,又能更好地理解财务状况。如用资产负债表和利润表中的数据项目等各种指标来学习了解综合指标;销售预测和资金需求量的预测可以作为介绍学习动态数列的趋势预测法的案例;结合投资决策的实例来学习了解标志变异指标。结合财务管理专业的背景,通过分析和解决财务问题的实例,既能加深对财务管理理论知识的理解,又能提高利用统计学只是进行财务问题分析的实际操作能力。
【参考文献】
[1]蒋惠凤.财务管理专业统计学教学模式研究[J].新课程(教育学术),2011,07:175-176.
[2]秦红霞.统计学对财务管理学习的影响[J].统计与管理,2014,07:8-9.
[3]刘杰.企业财务部门统计学调查工作管理研究[J].现代经济信息,2014,22:28.
[关键词]总体标准差;参数估计;无偏估计;系统误差;随机误差;综合误差;测量不确定度;自由度;标准差系数
[中图分类号]O 212 [文献标识码]A [文章编号]1005-6432(2013)10-0023-011
1 引 言
在科学实验中,测量可分为常量测量和变量测量两大类。物理量的变化量远小于测量仪器误差范围的测量称为常量测量(又称经典测量、基础测量),其核心理论是误差理论[1-3],误差理论的基本单元是误差元(测量值减真值)。测量仪器误差范围远小于物理量的变化量的测量称为变量测量(又称统计测量),其核心理论是数理统计理论(概率论是其理论基础),数理统计理论的基本单元是偏差元(又称离差元,测量值减数学期望)。标准差(standard deviation,又称标准偏差、均方差,其英文缩写词为SD,此术语1893年由卡尔·皮尔逊首创)是用来衡量一组测量数据的离散程度的统计量,它反映了随机变量的取值与其数学期望的偏离程度。经典测量学只能处理常量测量问题,而当今频域界的频率稳定度测量(常用阿伦方差表示)则属于变量测量。
等精度测量(equally accurate measurement)是指在测量条件(包括测量仪器的准确度、观测者的技术水平、环境条件影响及测量方法等)不变的情况下,对某一被测物理量所进行多次测量的一种方法。在实际测量工作中,由相同设备、相同人员、相同环境和相同方法所获得的各测量值可视为是等精度测量值。文献[4]介绍了流量计量中的计量学基本原则——等精度传递理论。
在测量实践中,有时为了获得准确度更高的测量结果,往往要求在不同的测量环境条件下,使用不同的测量仪器,选用不同的测量者和不同的测量次数,采用不同的测量方法进行对比测量,这种测量方法称为不等精度测量(unequally accurate measurement)。不等精度测量的不确定度应采用加权方式计算[5-6]。
若无特别说明,本文中所涉及的测量均指等精度测量。
2 误差的种类和应用
误差公理认为误差自始至终存在于一切科学实验和测量之中,是不可避免的,即误差无处不在,真值是不可知的。在实际应用工作中,可用约定真值或相对真值来代替理论概念中的理想真值。约定真值一般包括约定值、指定值和最佳估计值三种类型。
测量误差最基本的表示方法有如下三种:①绝对误差=测量值-真值,绝对误差通常简称为误差(即真误差);②相对误差=绝对误差/真值≈绝对误差/测量值;③引用误差=示值误差/测量范围上限(或全量程)。残差(又称剩余误差)=测量值-估计值,残差可认为是真误差的估计值。绝对误差和相对误差通常用于单值点测量误差的表示,而对于具有连续刻度和多档量程的测量仪器的误差则通常采用引用误差来表示。
按误差的特点和性质可将其分为粗大误差(parasitic error)、系统误差(systematic error)和随机误差(random error)三大类。可消除的粗大误差(又称过失误差,没有规律可循)应予全部剔除,系统误差(又称规律误差、理论误差或方法误差,一个定值或服从函数规律)反映测量的正确度(correctness),随机误差(旧称偶然误差、不定误差,服从统计规律,大多数服从正态分布规律)反映测量的精密度(precision),测量的准确度(accuracy,又译为精确度)则是用综合误差(即测量不确定度)来衡量的,有时也用极限误差来衡量测量的准确度。逐项获得测量的系统误差和随机误差,采用误差合成的方法(各系统误差绝对值相加得系统误差范围,各随机误差均方根合成则得随机误差范围。系统误差范围加随机误差范围可得综合误差范围)合成综合误差,它表征了测量结果与真值的不一致程度。
泛指性的“精度”一词常被用作“精确度(即准确度)”或“精密度”的替代词,因其并无明确和严格的科学定义,故在学术论文中应慎用或弃用。
下面简要介绍一下随机误差所遵循的一些基本统计规律,首先需要介绍中心极限定理:
当测量次数n无限增大时,在真误差序列中,若比某真误差绝对值大的误差和比其绝对值小的误差出现的概率相等,则称该真误差为或然误差(probable error,又称概率误差,它在衡量射击精密度时尤其显得重要),记作ρ。
作为精密度的评定指标,中误差最为常用,因为它反映了真误差分布的离散程度。
通常以2倍或3倍的中误差作为随机误差的极限误差(limit error),其置信概率分别是9544%(2σ准则)和9973%(3σ准则)。如果某个误差超过了极限误差,就可以认为它是粗大误差而被剔除,其相应的测量值应舍弃不用。
对于某个测量值,通常采用相对中误差(即中误差和测量值之比,又称相对标准差)配合中误差来衡量,它能更全面地表达测量值的好坏。
英国物理学家、化学家和数学家瑞利勋爵(Lord Rayleigh,1842—1919)以严谨、广博和精深而著称,他善于利用简单的设备做实验而能获得十分精确的数据。他因对气体密度的精确研究并因此参与发现稀有气体(旧称惰性气体)氩而荣获1904年诺贝尔物理学奖。1892年瑞利在研究氮气时发现[7]:从液态空气中分馏出来的氮,其密度为12572 kg/m3,而用化学方法直接从亚硝酸铵中得到的氮,其密度则为12508 kg/m3(现在的最权威数据125046 kg/m3是基于0 ℃和01 MPa时),前者比后者大05117%,因实验中已排除了粗大误差的可能,这一差异已远远超出随机误差的正常范围(现在通过t检验准则可以判定当时瑞利测得的空气中氮的密度数据是存在系统误差的)。英国物理化学家和放射化学家拉姆赛(Sir William Ramsay,1852—1916,1904年诺贝尔化学奖获得者)注意到这个问题并要求与瑞利合作对此问题展开共同研究,最终他们利用光谱分析法于1894年8月13日发现了第一种稀有气体─氩(Ar)。氩元素的发现是科学家们注意测量结果中的微小误差(实际上是系统误差)而取得重大科学发现的经典范例,是名副其实的“第三位小数”的胜利[8]。随后,其他稀有气体氦(He,1895年3月)、氪(Kr,1898年5月)、氖(Ne,1898年6月)、氙(Xe,1898年7月)、氡(Rn,1899年,继钋Po、镭Ra和锕Ac之后第4个被发现的天然放射性元素)陆续被拉姆赛等人所发现,稀有气体的发现完善和发展了俄国化学家门捷列夫(1834—1907)的元素周期表(1869年)。
3 统计量的概率分布类型
离散型统计量服从的概率分布类型主要有:①退化分布(又称单点分布);②伯努利(瑞士数学家,Jocob Bernoulli,1654—1705)分布(又称两点分布);③二项分布:包括超几何分布(又衍生出负超几何分布)、β-二项分布和离散均匀分布;④泊松分布:包括帕斯卡(法国数学家和物理学家,Blaise Pascal,1623—1662)分布(又称负二项分布)和几何分布;⑤对数分布等。
随机误差大多服从正态分布或标准正态分布,服从正态分布的随机误差具有单峰性、对称性、有界性和抵偿性。正态分布是随机误差遵循的最普遍的一种分布规律,但不是唯一的分布规律。随机误差服从的常见非正态分布(又称偏态分布)主要有:①均匀分布(又称矩形分布、等概率分布);②伽马分布(Γ-分布):包括指数分布(两个相互独立且都服从指数分布的随机变量之和服从广义指数分布)、厄兰(丹麦数学家和统计学家,Agner Krarup Erlang,1878—1929)分布和τ-分布(χ2-分布是其特例)等特例;③χ-分布:包括反射正态分布、瑞利分布和麦克斯韦(英国物理学家和数学家,James Clerk Maxwell,1831—1879)分布等特例,广义瑞利分布又称莱斯(美国通信理论专家,Stephen " Steve" Oswald Rice,1907—1986)分布(Rice distribution or Rician distribution),当v=0时莱斯分布退化为瑞利分布;④贝塔分布(B-分布);⑤F-分布:1934年美国数学家和统计学家斯内德克(George Waddel Snedecor,1881—1974)首创,为彰显英国统计学家和遗传学家费歇尔(Sir Ronald Aylmer Fisher,1890—1962,方差分析的发明者)的贡献,后来以其名字命名;⑥t-分布(又称学生氏分布):1908年由英格兰统计学家戈塞特(William Sealy Gosset,1876—1937)首创,因他以Student为笔名而得名;⑦对数正态分布;⑧极值分布:包括重指数分布和威布尔(瑞典数学家,Ernst Hjalmar Waloddi Weibull,1887—1979)─格涅坚科分布(参见本文第73节“极差法”)等;⑨柯西(法国数学家,Augustin Louis Cauchy,1789—1857)分布;⑩辛普森(英国数学家,Tomas Simpson,1710—1761)分布(又称三角形分布)等。此外还有反正弦分布、截尾正态分布、双峰正态分布、梯形分布、直角分布、椭圆分布和双三角分布等。多维概率分布则主要有:①多项分布;②均匀分布;③n(n≥2)维正态分布等。
因彼得斯公式法、极差法、最大误差法、最大残差法和最大方差法均只给出了正态分布下的标准差估计的系数因子,故它们一般不适用于非正态分布时的情形。
4 统计推断
统计推断是指根据随机性的观测数据(样本)以及问题的条件和假设(模型),对未知事物作出的、以概率形式表述的推断。统计推断是由样本的信息来推测总体(又称母体)性能的一种方法,它是数理统计学的主要任务,其理论和方法构成数理统计学的主要内容。统计推断分为参数估计和假设检验两大类问题。参数估计是假设检验的前提,没有参数估计,也就无法完成假设检验。
41 参数估计
运用从总体独立抽取的随机样本对总体分布中的未知参数做出估计,称为数理统计学上的参数估计,它是统计推断的一种基本方法。参数估计方法主要分为点估计法(根据样本构造一个统计量,用以对总体参数进行估计)和区间估计法(又称范围估计法,主要是根据置信度求置信区间)两大类。点估计构造统计量(估计量)的常用方法有:①顺序统计量法(又称次序统计量法):主要包括最大顺序统计量法和最小顺序统计量法两种。②贝叶斯法(又称贝叶斯公式、逆概率公式、事后概率公式或原因概率公式):1763年英国统计学家贝叶斯(Thomas Bayes,1702—1761)在其遗作《论有关机遇问题的求解》一文中首先提出。③最小二乘估计法(又称最小平方估计法):它可使残差的平方和为最小,1795年德国数学家、天文学家和物理学家高斯(Johann Carl Friedrich Gauss,1777—1855)首先提出其方法,1806年法国数学家勒让德(Adrien-Marie Legendre,1752—1833)首先用公式表示出最小二乘原理,1900年由俄国数学家马尔科夫(Andrey Andreyevich Markov,1856—1922)加以发展。④矩估计法(又称矩法估计、数字特征法):以样本矩的某一函数代替总体矩的同一函数来构造估计量的方法称为矩估计法,1894年英国数学家和统计学家卡尔·皮尔逊(Karl Pearson,1857—1936,被誉为“现代统计学之父”)首先提出。一个样本可确定一个经验分布函数,由这个经验分布函数可确定样本的各阶矩。称统计量S=1nni=1Xi为子样一阶原点矩(简称一阶矩,即子样均值);称统计量Sk=1nni=1Xki为子样k阶矩;称统计量S=1nni=1(Xi-)2为子样二阶中心矩(即子样方差);称统计量Sk=1nni=1(Xi-)k为子样k阶中心矩。⑤最小χ2法:χ2检验由卡尔·皮尔逊于1900年首先提出,故χ2统计量又称皮尔逊公式。⑥最大似然估计法(maximum likelihood estimation method,又称极大似然估计法):一种重要而普遍的统计量估计方法,其基本思想始于1821年高斯提出的误差理论,1912—1922年英国统计学家和遗传学家费歇尔首先将其应用于参数估计并证明了它的一些性质[9-10],其后他在工作中加以发展并使其臻于完善[11]。该估计方法在统计推断中无须有关事前概率的信息,克服了贝叶斯法(Bayes estimation method)的致命弱点,是统计学史上的一大突破。标准差σ的最大似然估计值是=1nni=1(xi-)2=1nni=1v2i, 其中=1nni=1xi。与最大似然估计法相类似的统计估计方法还有极小极大后验估计法、最小风险法和极小化极大熵法等。
常用于衡量点估计法是否优良的五大准则是:无偏性[12]、有效性、一致性(又称相合性)[13]、渐近性和充分性。无偏估计和一致估计(又称相合估计、相容估计)都属于优良点估计法。衡量区间估计法的优良准则有一致最精确准则、一致最精确无偏性准则和平均长度最短准则等。如果把参数估计用于统计决策,还可采用统计决策理论中的优良准则(如容许性准则、最小化最大准则、贝叶斯准则和最优同变性准则等)。
标准差的现代统计估计方法通常可将其归纳为一般估计方法和稳健估计(robust estimation,又称抗差估计)方法两大类[14]。一般估计方法(均属标准不确定度分量的A类评定方法)主要包括贝塞尔公式法、彼得斯公式法、极差法、最大误差法、最大残差法、较差法和最大方差法等,其中贝塞尔公式法最为常用,极差法、彼得斯公式法和最大残差法次之,最大误差法特别适用于比较特殊的场合(如一次性破坏实验等),较差法和最大方差法的应用场合则相对较少。稳健估计方法基本上可分为三类:M估计(经典最大似然估计法的推广,称为广义最大似然估计法)、L估计(即顺序统计量线性组合估计)和R估计(即秩估计,来源于秩统计检验)。
估计量的数学期望等于被估计参数,则称其为无偏估计,否则就是有偏估计。无偏估计的系统误差为零,其误差用随机误差来衡量;有偏估计的误差则用系统误差和随机误差的合成(即综合误差)来衡量。如今,随着计算机的日益普及和各类数学统计软件(包括专用数学统计软件,如SPSS、SAS和BMDP等)的广泛应用,数据计算繁琐一些已无技术障碍可言。实验测量数据的获得都要付出一定的人力、物力和财力,追求其准确可靠才是其最高目标,因此有偏估计的系统误差应尽可能地予以剔除。对于无偏估计来说,其统计量的方差越小则越好(表示其精密度和有效性越高)。
42 假设检验
假设检验(又称显著性经验、统计检验)一般分为参数检验(适用于总体分布形式已知的情形)和总体分布类型检验(又称分布拟合检验)两大类。参数检验方法主要有u检验法(又称z检验法,即正态分布检验法)、t检验法、χ2检验法(又称皮尔逊检验法)和F检验法(又称费歇尔检验法)等;总体分布类型检验方法主要有概率纸法(包括正态概率纸、对数正态概率纸、威布尔概率纸和二项概率纸等)和χ2检验法(适用于任意分布)等。在正态性检验法中,以夏皮罗(美国统计学家,Samuel Sanford Shapiro,1930—)─威尔克(加拿大统计学家,Martin Bradbury Wilk,19221218—)检验法(1965年,又称W检验,适用于样本数n≤50时的情形)[15]、达戈斯提诺(美国生物统计学家,Ralph BDAgostino, Jr,19290331—20010818)检验法(1971年,又称D检验,一种比较精确的正态检验法)[16]和夏皮罗─弗朗西亚(Shapiro-Francia)检验法(1972年,又称W′检验,适用于样本数50 两个样本是否来自于同分布总体的假设检验方法主要有符号检验法和秩和检验法等。
当未知总体标准差σ时,判别粗大误差的准则(即异常数据取舍的检验方法)主要有:①格拉布斯准则:1950年由美国统计学家格拉布斯(Frank Ephraim Grubbs,1913—2000)首创[18],并于1969年加以发展[19];②狄克逊准则(又称Q检验准则):1950年由美国统计学家狄克逊(Wilfred Joseph Dixon,1915—2008)首创[20],并于1951年和1953年加以改进[21-23];③偏度─峰度检验准则:偏度检验法适用于单侧情形,峰度检验法则适用于双侧情形[24];④罗曼诺夫斯基准则(又称t检验准则、3S检验准则):前苏联数理统计学家、塔什干数学学派创始人罗曼诺夫斯基(Vsevelod Ivanovich Romanovsky,1879—1954)首创,其检验效果最好[25];⑤3σ准则:仅早期采用,只适用于大样本数时的情形,因其理论上欠严谨且样本数n
估计标准差s=1n-2ni=1(y-)2主要应用于回归分析和假设检验中[34]。
5 测量不确定度
测量不确定度(measurement uncertainty,简称不确定度)是测量结果带有的一个非负参数,用以表征合理地赋予被测量值的分散性。它是说明测量水平的主要指标,是表示测量质量的重要依据。不确定度越小,测量结果的质量就越高,使用价值就越大。“不确定度”一词起源于1927年德国理论物理学家和哲学家海森堡(Werner Karl Heisenberg,1901—1976,1932年度诺贝尔物理学奖获得者)在量子力学中提出的不确定度关系,即著名的测不准原理(uncertainty principle)。自国际计量委员会CIPM(法文Comité International des Poids et Mesures)授权国际计量局BIPM(法文Bureau International des Poids et Mesures)于1980年10月提出《实验不确定度表示建议书INC-1》(1992年被纳入国际标准ISO 10012,1997年和2003年分别予以修订,中国国家标准GB/T 19022—2003等同采用ISO 10012 ∶ 2003[35])以后,经过30多年的研究和发展,现代不确定度理论现已形成较为完整的理论体系。
根据2008年版《测量不确定度表示指南》(GUM=Guide to the Expression of Uncertainty in Measurement)中的规定:不确定度可以用测量结果的标准差(即标准不确定度,它具有可传播性。当一个测量结果用于下一个测量时,其不确定度可作为下一个测量结果不确定度的分量,这就是不确定度的可传播性)表示,也可以用标准差的倍数或说明其置信水平区间的半宽度(即扩展不确定度expanded uncertainty,曾译为延伸不确定度、伸展不确定度)表示。无论采用哪种方法,都需要获得标准差的数值。
不确定度一般由若干分量组成,其中一些分量可根据一系列测量值的统计分布,按不确定度的A类评定方法进行评定(标准不确定度基于统计方法所进行的评定称为A类评定,又称统计不确定度),并用实验标准差(即有限次测量时总体标准差的估计值,又称样本标准差、子样标准差,主要应用于抽样推断和假设检验中)和自由度表征(必要时应给出其协方差)。而另一些分量则可根据经验或其他信息假设的概率分布,按不确定度的B类评定方法进行评定[标准不确定度基于非统计方法(技术规范、实践经验和科学知识等)所进行的评定称为B类评定,又称非统计不确定度],也用实验标准差表征(必要时应给出其协方差),一般情况下可以不给出其自由度。
贝塞尔公式法和极差法是两种主要的标准不确定度分量的A类评定方法[36-43],其中文献[39]给出的结论是:①当A类评定不确定度分量不是合成标准不确定度中唯一占优势的分量时,则无论测量次数多少(笔者注:因合成时采用方差相加的方法),(修正前)贝塞尔公式法优于极差法。②当A类评定不确定度分量是合成标准不确定度中唯一占优势的分量时,则两种方法的优劣与测量次数有关:当测量次数n10”则更为准确),(修正前)贝塞尔公式法优于极差法。
标准不确定度分量的B类评定方法主要有倍数法、正态分布法、均匀分布法(修约误差、修约前的被修约值、数字仪表的量化误差等均服从此类分布)、反正弦分布法、二点分布法、梯形分布法、三角分布法和投影分布法等[44-46],它更多的是依赖于经验的积累和判断。B类评定方法常应用于计量基准标准、仪器研制和在无法对比测量的情况下。
不确定度报告应该包括测量模型、估计值、测量模型中与各个量相关联的测量不确定度、协方差、所用的概率密度函数的类型、自由度、测量不确定度的评定类型和包含因子等。
在实际应用工作中,有效数字的正确取位十分重要,但这个问题却往往被忽视。测量结果总是以数字形式出现的,而能准确反映测量结果的是其有效数字。有效数字的末位数总是由下一位数进位或舍去而得来的,这就是数字修约。有效数字的定义是:一个数的修约误差不大于其末位数的半个单位,则该数的左边第一个非零数字起至右边最末一位数字都是其有效数字。不确定度的有效数字只能取1位或2位[47-49]。
6 自由度
自由度(degrees of freedom)的定义是:在方差的计算中,和的项数减去对和的限制数[36,50]。自由度反映了实验标准差的可信赖程度,自由度越大,实验标准差的可信赖程度就越高。由于不确定度是用标准差来表征的,故自由度可用于衡量不确定度评定的质量,它也是计算扩展不确定度的依据。当对标准差σ取A类评定的标准不确定度s的值时,不确定度的自由度计算公式为[46]:
式(6-1)是自由度估计值的计算公式(此估计值与理论值相比偏小,随着样本数n的增大,其估计值越来越接近于理论实际值),其中D(X)/E(X)为统计量X的相对标准差,u(x)为被测量x的标准不确定度,u[u(x)]为标准不确定度u(x)的标准不确定度。显然,自由度与标准不确定度的相对标准不确定度有关,即自由度与不确定度的不确定度有关,或者说自由度是一种二阶不确定度。
不确定度是测量结果的一个参数,而自由度则是不确定度的一个参数,它表征了所给不确定度的可信赖程度。算术平均值标准差的自由度和单次测量标准差的自由度是相同的。
自由度具有尺度变换下的不变性(即随机变量乘以非零常数,其自由度不变)。对于合并样本标准差,其自由度为各组自由度之和,即v=m(n-1)。当用测量所得的n组数据按最小二乘法拟合的校准曲线确定t个被测量值时,其自由度v=n-t;若t个被测量值之间另有r个约束条件,则其自由度v=n-t-r。
各种估计总体标准差方法的自由度如下表所示。
每个不确定度都对应着一个自由度,按A类评定的标准不确定度分量的自由度就是实验标准差的自由度。合成标准不确定度uc(y)的自由度称为有效自由度veff,它说明了评定uc(y)的可信赖程度,veff越大,表示评定的uc(y)越可信赖。一般情况下,按B类评定的标准不确定度分量可以不给出其自由度。但在以下情况时需要计算有效自由度veff:①当需要评定扩展不确定度Up为求得包含因子kp时;②当用户为了解所评定的不确定度的可信赖程度而提出此要求时。
7 标准不确定度的A类评定方法
标准差是评定测量结果精密度的一个极其重要的参数,关于各种估计总体标准差统计方法的精密度分析,前人已多有研究[52-56],但都缺乏深度和广度,其系统性和准确性也不够(有时甚至出现一些差错和遗漏,详见下文中的相关描述)。下面笔者将详细阐述各种估计总体标准差统计方法的由来和原理,严谨推导出其标准差系数的计算公式,力图以科学、严谨和求实的态度,分别对其系统地做出全面而准确的评介、对比和分析。
71 贝塞尔公式法
贝塞尔公式法(Bessel formula method)[57-63]是一种最为常见的估计总体标准差的统计方法。根据nj, k=1j≠kδjδk=0来推导贝塞尔公式长期以来被一些学者所认同,现已证明其为伪证[64-65]。笔者现根据误差理论、概率论和数理统计学中的基础知识,从误差和标准差的本质和作用入手,利用数学期望和方差公式,采用算术平均值的标准差来推导出贝塞尔公式。
n次测量值的算术平均值为:=1nni=1xi
算术平均值是μ的一致最小方差无偏估计,且不存在比它一致性更好的其他估计量。
德国天文学家和数学家贝塞尔(Friedrich Wilhelm Bessel,17840722—18460317)是天体测量学的奠基人之一,以其专著《天文学基础》(1818年)为标志发展了实验天文学,他重新订正布拉德雷(英国天文学家,James Bradley,1693—1762)星表并编制基本星表(后人加以扩充后成为《波恩巡天星表》),测定恒星视差(1838年)并预言暗伴星的存在,导出修正子午环安装误差的贝塞尔公式[即式(71-4)],导出用于天文计算的内插法贝塞尔公式(此式中的系数被称为贝塞尔系数),编制大气折射表并导出大气折射公式。首创贝塞尔岁首(又称贝塞尔年首)、贝塞尔假年(又称贝塞尔年)、贝塞尔日数(又称贝塞尔星数)和贝塞尔要素等概念,沿用至今。其研究成果还有贝塞尔方程(1817—1824,一类二阶常微分方程)、贝塞尔不等式(1828年)和贝塞尔地球椭球体(1841年)等。1938年2月24日发现的国际编号为1552(1938DE)号的小行星后被命名为“贝塞尔星(Bessel)”,这是对他最好的纪念和褒奖。
贝塞尔方程两个独立的解分别称为第一类贝塞尔函数Jn(x)和第二类贝塞尔函数Yn(x),Hn(x)=Jn(x)±iYn(x)则称为第三类贝塞尔函数,其中第二类贝塞尔函数又称为诺伊曼(Carl Gottfried Neumann,1832—1925)函数或韦伯(Heinrich Martin Weber,1842—1913)函数,第三类贝塞尔函数又称为汉克尔(Hermann Hankel,1839—1873)函数。诺伊曼、韦伯和汉克尔均为德国数学家。
在规范化的常规测量中,若在重复性条件下对被测量X作n次测量,并且有m组这样的测量结果,由于各组之间的测量条件可能会稍有不同,因此不能直接用贝塞尔公式对总共m×n个测量值计算其实验标准差,而必须计算其合并样本标准差(又称组合实验标准差)[77],即:
上式中,xjk是第j组第k次测量值,j是第j组n个测量值的算术平均值。
当各组所包含的测量次数不完全相同时,则应采用方差的加权平均值,权重(即自由度)为(nj-1),此时的合并样本标准差为:
上式中,nj是第j组的测量次数,s2j是第j组nj个测量值的样本方差。
在一些常规的日常校准或检定工作中,采用合并样本标准差往往会取得良好的效果[79-81]。
以下选用最为常用的修正前后贝塞尔公式法作为其他各种估计总体标准差统计方法的比较基准。
参考文献:
[1]费业泰误差理论与数据处理[M].北京:机械工业出版社, 2000(第4版).
[2]冯师颜误差理论与实验数据处理[M].北京:科学出版社, 1964
[3]周秀银误差理论与实验数据处理[M].北京:北京航空学院出版社, 1986
[4]贾克军,石军广,贾文轩,等等精度传递理论在流量计量中的应用[J].工业计量, 2012,22(4):9-11
[5]魏诺,史彭,张伯乾,等非等精度测量不确定度表示两种方法的比较[J].高校实验室工作研究, 1999(2):35-36
[6]彭靖不等精度直接测量不确定度的评定[J].中国计量, 2003,8(3):58-59
[7]郭奕玲,沈慧君诺贝尔物理学奖(1901—2010)[M].北京:清华大学出版社, 2012
[8]杨正一氩元素发现的启迪[J].西安石油学院学报, 1989,4(4):89-93
[9]RAFisherOn an absolute criterion for fitting frequency curves[J].Messenger of Mathematics, 1912,41∶155-160
[10]RAFisherOn the mathematical foundations of theoretical statistics[J].Philosophical Transactions of the Royal Society of London, Series A, 1922,222∶309-368
[11]RAFisherTheory of statistical estimation[J].Mathematical Proceedings of the Cambridge Philosophical Society, 1925,22(5):700-725
[12]孙翠先,步金芳正态总体方差和标准差的无偏估计[J].唐山学院学报, 2012,25(3):5-6,9
[13]盛骤,谢式千,潘承毅概率论与数理统计[M].北京:高等教育出版社, 2001(第3版).
[14]林洪桦测量误差与不确定度评估[M].北京:机械工业出版社, 2010
[15]SSShapiro, MBWilkAn analysis of variance test for normality(complete samples)[J].Biometrika, 1965,52(3/4):591-611
[16]RBDAgostinoAn omnibus test of normality for moderate and large size samples[J].Biometrika, 1971,58(2):341-348
[17]SSShapiro, RSFranciaAn approximate analysis of variance test for normality[J].Journal of American Statistical Association, 1972,67(337):215-216
[18]Frank EGrubbsSample criteria for testing outlying observations[J].Annals of Mathematical Statistics, 1950,21(1):27-58
[19]Frank EGrubbsProcedures for detecting outlying observations in samples[J].Technometrics, 1969,11(1):1-21
[20]WJDixonAnalysis of extreme values[J].The Annals of Mathematical Statistics, 1950,21(4):488-506
[21]WJDixonRatios involving extreme values[J].The Annals of Mathematical Statistics, 1951,22(1):68-78
[22]Robert BDean, WJDixonSimplified statistics for small numbers of observations[J].Analytical Chemistry, 1951,23(4):636-638
[23]WJDixonProcessing data for outliers[J].Biometrics, 1953,9(1):74-89
[24]田禹基于偏度和峰度的正态性检验[D].上海:上海交通大学硕士学位论文, 2012
[25]王文周未知σ,t检验法剔除异常值最好[J].四川工业学院学报, 2000,19(3):84-86
[26]张敏,袁辉拉依达(РайTа)准则与异常值剔除[J].郑州工业大学学报, 1997,18(1):84-88
[27]王承双3σ准则与测量次数n的关系[J].长沙电力学院学报(自然科学版), 1996,11(1):73-74
[28]William ChauvenetA manual of spherical and practical astronomy VolII(Theory and use of astronomical instruments)[M].Philadelphia:JBLippincott & Co, London:Trübner & Co, 1863
[29]王玺,罗旭微机在化学分析逸出值检验中的应用[J].沈阳药学院学报, 1991,8(1):52-57
[30]吴拥政重标极差法及其应用[J].统计与决策, 2004(8):23-24
[31]KRNairThe distribution of the extreme deviate from the sample mean and its studentized form[J].Biometrika, 1948,35(1/2):118-144
[32]吕恕正态样本异常Nair检验统计量的近似分布[J].东北师大学报(自然科学版), 1990,22(3):41-45
[33]GB/T 4883—2008, 数据的统计处理和解释——正态样本离群值的判断和处理[S].
[34]邹传忠关于标准差三种表现形式的应用[J].江西煤炭科技, 2004(2):66
[35]GB/T 19022—2003, 测量管理体系——测量过程和测量设备的要求[S].
[36]全国法制计量管理计量技术委员会JJF105911—2011,测量不确定度评定与表示[S].
[37]柳历波测量不确定度的A类评定的几个问题[J].上海计量测试, 2009,36(4):27-28
[38]林洪桦测量不确定度评定应基于误差理论[J].自动化与信息工程, 2011,33(4):1-4,12
[39]倪育才测量不确定度理解与应用(二):极差法和贝塞尔法之间的比较[J].中国计量, 2004,9(8):78-79
[40]巫业山测量不确定度A类评定的两种方法:贝塞尔法和极差法[J].衡器, 2011,40(4):23-24
[41]李慎安测量不确定度表达百问[M].北京:中国计量出版社, 2001
[42]耿维明测量误差与不确定度评定[M].北京:中国质检出版社, 2011
[43]罗刚不确定度A类评定及不确定度B类评定的探讨[J].计量与测试技术, 2007,34(12):42-43
[44]刘智敏,刘风不确定度的B类评定方法[J].中国计量学院学报, 1995,6(2):51-57
[45]刘智敏不确定度原理[M].北京:中国计量出版社, 1993
[46]王中宇,刘智敏,夏新涛,等测量误差与不确定度评定[M].北京:科学出版社, 2008
[47]张少伟有效数字的正确取位[J].电力标准化与计量, 1997(3):38,45
[48]李谦关于测量不确定度的有效位数和修约间隔[J].电力标准化与计量, 1998(1):4,19
[49]李谦数字修约间隔和修约规则[J].电力标准化与计量, 1998(2):5-7
[50]李维明测量不确定度自由度的评定方法及一般取值范围的探讨[J].工业计量, 2007,17(5):52-53
[51]山内二郎統計数値表(Statistical Tables and Formulas with Computer Applications, JSA-1972)[M].東京:日本規格協会JSA(Japanese Standards Association), 1972
[52]王正向标准偏差估值之极限分布及其应用[J].数学的实践与认识, 1983,13(1):20-33
[53]徐扬光关于总体标准偏差σ的估计精度分析[J].中国质量管理, 1983(2):19-21,31,18
[54]黄景祥几种标准差估计方法的精密度比较和评价[J].中国计量学院学报, 1995,6(S1):93-97
[55]周富臣,孙玉莲总体标准差σ的五种估计及估计精密度[J].计量技术, 2006(12):60-64
[56]周富臣标准偏差的六种估计及其精密度[J].上海计量测试, 2007,34(1):10-13
[57]陈树祥,朱洪海,杭雪珍正确认识贝塞尔公式[J].计量与测试技术, 2003,30(1)32,37
[58]庄正辉,吴先球,陈浩贝塞尔公式的推导及其物理意义探讨[J].大学物理实验, 2010,23(4):80-82
[59]林景星贝塞尔公式计算实验标准差的探讨[J].上海计量测试, 2011,38(2):44-45
[60]朱洪海关于随机误差标准差的几点思考[J].盐城工学院学报, 2001,14(4):20-21,28
[61]谷秀娥关于标准误差和标准偏差的讨论[J].大学物理实验, 2006,19(3):66-67,101
[62]邓永和中误差贝塞尔公式的推导[J].大地测量与地球动力学, 2009,29(3):128-130
[63]邓永和中误差贝塞尔公式推导的进一步研究[J].铁道勘察, 2009(5):8-9
[64]朱洪海对贝塞尔公式证法的探讨[J].计量与测试技术, 2001,28(6):8-9
[65]马美娟贝塞尔公式推导的再研究[J].佳木斯大学学报(自然科学版), 2011,29(2):290-291,295
[66]张本良贝塞尔公式用于估算函数误差的论证及其使用范围[J].武汉工学院学报, 1992,14(4):56-61
[67]朱安远用彼得斯公式估计总体标准差的误差分析[J].中国市场(物流版), 2012,19(19):28-31
[68][波兰]M费史概率论及数理统计[M].王福保,译.上海:上海科学技术出版社,1962
[69]周概容概率论与数理统计[M].北京:高等教育出版社, 1984
[70]张世英,刘智敏测量实践的数据处理[M].北京:科学出版社, 1977
[71]何永政质量检验不确定度与应用数理统计[M].北京:中国计量出版社, 2009
[72]樊顺厚正态分布的子样标准差过低估计了总体标准差[J].纺织基础科学学报, 1994,7(3):242-244
[73]樊顺厚,刘树琪子样标准差过低估计总体标准差[J].纺织高校基础科学学报, 1996,9(1):27-42
[74]黄景祥标准偏差的无偏估计及贝塞尔公式修正系数的简便计算[J].计量技术, 1990(6):36-38
[75]何克明贝塞尔公式修正系数的准确简便计算[J].计量技术, 2000(12):49
[76]王文周标准偏差的标准偏差有多大相对误差[J].四川工业学院学报, 2002,21(1):86-88
[77]倪育才实用测量不确定度评定[M].北京:中国计量出版社, 2009(第3版).
[78]陈成仁,刘智敏,王永泉实验标准(偏)差和平均值实验标准(偏)差意义解析[J].中国计量, 2010,15(1):96-98
[79]朱安远线性传感器静态性能指标的计算[J].冶金计量, 1990(4):32-35
[80]朱安远线性传感器的静态校准及其基本性能指标的计算[A].钢铁工业自动化——应用电子技术改造钢铁工业学术会议论文集[C].北京:冶金工业出版社, 1993:821-830
关键词 座次分布 成绩 出勤率 空间统计分析
中图分类号:G445 文献标识码:A
Correlation of Student Grades, Attendance and Seating Distribution
――Based on Spatial Statistical Analysis Methods
ZHANG Zhen, KONG Li, XU Xin
(College of Agronomy and Biotechnology, Southwest University, Chongqing 400715)
Abstract Based on spatial statistic analysis, with the help of Geoda, the spatial distribution of the classroom and exam data manifest a statistical relationship which exists between grades, attendance and the distribution of seating. A significant spatial correlation is found that students who have high attendance tend to sit in the front row, and students who score higher tend to sit in the front row.
Key words seating distribution; grades; attendance; spatial statistical analysis
0 引言
空间统计分析主要用于空间数据的分类和综合评价,其核心是发掘基于空间地理位置的统计数据间的空间依赖、空间关联或空间自相关,通过空间地理位置建立数据间的统计关系,并作出各种相关的统计分析,来探究各变量之间的内在关系。
近年来,利用空间统计分析作为研究方法,吕安民(2002)曾对中国省级人口增长率进行了研究,并以空间统计分析方法研究了其内在的空间关联;左相国(2004)曾对人均GDP和农业人口比重对第三产业发展的制约作用进行了分析,研究国民经济发展水平和农业人口比重对第三产业发展的制约机制的规律性;杜国明(2007)等曾以沈阳市为例,研究了城市人口分布的空间自相关;以空间统计分析为研究方法的学术成果十分丰富。
以教室或考场为空间范围,在日常教学过程中可发现学生的座次、出勤率、考试成绩等呈现出较明显的空间分布特征,因此以空间分析工具开展教学研究将有助于揭示相关变量背后的关系。本文借助Geoda软件,利用西南大学2012-2013学年度第二学期2011级某专业课程上,各个同学的座次、成绩、出勤率等数据,分析了出勤率、学习成绩与上课座次与考试座次之间的空间相关关系,也即以空间统计分析――一种更直观的可视化的方式证明并显示了座次与出勤率之间、座次与成绩之间的空间相关性。
1 研究对象概况与数据来源、研究方法
1.1 研究对象概况与数据来源
本研究以某专业2011级69名同学为对象,统计了69名同学在2012-2013学年度上课座位分布数据,并分析了座位分布于69名同学的期末考试成绩之间的相关关系。
由于课程教学地点不一,根据研究设计,学生的上课座位分布都在12列8排的96个座位范围内(未考虑讲台、门窗、过道对分布的影响)。期末考试根据全校统一安排,学生的座位分布在7列11排的77个座位范围内。本文建立的教室与考场地图――也即座位的空间坐标方法①如下:
教室地图与考场地图编号方式如图1图2。不论是考场地图还是教室地图,两者都以下方(即85~96或71~77这一排)为教室最前排,以最上方(1~12或1~7这一排)为教室最后一排。
图1 教室地图 图2 考场地图
1.2 研究方法
1.2.1 确定空间权重矩阵
空间权重矩阵表达了不同空间对象之间的空间布局,如拓扑、邻接关系等,通常定义一个二元对称空间权重矩阵,来表达几个位置的空间区域的邻近关系,其形式如下:
(1)
其中,表示空间单元个数,表示区域与(在本文中即座位与)的邻居关系。本文以两个教室与考场内的96、77个座位建立基于空间邻接关系的权重矩阵,这里邻接的意思是具有公共边界,规则如下:
(2)
1.2.2 求局域空间自相关指标
局域空间自相关指标(Local indicators of spatial association,缩写为LISA)用于反映一个座位的数据属性与邻近座位的相关程度。局部Moran指数被定义为:
= (3)
1.2.3 标准差地图
标准差是总体各单位标准值与其平均数离差平方的算术平均数的平方根,它反映组内个体间的离散程度。借助Geoda095i软件,可以以可视化的方式呈现空间上的成绩、出勤率等差异。其定义方式为:
= (4)
2 研究假设
根据研究设定,本文提出以下假设:(1)座次分布与出勤率之间存在空间相关性。出勤率高的同学倾向于前排就坐,出勤率低的同学倾向于后排就坐,即前排座位上的同学倾向于具有高出勤率,后排座位上的同学倾向于具有低出勤率;(2)座次分布与成绩之间存在空间相关性。成绩高的同学倾向于前排就坐,成绩低的同学倾向于后排就坐,即前排座位上的同学成绩较高,后排座位上的同学成绩较低。
3 实证分析
3.1 座次与出勤率之间的空间相关性分析
图3 以出勤率为变量的教室标准差地图
图4 以出勤率为变量的教室标准差地图中的高出勤率空间聚集
统计数据记录了每次课每个座位上的同学的学号,然后将每个同学的出勤率与学号匹配,则可得到每次课每个座位上的同学的出勤率在教室座位上的空间分布。以此类推,根据可得18个课时分别对应的空间分布。此分析以每个座位为研究对象,有人坐记为1,无人坐记为0,赋予每个座位以数次出勤率,②再取这数次出勤率的均值,即可得到平均出勤率为每个座位赋值,以不同的颜色表示。也即在此分析中以每个座位为研究对象,求得坐在某座位的(不同或相同的)同学的出勤率的均值,将这个均值赋予此座位,表示坐在此位置上的(不同或相同的)同学的平均出勤率。然后借助软件可得教室地图中的出勤率分布的标准差地图,如图3。
在阴影区域(见图4)高出勤率占比最大(93.33%),高出勤率在此区域有明显的空间聚集特征,也即出勤率与座次之间存在明显的空间相关性,可以认为,出勤率高者倾向于坐在这一区域。其次可以发现,前五排中高出勤率者占到73.33%,低出勤率者仅占26.67%,前后差异十分明显。
为了验证这一点,可再求局域空间自相关指标LISA,以反映某座位的数据属性与邻近座位的相关性程度,算法如前述公式(3)。借助软件可得LISA Cluster Map,如图5。
图5 以出勤率为变量的教室局域空间自相关指标地图(LISA Cluster Map)
高高点指此座位自身的出勤率高且相邻接的座位的出勤率也高,意味着此处有高出勤率的空间聚集特征;低低点指此座位自身的出勤率低且相邻接座位的出勤率也低,意味着此处有低出勤率的空间聚集特征;低高点指此座位自身的出勤率低但相邻接座位的出勤率高,意味着此座位周围出现高出勤率的空间聚集特征;高低点指此座位自身的出勤率高但相邻接的座位出勤率低,意味着此座位周围出现低出勤率的空间聚集特征。
通过分析图5,可见高高点与低高点全在前四排,低低点全在后三排(高低点只有一个,故可忽略不计)。这个结果说明,前四排是高出勤率聚集之处(虽然有三个低出勤率点,但此三点周围却仍是高出勤率聚集),后三排是低出勤率聚集之处。此外,五个高高点中有四个分布在左侧,也即在前排中,高高点并非左右均匀分布,而是倾向于分布在左侧。
结合以上以出勤率为变量的地图及相关分析,可以得出结论:座次分布与出勤率之间存在空间相关性;高出勤率的同学倾向于前排就坐,且在前排左侧③出现明显空间聚集特征;低出勤率的同学倾向于后排就坐;也即前排(尤其是左侧)就坐的同学倾向于拥有较高出勤率,后排就坐的同学倾向于拥有较低出勤率。因此证明了本文提出的第一个假设。
3.2 座次与学习成绩之间的空间相关性分析
3.2.1 平均座位排数与成绩的统计描述
图6是位于33教的统计学考试的考场地图,是成绩的标准差地图。每个方格的不同颜色代表坐在此位置上的同学的成绩。也即反映了统计学考试的考场中,每个同学的分数在考场座位中的空间分布。在图中可发现,阴影区域的同学成绩普遍较高,这一区域的成绩分布有明显的空间聚集特征。为了探求这些同学较高的成绩是否与平时上课的座位排数――坐在较前排或较后排相关,也即其成绩是否影响其座位选择,分析图6。
图6 以成绩为变量的考场标准差地图
图7也是33教统计学考试的考场地图,但方格的属性发生了变化――每个方格的不同颜色代表了坐在此位置上的同学平时上课所坐位置的平均排数。也即图7为平均排数的标准差地图,反映了在统计学考试的考场中,每个同学平时上课所坐位置的平均排数在考场座位中的空间分布。对比图6与图7,可以发现,图6中成绩较高的阴影部分刚好对应图7中的平均排数较低的阴影部分。
图7 以平均排数为变量的考场标准差地图
因此可以推论,平时上课的平均座位排数较低(即前排就坐)的同学倾向于拥有较高成绩,而平均座位排数本身即反映了座次分布,故可以初步推论座次分布与成绩之间存在空间相关性。
3.2.2 座次与成绩之间的空间相关性分析
为了验证上述初步推论,分析18个统计学课时中每个同学的座次分布。
如座次与出勤率之间的空间相关性分析,数据记录了在32教每次课每个座位上的同学的学号,将每个同学的分数与学号匹配,则可得到每次课每个座位上的同学的成绩在教室座位上的空间分布。以此类推,可得18个课时分别对应的空间分布。与图6图7的分析不同之处在于,此分析中不再以每个同学为研究对象,而是以每个座位为研究对象,即赋予每个座位以数次成绩,④再取这数次成绩的均值,即可得到为每个座位赋予的成绩属性,以不同的颜色表示。也即在此分析中以每个座位为研究对象,求得坐在某座位的(不同或相同的)同学的成绩的均值,将这个均值赋予此座位,表示坐在此位置上的(不同或相同的)同学的平均成绩。见图8,以成绩为变量的教室标准差地图。
图8 以成绩为变量的教室标准差地图
分析图8可知,图中阴影区域呈现出明显的空间聚集特征,表明平时坐在这一区域的座位上的同学们的成绩较高,⑤前排就坐的同学的成绩倾向于高于后排就坐的同学,也即成绩高的同学倾向于选择前排就坐,成绩低的同学倾向于后排就坐。
为了更严密地验证这一点,可采取以下分析。
第一,以成绩的均值68.835为界。以前后四排为单位,在教室前四排48个座位中,高于平均成绩者33个,低于平均成绩者15个,分别占比68.75%、31.25%;在教室后四排48个座位中,高于平均成绩者15个,低于平均成绩者33个,分别占比31.25%、68.25%。以前后两排为单位,在前两排24个座位中,高于平均成绩17个,低于平均成绩者7个,分别占比70.83%、29.17%;在后两排24个座位中,高于平均成绩6个,低于平均成绩者18个,分别占比25%、75%。
第二,以前后四排为单位,在48个高于平均成绩者中,有33个分布在前四排,15个分布在后四排,分别占比68.75%、31.25%;在48个低于平均成绩者中,有15个分布在前四排,33个分布在后四排,分别占比31.25%、68.25%。以前后两排为单位,在23个高于平均成绩者中,有17个分布在前两排,6个分布在后两排,分别占比73.91%、26.09%;在25个低于平均成绩者中,有7个分布在前两排,18个分布在后两排,分别占比28%、72%。
第三,选出成绩的后十名(如图9)考察,发现后十名中坐在前四排者有2个,坐在后四排者有八个。而选出成绩的前十名(如图10)考察,发现前十名中坐在前三排者有4个,在第四五排者有五个,而在后三排者只有一个。
图9 以成绩为变量的教室标准差地图中的成绩后十名者
图10 以成绩为变量的教室标准差地图中的成绩前十名者
通过以上分析可得结论:成绩与出勤率之间存在空间相关性。在教室前后,成绩差异较大,而前后两排成绩差异尤为明显。成绩高的同学倾向于前排就坐,成绩低的同学倾向于后排就坐,也即前排座位上的同学倾向于具有较高成绩,后排座位上的同学倾向于具有较低成绩。
4 结论
本文以课程18个课时中的各同学座次分布及其成绩、出勤率数据为支撑,对其进行了空间统计分析,证明了本文提出的相应的两个假设:第一,座次分布与出勤率之间存在空间相关性:出勤率高的同学倾向于前排就坐,出勤率低的同学倾向于后排就坐,也即前排座位上的同学倾向于具有高出勤率,后排座位上的同学倾向于具有低出勤率;第二,座次分布与成绩之间存在空间相关性:成绩高的同学倾向于前排就坐,成绩低的同学倾向于后排就坐,也即前排座位上的同学倾向于具有较高成绩,后排座位上的同学倾向于具有较低成绩。
本文借助Geoda软件进行分析,无疑具有直观、简洁的优点。但是不可避免,本文仍存在不足之处。如某些因素可能对本文分析的两种空间相关性产生影响(如同宿舍的同学倾向于聚集)。若将这种影响纳入本文的分析,虽在建模上可行,但是由于实际操作层面存在诸多困难,故未纳入本文的分析。因此,关于座位分布、成绩、出勤率之间的空间相关性,仍有待进一步更详实的实证研究。
基金项目:重庆市高等学校人才培养模式创新实验区项目;西南大学教育教学改革研究项目(2012JY047)
*通讯作者:孔立
注释
① 为了处理数据的方便,地图中未考虑教室中的过道,但这并不影响本文的分析与论证.
② 由于座位数大于同学人数,所以每个座位被坐次数6.
③ 之所以呈现出左右分布不对称,从生活经验可知是因为32教与35教上课的教室中PPT投影皆位于(面向讲台)左侧.
④ 如脚注2,每个座位被坐次数6.
⑤ 如脚注3,出现左右分布不对称是因为上课的教室中PPT投影位于左侧.
参考文献
[1] 吕安民,李成名,林宗坚,等.中国省级人口增长率及其空间关联分析.地理学报,2002.57(2):143-150.
[2] 左相国.人均和农业人口比重对第三产业发展的边际贡献.统计观察,2004(4):58-59.
[3] 杜国明,张树文,张有全.城市人口分布的空间自相关分析――以沈阳市为例.地理研究,2007.26(2):383~389.
[4] Anselin L.Spatial Econometrics: Methods and Models.1988.
[5] Anselin, L, J Le Gallo, H. Jayet. Spatial panel econometrics.2005.
[6] Huang Runlong, Shuai Youliang. The logistic model and application study on population increase. Journal of Nan-jing College for Population Programmer Management,2000.16(3):25-27.
[7] 左相国,黎志成.第三产业发展水平与人均GDP和农业人口比重之间的关系分析.统计观察,2003(1):50-51.
(一)培养学生的兴趣职业教育的目的是培养高素质、技能型专门人才。所以,在统计教学中,要考虑理论知识的适度、够用,而不刻意追求理论体系的完整。要强调统计基础知识的掌握和统计基本技能的训练,注重提高学生运用基本理论和方法来分析、解决实际问题的能力。在语言表述上,力求简明、通俗、易懂,把概念表述准确、完整,便于学生理解、掌握。同时,将统计知识与计算机知识融为一体,让复杂难懂的统计理论和方法变得简单、快速、准确。将反映国计民生的最新统计数字放在恰当的地方与教材内容紧密结合,让学生感受我国社会经济的高速发展,人民生活的丰富多彩,国家变化的日新月异。这也能提高学生的学习兴趣。
(二)科学设置教学内容统计的目的是认识社会经济现象总体的数量方面,从中发现带有规律性的东西。为了达到这个目的,统计需要做一系列的工作。统计课的教学内容就是按照统计工作过程的每个阶段来安排的:统计设计、统计调查、统计整理、统计描述、统计推断、统计分析和数据积累。其中,统计设计和统计数据积累理论性较强,原则上让学生知道“是什么”、“怎么做”就行了。而对于统计调查、统计整理这两部分,内容虽然多,但容易理解,可以简单讲解,让学生多看,借此培养学生的自我学习能力。统计描述、统计推断、分析这几部分内容,要在学生对统计基本概念准确理解的基础上进行系统讲解。搜集统计数据的过程又称为统计调查,就是围绕统计指标及其体系搜集统计数据,特别是原始数据。主要方法包括直接观察法、报告法、采访法、邮寄法和实验设计调查法。统计整理,即对调查资料进行加工汇总。统计调查所获得的资料往往是分散的、不系统的原始资料,这就要求我们必须对统计调查所获得的资料进行科学的整理,并通过合适的形式把这些整理结果表述出来。具体来说,统计整理是根据统计研究的目的和要求,对统计调查所得到的原始资料进行科学分类、汇总,或对已初步加工的资料进行再加工,使之系统化、条理化,成为能够反映现象总体特征的综合资料的工作过程。统计整理主要讲方法,包括分组、汇总和编制统计表和绘制统计图。统计课的主要内容包括:统计描述(综合指标)、抽样推断、统计指数、时间数列(动态分析)和相关与回归分析。这也是重点和难点。
(三)注重学科知识的系统性统计各章节内容的安排是有逻辑性的,前面内容往往是后面内容的基础。学习过程环环相扣,不能跳越某一章节而直接进入后面的章节。总论部分是对统计课程教学内容的概括描述,通过学习,使学生了解统计学的基本框架体系,把握统计学的涵义、研究对象、研究方法及统计活动的过程,尤其要准确理解统计学的基本范畴(基本概念)。统计学基本范畴包括:总体、总体单位、标志、统计指标以及延伸出的小概念。如果把统计课的学习比喻为盖高楼大厦,那么这些基本范畴就是地基或基石。深刻理解领会这些基本概念的含义,准确把握基本概念之间的区别与联系,并能正确运用,就为这座高楼大厦夯实了地基、稳固了基石。教师讲解这些概念时,可结合生活中学生熟悉的例子深入浅出地讲解,课下布置练习进行巩固。
二、统计课重点、难点内容解析
(一)统计学的基本概念最基本的概念包括:总体、总体单位、标志、统计指标。如上所述,这是学好统计课的基础。例如,“总体”这个概念。毫不夸张地说,统计所有章节的内容都是围绕“总体”展开的。统计学的研究对象是大量的客观现象,特别是社会经济现象的数量方面,包括数量特征、数量关系和数量界限,目的是认识社会经济现象发展变化的规律性。而社会经济现象包罗万象,种类繁杂,包括社会的政治、经济、文化、人民生活等领域的各种现象。统计研究时需要分门别类,把他们界定为一个个客观存在的、具有某种共同性质的许多个别现象或事物组成的集合体,即统计总体。个别现象或事物就是总体单位。总体具有大量性、同质性、差异性三大特征。大量性即总体是由许多单位组成的,一个或少数单位不能形成总体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以,统计研究的对象必须包括足够多的个体。同质性即构成总体的各单位必须具有某种共同性质,这是形成总体的客观依据,也是我们确定总体范围的标准。差异性即总体的各单位除了某些方面的共同性外,在其他方面必须有差异,这些差异是统计研究的基础和前提。如果学生不理解“总体”这个概念,就不能在特定的统计研究目的下,准确地界定总体的范围,描述总体的总量指标、相对指标、平均指标就无从理解和计算,更谈不上利用这些指标进行统计推断和统计分析。
(二)平均指标这是统计课中最重要的基础性指标。平均指标用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。它反映总体分布的集中趋势。其中,算术平均数是基础的、最重要一种。明确它的计算原理和含义,就能顺理成章地掌握变异指标、抽样推断、时间数列分析、指数分析中各类指标的计算和应用。平均数的计算学生并不陌生,在小学或者初中都学过。这是学习统计平均指标的基础。但要让学生明白,他们以前学的平均数是一个抽象的量,而这里的平均数是有特定经济内容的,是具体的有空间范围、时间限制的量。学习平均指标首先要搞清分类。平均数分为两大类:静态平均数和动态平均数,这跟时间有无变化有关。计算静态平均数的每个数值都是同一时间点上的,它表示每个总体单位在某一数量标志上的平均水平。计算动态平均数的每个数值是某一个统计指标在不同时间上的取值,是表示该指标在每个时间单位上的平均水平。最常用的平均数是算术平均数,其基本公式为:算术平均数=总体标志总量总体单位总量这个指标的含义、计算原理、四个计算公式以及应用都要讲透,特别是加权算术平均数的计算和应用,对学生的要求不能停留在“会就给定的资料计算出算术平均数”这个层面,而要让学生透彻理解掌握其计算原理,并把它运用到复杂的领域。因为标准差、抽样平均误差、平均发展水平、综合指数、平均数指数、相关系数、回归分析等有关指标的计算都是以算术平均数的计算原理为基础的。
社会学、社会工作等专业本科生毕业后进入企事业单位,并不要求他们具有很强的数理分析能力,而更需要他们利用统计学知识解决实际问题。高校扩招使学生的就业压力空前的大,要求学校的办学方向和重点以培养学生的动手实践能力为主。随着大数据时代到来和社会调查的日趋成熟,很多用人单位也非常看重应聘者对统计分析和统计软件的掌握程度。
笔者长期担任《社会统计学》教学,发现大部分学生为文科生,数学基础差,课程负担重,如何增强学生利用所学统计学知识,解决实际生活尤其是走出校园参加工作后学以致用是当前课程教学改革的重点和难点。
一、当前社会统计学教学存在的问题
(一)教学内容的针对性不强
一本高质量的《社会统计学》教材,既需要像数理统计一样,讲清讲透基础统计学原理和知识,又要明晰研究内容和研究对象,阐释清楚与其他应用统计学的区别。而当前的《社会统计学》主流教材,都存在侧重于其中一方,能够做到两方面兼顾得很好的教材几乎没有。如目前高校使用量较大的教材有卢淑华的《社会统计学》,偏重于数理统计的理论推导,蒋萍的《社会统计学》尽管对研究对象有清晰的定位,但是需要学生具有一定的数理基础。目前的统计学教学中一般采用理论讲解为主的教学模式,教师主要依托教材,对与统计学相关理论和方法逐一进行介绍,对涉及到的公式和定理进行推导。因此,当前社会统计学最需要解决的问题就是尽快编撰一本如何将统计学知识运用到具体的社会问题研究或者实践中去的优秀教材。
(二)教师的水平参差不齐
目前不少院校的社会统计学教师队伍主要来源于两块,一是外聘数理统计学的教师教授《社会统计学》课程,这些老师上课更多的偏重理论讲解和推导,让学生掌握比较扎实的基础统计学知识。由于他们对社会学、社会工作等文科专业不熟悉,课堂讲解中不能结合专业领域内的社会调查和案例来分析讲解。导致学生学习起来压力大,觉得枯燥无味,在面对社会现象时不知道怎么利用所学统计学知识分析和阐释社会现象。二是社会学专业背景老师讲授《社会统计学》,这些老师由于没有系统接受过数理统计学的训练,对于统计学的数理部分往往一知半解或者干脆略过,教学中更多的偏重例题分析和软件的使用。
(三)学生的学习态度不端正
学习社会统计学的学生多为文科生,在进入大学前,就是因为对数学等学科的害怕才选择报考文科专业。而统计学需要一定的概率论和微积分等数学基础,所以学生一看到社会统计学中涉及的数学知识就头疼,认为自己很难学好,产生先入为主的畏难心理,对自身的学习能力信心不足,缺乏动力,提不起兴趣,部分学生甚至在遇到困难时主动放弃统计学的学习。学生认识不到社会统计学与其它应用统计学相比,有其自身特点:研究对象为人类行为、政治文化等社会现象;所需具备的数理知识要求相对较低,更侧重于对统计结果的理解和解释;社会统计中收集到的资料,往往很多是低层次的变量,如定类、定序变量。因此,定类、定序变量统计分析在社会统计学中占有很大的比重,讨论变量之间的关系,如列联表、列联强度,相关关系的测量是学习的重点。
二、以就业为导向的《社会统计学》教学改进措施
(一)统计思维改进法
1、统计无用论向统计实用论的转变
社会统计学作为一门定量分析工具,是社会科学科学性的实现工具,尤其是随着中外学术交流的加强和规范化,近些年高级统计学的发展,统计学在社会科学的发展中扮演着越来越重要的角色。学好统计学对于本科生考研或者将来从事学术研究,都是必不可少的知识,尤其是社会学、社会工作、公共管理等专业的考研,社会统计学是必考科目,也是导师特别看重的学生必备能力之一。二是社会统计学作为一门实用性很强的工具,现在很多企业、调查公司等在招聘的时候非常看重应聘者统计学的知识和能力,熟练掌握和应用EXCEL、SPSS、STATA、SAS等统计分析软件,可以极大增加就业机会和就业筹码。
2、教学过程中的定量思维与定性思维的结合
社会统计学作为定量分析工具,需要学生具有较强的数学分析思维和逻辑思维,所以统计学中有大量的公式和推导过程。作为教师,在教授过程中在讲清楚原理和推导过程的同时,需要根据文科学生的特点,用定性的话语和思维解释清楚来龙去脉。
例如对于标准分的理解,卢淑华是这样解释的:“标准分Z的意义在于它是以均值为基点,以标准差σ为量度单位,计算x取值距离标准差的距离,以便进行不同的μ和σ之间进行比较。”不同的变量一般有不同的均值和标准差,统计上,不同的均值和标准差是不能互相比较的。例如甲乙两名学生在两个不同的班级考了同一门《社会统计学》课程,他们的成绩如下:甲同学考了80分,乙同学考了90分。已知甲班《社会统计学》的平均成绩是70分,标准差是10分;乙班《社会统计学》的平均成绩是70分,标准差是20分。请问甲乙同学在本班中谁的成绩更好?通过标准分计算,两者的标准分都是1,说明两名同学在班级的成绩排名是一样的。经过定性的案例分析讲解,学生就能明白为什么曾经一度在高考中引入标准分的原因了,以使不同考区的学生以相对公平的分数被录取。
3、数理思维向理解思维的转变
实质上,学习统计学的过程,就是学习统计思维的过程,而不只是公式的简单套用和通常的数字计算。统计学有严格的前提假设和适用变量层次,是一门量化分析工具,我们在实际运用中,不能为了分析或者所谓的科学性而滥用统计方法,用统计数字代替科学推理,犯了社会学家邓肯(Duncan)所说的统计至上主义(statisticism)。统计数字会撒谎,正如桑普拉斯所说:“统计未必能够揭示真实,有时候还可能成为假象的帮凶。”因此对于统计学的学习,除了养成良好的统计思维外,还需要我们具有扎实的理论基础,规范的社会调查研究方法和对统计方法的甄别使用和统计结果的合理解释。社会统计学课程的学习更看重的是学以致用,用所学知识科学的分析和解释社会中的现象。正如我们学会游泳前不一定要了解动力学的知识,会使用计算机不一定要先懂得编程一样,理解计算机的输入和输出结果比知道计算机如何计算重要得多。
例如学生对于假设检验的原理很难理解,我们可以通过举例让学生理解假设检验的思路。在航天火箭发射前,没有任何人能够事先证明火箭发射是安全的,人们最多只能说,用现有手段没有发现问题。但是,只要发现一个影响安全发射的问题,那就不能发射。这说明,企图肯定什么事情很难,而否定却要相对容易得多。物理学以及其他科学都是在否定中发展的,这也是假设检验背后的哲学。假定原假设火箭发射是安全的,即使通过研究假设也无法否定原假设,也不能说明原假设是正确的,就像用一两个仪器没有发现火箭有问题还远不能证明火箭是安全的,但是只要在原假设成立的前提下,出现了小概率事件,我们就认为原假设不成立,那么航天火箭就不能发射。
(二)统计应用推动法
1、开展课外调查活动
引入以“提出问题―分析问题―提出假设―验证假设”为流程的基于问题的学习方法(Problem Based Learning,PBL)来开展课外调研活动。组织学生以小组为单位,选择和确定实践课题,成立以6―7人为一组的若干个项目小组,并选出各组组长。当然,研究课题可以是学生日常生活中所关心的问题,如大学生校园恋爱观的调查、大学生消费行为调查、学习时间调查、学习成绩调查、课余活动、生活习惯、自媒体使用情况调查;也可以是社会生活中的热门现象,如独生子女价值观、二孩生育行为、观念,贫困人口认定与帮扶等调查。让学生通过利用所学的社会调查研究方法,科学选题、做好研究设计、设计问卷、选择合适的抽样调查方法、收集资料、利用统计软件分析数据,撰写调查报告来学习和使用统计学知识分析和解释社会现象。这样不仅可以有效解决由于实训基地、实习经费的限制所带来的不便,而且这种调查贴近学生生活,容易入手,易于激发其兴趣,并且有助于加深对统计学原理的理解,明白统计学就在身边,与我们的生活息息相关。
2、使用统计软件法
有针对性的将Excel、SPSS、STATA,SAS等统计应用软件作为社会统计学课程的实训内容。在课堂讲授时,可以教会学生使用Excel函数、Excel图表与图形以及Excel数据透视表来处理常用的统计数据。有条件的话可以安排在计算机房上课或者安排一定量的学时让学生在计算机房上机操作SPSS等软件,培养学生运用统计软件搜集、整理、分析统计数据的能力。
3、加强社会统计学的实习实践
与当地的政府部门、市场调研公司、市场咨询公司、专业的调查机构、相关企业建立协作和参与机制。让学生学会如何开展调查、如何获取资料、如果统计分析资料,所获取的统计分析数据是如何指导工厂、企业等单位的生产运作的。例如:学生通过参与公司的市场调查,了解公司的产品是如何定位顾客、细分市场的;参观地方政府统计部门的日常统计和上报统计报表,了解政府统计是如何进行的;学生参与各社区或者街道的贫困人口统计、人口普查等调查。
(三)统计课程革新法
1、建立完善的社会研究课程体系
社会研究课程体系是指教授学生如何在理论的指导下通过各种科学的方法进行调查与创新性研究的一系列课程。主要包括“社会调查研究方法”、“社会统计学”、“SPSS统计软件应用”等课程。尽管目前各高校都开设了这几门课程,但在实际教学过程中,一般都是分学期开设,由不同的老师授课,导致有些内容重复,例如抽样调查,在“社会调查研究方法”、“社会统计学”中都会涉及,理论学习和实践脱节,例如“社会统计学”、“SPSS统计软件应用”分别在不同学期开设。建议高校开设课程进行改革,由固定的老师来讲授社会统计研究课程体系,将“社会统计学”、“SPSS统计软件应用”整合为一门课程,并合理设置理论学习和实践教学的课时。
2、建立社会统计学案例库,试题库
可以从各类教材和国外统计学中收集案例和试题,建立案例库和试题库,国外的教材在深入浅出的讲解统计学知识上做得很好,例如布莱洛克的《社会统计学》,萨尔金德的《爱上统计学》。在教学过程中增加案例教学,可以更好的使学生理解统计学的基础知识和原理,了解统计学在现实生活中的应用,提高教学的成效,增强学生的统计运用能力。
关键词: 学生评教 数据 科学化处理
学生评教是通过学生系统地搜集教师在教学中的表现,对教师的教学活动是否有效、是否满足学生学习需要做出判断的过程。目前,学生评教已成为国内外高校评价教师教学效果的主要信息来源。有效的学生评教是保障高校教学质量的有力手段,而评教数据的有效性是学生评教能够激发教师的积极性,真正服务于教学改革的保证。学生评教数据的科学化处理是对学生评教原始数据进行汇总分析得到有效信息的过程,主要包括以下几个方面。
一、设置不合理打分限制机制
为避免个别学生仅凭个人好恶草率地对教师作出评价,评教系统对学生提交的评教结果设置限制,各测评项目全为很好或差的评教结果不予提交,促使学生端正态度,客观地对教师教学作出公正评价。
二、对学生评教数据进行异常值剔除
统计表明,一个班级的学生对任课教师的评价打分趋向于正态分布。按照“三倍标准差原理”,学生评教成绩落在区间(μ-3σ,μ+3σ)之外的概率等于0.003,为“小概率事件实际不可能原理”。因此,把区间(μ-3σ,μ+3σ)看作是评教成绩实际可能的区间,对游离于此区间外的数据加以剔除,从而剔除了异常高和异常低的分数。
三、学生评教结果的影响因素研究及标准分优化处理
影响和干扰学生评教效果的因素很多,可以归结为教师因素、学生因素及课程自身因素三类。研究表明,教师性别、年龄、职称、学历对学生评教的有效性并无显著影响,[1]而教龄、教师的科研成果,以及教师的个性特质则是影响学生评教效果的主要因素;学生的出席率、学习兴趣及学习成绩可对评教结果产生影响;不同课程类别对学生评教的结果影响很大,有学者研究表明,学生倾向于给予选修学科的教师较高的分数,而给予必修学科的教师较低的分数。[2]
要提高学生评教的信度与效度,使其达到提高教学质量的目的,就必需对学生评教的影响因素进行定量分析,并通过对影响因素的控制来改进学生评教工作。本文研究分析了不同课程类别对江苏某高校2009―2010学年第二学期学生评教结果的影响。
(一)不同课程类别对学生评教的结果影响
根据该校教务系统将课程分为公共选修、普通教育、专业基础、专业方向四个类别,在全校11个学院中按文科、理科、工科进行抽样,以人文学院、数学与统计学院、计算机科学与工程学院共三个学院的学生评教成绩形成数据库,对不同课程类别学生评教成绩的统计见表1。采用单因素方差分析法对不同课程类别对学生评教成绩的影响进行分析,结果见表2。显著性水平p值为0.000<0.05,从统计学的意义上看,课程类别对评教结果有显著的影响。
表1:不同课程类别评教原始成绩统计表
表2:不同课程类别对评教原始成绩的方差分析表
(二)对学生评教原始成绩的标准化处理
在学生评价系统中引入原始测评数据标准化处理手段,将原始分数转换为等距量表,即标准分。标准分以被测者的平均分数作为比较,以标准差为尺度进行衡量,[3]它能准确反映被测试者的实际水平,能够消除一些因素对结果的影响,它具有可比、可加的特性而且稳定。具体计算方法为:标准分=(课程得分-课类原始均分)/课类标准偏差。
课程得分是指教授某类课程的教师的学生评教原始得分,课类原始均分是指某类课程的学生评教的平均分,课类标准偏差是指某类课程的学生评教原始分数的标准差。
(三)对标准分的优化处理
标准分描述的是某一个数据在所在组中的相对位置,使教授各个不同课程类别教师得分结果有相同的基准点和相同的度量单位,从而消除不同课程类别对得分的影响。教师的得分大于课程平均分得到的标准分就大于零,相反则小于零。因此标准分在数值上就出现了大量的小数和负数,使得学生评教分数不直观,不易理解,因此设计对标准分进行优化处理的方法,将标准分换算成标准成绩。换算方法为标准成绩=校平均分+标准分*校标准差。
校平均分为全校教师的平均得分,校标准差是全校教师得分的标准差。
(四)对标准成绩的方差分析
通过对学生评教原始分进行标准化和优化处理后,采用单因素方差分析法对不同课程类别对学生评教标准成绩的影响再次进行分析,结果见表3和表4。显著性水平p值为1.000>0.05,从统计学的意义上看,课程类别对评教标准成绩无显著性影响,课程类别对评教结果的影响通过标准成绩的修正而得以消除。
表3:不同课程类别评教标准成绩统计表
表4:不同课程类别对评教标准成绩的方差分析表
(五)标准成绩与原始成绩的配对t检验
采用配对t检验对标准成绩与原始成绩进行均值检验,结果显示:t值=0.000,p值=1.000>0.05,表明标准成绩与原始成绩具有相等的统计学意义。
四、按人数加权平均计算教师最终成绩
当同一教师承担多门课程时,班级参评学生数的多少对教师评价总成绩有较大影响。因此,在计算教师评价总成绩时,不是先计算单个班级评价成绩后再求各个班级平均得分,而是将一位教师全体参评学生的评价结果纳入总体进行计算作为最终评价成绩,由此消除了班级参评人数差异引入的误差。
通过以上设置不合理打分限制机制、剔除异常值、标准分优化处理及加权平均法的应用等四种数据处理方式,有效地消除了多方面因素对学生评教数据客观性和科学性的影响,提高了学生评教的效度和性度,实现了通过学生评教提高教学质量和改善学校管理水平的目的。
参考文献:
[1]EI-Hassan,K.Students’ratings of instruction:generalizability of findings[J].Student in Educational Education,1995.21,(4):411-429.
[2]Wachtel,H.K.Student evaluation of college teaching effectiveness:a brief review[J].Assessment and Evaluation in Higher Education,1998.23,(2):191-211.
[3]王进忠,张秀卿.标准分及其应用[J].教育与管理,2005,(1):75-77.
【关键词】质量监控;区间估计;正态分布
呼叫中心为服务客户而生,服务质量是呼叫中心的生存之本。因此,几乎每个呼叫中心都对质量监控非常重视,对质检投入相当的人力和物力。然而,面对庞大的录音样本,质检人员显然不可能听完所有的录音。而且,随着呼叫中心规模的不断扩大,任何一个呼叫中心都不可能不计成本的对质量监控进行无限投入,怎样的质检指标才能对服务质量做出科学的衡量,如何才能通过少量样本对服务质量做出评估,是所有大中型呼叫中心质量监控人员需要思考的问题。本文依托统计学原理对上述问题进行分析。
1 呼叫中心质量监控的主要问题
1.1 平均值的不足
有相当一部分呼叫中心是以监控样本的平均值来衡量坐席的业务水平的。然而仅凭“平均值”事实上是无法对坐席人员的真实水平做出准确评估的。平均值所解决的是准确度问题,但却没有解决精密度问题。不论工业生产,还是电话服务,首要的目标都是生产合格的产品,只有准确度和精密度双高才是真正的高品质。
打个比方,A和B两名员工生产同一产品,该产品的耐磨度不能低于2.5,否则为不合格品,同时耐磨度越高越好。A和B各生产了5件,A(2.4、2.3、2.7、2.8、2.8)、B(2.5、2.6、2.6、2.6、2.5),A的平均值为2.60,B的平均值为2.56。可见,虽然A的平均值要高于B,但A有2件不合格品,B却是全部合格,哪个水平更高呢?从质量管理的角度看,当然是B。
我们再继续刚才的例子,如果A(2.4、2.4、2.5、2.6、2.6)、B(2.5、2.6、2.6、2.6、2.5),A的平均值为2.50,B的平均值为2.56,单看平均值,我们会认为A是合格的,因为平均值没有低于2.5,而且与B的差距也很小,只有0.06。但是我们需要看到A有2个不合格品,也就是有40%的不合格率,而B是全部合格,差距还小吗?
另外,一名坐席正常情况下每个月至少要接听1000通电话,以监控30通电话而言,根据排列组合公式可知,在不重复抽样的情况下,能够产生2.43×1055种组合,仅以其中的一个组合来判断坐席的业务水平,显然无法让人信服,因为管理人员无法回答如下问题:这一组合结果与真实值的差异到底有多大,这一组合结果的可信程度到底为多少?
1.2 如何确定监控数量
既然受成本限制,监控力量是有限的,那在确保随机抽取录音的情况下,对于每一位坐席每月至少应该监听多少通录音呢?有科学的公式可供计算吗?
2 运用统计学的方法解决问题
2.1 获知准确度
前文提到,在不重复抽样的情况下,从1000通录音中,随机抽取30通录音,将产生2.43×1055种组合,那这30通录音的平均值当真就没有任何意义吗?当然不是。这30通录音的平均值包含着整体1000录音平均值的信息。事实上,用这30通录音的平均值当作整体1000通录音平均值的做法在统计学上叫做点估计,我们需要做的是,利用这30通录音的数据,来估算出整体1000通录音的真实情况,这在统计学上叫做区间估计。区间估计又分为双边估计和单边估计,单边估计又分为上限估计和下限估计,在这里暂先只讨论上限估计。
在具体介绍上限估计之前,首先要引入两个重要的概念:上限置信区间和置信水平。
用较为通俗的话来讲就是,这1000通录音的真实平均值最高不会超过多少分(记作μ),而且这个“μ”的“可靠程度”有多少。这里所说的“μ”就是上限置信区间,“可靠程度”就是置信水平,置信水平是用概率来度量的,习惯上把置信水平记作1-α,这里α是一个很小的正数,称为显著水平。
根据μ的上限估计公式可知:
其中,是指已监控的30通录音的平均值,s是指已监控的30通录音的标准差,n是指监控数量(在本例中即为30),tα(n-1)是指t分布的反函数。
假设,置信水平为99%,
计算可知,t0.01(30-1)=2.462,μ=90+2.462× =93.596
也就是说,这1000通录音的真实平均值最高不会超过93.596,并且这一结果有99%的“可靠程度”。
需要说明的是,在利用上述公式进行计算时,一般情况下要求n≥30。
另外,tα(n-1)的计算较为复杂,但可以通过EXCEL轻松获得,EXCEL函数为TINV(2*α,n-1)。
2.2 获知精密度
对于精密度的度量,我们采用一个指标,叫做“每千件不合格率”(Part Per Thousand,简称:PPT),工业企业一般用“每百万件不合格率” (Part Per Million,简称:PPM)。要对PPT进行计算,首先要对总体标准差(记作:σ)进行计算,以上例为例就是要对1000通录音的真实标准差进行下限估计。为什么在这里要进行下限估计,而不是进行上限估计呢?因为对于PPT的计算,μ越大或σ越小,PPT就越低,相应合格率(记作:η)就越高,作为KPI指标而言也更有说服力。我们继续以上例为例:
根据σ的下限估计公式可知:
其中,α是指显著水平,s是指已监控的30通录音的标准差,n是指监控数量(在本例中即为30),是指χ2分布的反函数。
根据上例已知,
计算可知:
同样,χ(n-1)的计算也较为复杂,但可以通过EXCEL轻松获得,EXCEL函数为CHIINV(α,n-1)。
现在我们可以进行PPT的计算了,假设合格线(记作:TL)为85分(低于85分为不合格),根据正态分布概率统计公式可知:,即求标准正态分布的概率,EXCEL函数为NORMSDIST((μ-TL)/σ)。
根据上例可知,μ=93.596
经计算,η=92.00%,PPT=(1-η)×1000=80
也就是说,这1000通录音中至少有80通为不合格的录音,并且这一结果有99%的“可靠程度”。
至此,我们已经从数理上解决了准确度和精确度的问题。
2.3 最少监控量的确定
最少监控量是有科学的统计公式可供计算的,具体如下:
①重复抽样情况下:
最少监听数量=(概率度2*标准差2)÷(极限误差2)。
②不重复抽样情况下:
最少监听数量=(全部录音数量*概率度2*标准差2)÷(全部录音数量*极限误差2+概率度2*标准差2)。
其中,“概率度”是由置信水平(1-α)确定的,可通过EXCEL函数NORMSINV((2-α)/2)计算求得。“极限误差”是人为设定的数值,通俗而言,就是人们希望将误差控制在多少分之内。
在实际工作中,当(n/N)
2.4 正态性检验
上文在介绍如何计算PPT的过程中提到了正态分布。事实上,上述PPT计算公式是以样本服从正态分布为假设前提的。虽然正态分布广泛存在,并且根据数理统计原理可知,当样本数量足够大(n≥30)时,样本将符合或近似符合正态分布。但出于严谨,如果条件允许,对正态分布进行检验是有一定必要的。
对正态分布进行检验的方法有很多种,我国已经专门制定了国家标准GB4882-85正态性检验,其中介绍了国际上采用的先进的检验方法。在各种检验方法中,根据奥野忠一等人在20世纪70年代进行的大量模拟计算的结果,认为正态性检验方法中,总的来说,以“偏峰检验”和“夏皮罗-威尔克法”较为有效,前者以样本数量大于100为宜,而后者仅适用于样本数量大于3小于50的情况。因此前者适用于对整体进行评估,后者适用于对坐席个人进行评估。
另外,当大数据下如果检测结果不符合正态分布,则有可能是抽样或评分标准的执行出现了问题,正态性检验在一定程度上也是对抽样是否随机,以及质检人员对评分标准掌握是否统一的一种预警。
3 结束语
运用统计学无疑可对质量管理工作进行科学、有效地改进。但是由于统计学较为专业,一般只有质量监控人员才会去关心和予以运用,其他人员很少会去学习了解,运用更是无从谈起。
呼叫中心的管理人员必须了解,21世纪的质量管理,已经进入了全公司(组织)质量管理(TQM,Total Quality Management)的时代,研究并运用统计学知识对质量管理工作进行完善和改进绝不仅仅是质量监控部门的事情,只有全公司(组织)各部门共同关心、重视、积极参与其中,质量管理水平才能真正提高。
【参考文献】
[1]栗方忠.统计学原理[M].东北财经大学出版社,2008.
[2]许乃威.从统计学看呼叫中心质量管理[J].客户世界,2007(12).
[3]盛骤,谢式千,潘承毅,编.概率论与数理统计[M].浙江大学,4版.高等教育出版社,2008.
关键词:正态分布 成绩评定 标准分0前言
传统的仅凭卷面分数和平均分数评估学生学习成绩和教师教学效果的方法,带有片面性。因此,诸如由学生各科卷面总分排名来评定奖学金,确定毕业分配时的优先分配政策,由主观制定的卷面分数段的比例大小和仅由平均分数的高低评估教师效果的好坏,是不合理的,本文给出一种新的评估体系供大家参考。
一、平均分数体现整体水平
1、某班某学科的平均分数
x1=
2、求N个班某学科的平均分数应“加权”
x=
其中x表示加权平均数,ki表示第i班总人数,xi表第i班平均分数。
二、标准差反映平衡程度
除了解体现整体水平的平均分数外,还应了解每个人的分数离班平均分数的偏差大小。因此可以利用数理统计中的标准差计算公式
δ=
(其中x为卷面分数,x为平均分数,N为全班总人数)。例如,甲乙两班同一科的平均分数都是81.5分,标准差依次为9.2和10.3,从而知甲班比乙班要稳定些,发展平衡些。
三、“标准分”取代卷面分来评估每个学生学习成绩的总体水平
在评先、评优和奖学金中,常要比较学生成绩的优劣。例如:某班数学卷面平均分数为:x1=69.4,标准差为δ1=8.5。语文卷面平均分数为:x2=87.6,标准差为δ2=10.5。学生张某数学60分,语文94分。王某数学83分,语文68分,按传统的方法认为:张总分154比王151分多,因此张优先于王。这种评估是不合理的,原因是各科之间的卷面分数的参照点(零点)与单位都不同,不能相加求和来互相比较。
在现代的体育统计和有关统计文献中,都采用“标准分”(符号意义同上),即学生的成绩 与班平均分之差比标准差。这样能统一尺度,具有合理的可比性。如张和王的成绩可以合理的评估如下(表1):
表1
(注:习惯用正分,故一般取T=10Z+50,T分大约在20至80之间。它是把Z分扩大10倍,又往后平移50,消除了负数。)结果张两科总标准分95次于王97.3,与卷面分数结论相反,标准分反映学生在全体考分中的相对位置,故又称相对分。至于不同班级、不同学科的总分,由于试卷有难易之分等因素,更应采用标准分。
四、考试分数合理分布的评估依据
怎样评价一班的考试分数的分布是否合理,依据是什么?以前有关文献都认为:卷面分X是正态随机变量X~N(x,δ2),标准分Z服从标准正态分布Z~N(0,1)。但都没有加以论证或进行实际的统计分析。因此有些提法不尽妥当:因为样本平均分数x与样本标准差δ均为统计量,是随机变量,而正态分布的两个参数都是常数;如果X是随机变量,X~N(μ,δ12),X1,X2,∧XN是来自总体X的样本,则x是μ的无偏估计。δ是δ1的极大似然估计,一般地其观察值x≠μ,δ≠δ1,所以X~N(x,δ2)的提法不妥。而且也推不出Z~N(0,1)(证略)。
但是,通过多年来对我校各个教学环节情况比较正常的教学班的考试分数的统计分析发现标准分Z是近似服从标准正态分布的(有文献曾认为或假设Z近似地服从标准正态分布的说法)。由数理统计学可知:随机过程可以用族中的典型样本函数来表征。因此我们可以把Z近似地看作服从标准正态分布的随机变量,从而以标准正态分布作为评估学生考试分数合理分布的依据,根据“3δ”原则换算出标准分的合理分布评估依据:分段比例和累计比例。
转贴于
(1)分段比例:
T≤20的比例为0.0013
40<T≤60的比例为0.6826
30<T≤70的比例为0.9544
20<T≤80的比例为0.9974
T>80的比例为0.0013
(2)累计比例:
T≤30的比例为0.0228
T≤40的比例为0.1587
T≤50的比例为0.5000
T≤60的比例为0.8413
T≤70的比例为0.9772
T≤80的比例为0.9987
记:│(取T≤20的人数/总人数)-0.0013│=A1
│(取T>80的人数/总人数)-0.0013│=A2
│(取40<T≤80的人数/总人数)-0.6826│=A3
│(取30<T≤70的人数/总人数)-0.9544│=A4
│(取20<T≤80的人数/总人数)-0.9774│=A5
则ΣAi=A1+A2+A3+A4+A5的值越小说明说明分布越合理。并在记分册中增加“平均分”,“标准差”,“标准分T”三栏,以方便教学管理部门进行评估。
五、统计分析实例
以我校2005级会计一班数学成绩为例见表得知(见表2,表3),是基本符合标准正态分布的。同时发现,越是成绩好的学生,各科卷面总分和标准总分排名基本相同,且各科成绩越平衡;越是各科成绩不平衡的,卷面总分与标准总分排名就相差较大(如第3,24,26学号),由此说明由标准分来评估学生学习成绩的总体水平是合理的科学的。
表2:分段比例对照
表3:累计比例对照
六、总结
通过以上讨论和计算,可以得出以下结论:
1、在没转换成标准分之前,各科的分数是不能比较的。
2、用原始分高出平均分多少来衡量各科,也是很不科学的。
3、一旦转换成标准分,不但上述比较变得科学易行,而且各次考试之间也是应该比较的。如Z后次–Z前次=进步幅度。
4、平均分反映整体水平;标准差反映班级整体发展平衡程度;标准分反映学生个体各科发展的平衡程度。
4、分段比例和累计比例是学生成绩合理分布的评估依据。
5、统计数据与理论数据之差A1,A2,A3,A4,A5之和ΣAi是刻划合理分布程度的依据。
6、任何一次大型考试,不但要公布“平均分”,而且要公布“标准差”。这两个参数都是十分重要的。这样,各校,各班,个人在这个大系统中的地位都可以很容易的算出。
七、结束语
教学效果的评估,是“终端评估”,是教学管理的重要环节,它的合理性和准确度不但体现在变定性评估为定量评估,而且还依赖于教学“过程评估”的合理性。如试卷的难易程度,评卷的准确性与公正性,还有学生平时成绩的评定,考场纪律等。这都需要长期摸索和认真细致的统计分析。多年来,我们本着以抓“过程”保“终端”,以抓“终端”促“过程”的原则,在抓教学效果的评估的同时,在试卷评分方面也进行了一些改革和尝试,如运用美国数学教授T·L·Saaty提出的“层次分析法”和湖南农大的“加权评分法”,收到了一定的效果。
参考文献:
1、盛骤.概率论与数理统计.北京:高等教育出版社,1998.
关键词:试配强度计算、强度综合评定法、砌筑砂浆质量保证率
本文根据近年来砌筑砂浆技术不断进步,砖底模已经被淘汰,钢底模的试配强度计算还不够完善的现状。将JGJ/T98-2010与JGJ98-2000砌筑砂浆配合比规程中的试配强度计算方法进行比较,从而对砌筑砂浆配合比规程中的试配强度计算方法进行评判。
1、JGJ/T98-2010与JGJ98-2000砌筑砂浆配合比规程中的试配强度计算比较
在JGJ/T98-2010砌筑砂浆配合比规程中试配强度计算与JGJ98-2000的砌筑砂浆配合比规程中的计算方法不一样。JGJ98-2000的试配强度计算为fm,0=f2+0.645。其中fm,0指的是砌筑砂浆的试配强度。f2指的是砌筑砂浆的抗压强度平均值,其中抗压强度由三轴抗压强度实验获得,一般情况下由三个试块的抗压实验结果进行平均,平均值作为砌筑砂浆试块的代表值。指的是砌筑砂浆的现场强度标准差,是根据多年现场的资料进行收集与统计得来的。由于近几年来砌筑砂浆的技术不断进步,砖底模已经被淘汰,钢底模不断在施工中得到应用。我国针对变化及时的调整砌筑砂浆配合比方法,提出JGJ/T98-2010砌筑砂浆配合比规程。以适应现阶段砌筑砂浆施工要求。JGJ/T98-2010的试配强度计算公式为fm,0=kfm,k。其中k(与k值如表1所示)为经验参数,它是通过多年现场的资料进行收集与统计得来的;fm,k指的是砌筑砂浆的强度等级值,也就是砌筑砂浆的设计强度标准值。
表1 JGJ/T98-2010规范中的砌筑砂浆强度标准差与k值
通过以上所述的JGJ/T98-2010与JGJ98-2000砌筑砂浆配合比规程中的试配强度计算可以看出:
1)公式参数不同。JGJ98-2000的规范中所提及的砌筑砂浆的抗压强度平均值f2并没有运用到JGJ/T98-2010中。这是由于现阶段的砂浆试模由砖底模改变为钢底模,所以变异系数、标准差均相对JGJ98-2000的阶段有所减小。所以在JGJ/T98-2010中并没有体现砌筑砂浆的抗压强度平均值。直接可以通过砌筑砂浆的强度等级值,就可以对试配强度进行计算。
2)计算公式不同。JGJ/T98-2010的试配强度计算公式引入了k值,由JGJ/T98-2010试配强度计算与JGJ98-2000的比较可以看出试配强度计算方法更为简化,只利用k与强度等级值就可以进行试配强度计算。但是k并没有明确的物理意义,只是对强度标准差率的转化。弥补JGJ98-2000中出现的砌筑砂浆的抗压强度平均值与设计标准值之间的偏差问题,减小了绝对误差。
3)标准差没有在公式中体现。本文通过研究与论证,在JGJ/T98-2010中所规定的仍然采用JGJ98-2000中所规范的数据。所以在试配公式中没有采用,可以降低钢底模与砖底模之间的误差,而k值在JGJ/T98-2010也是采用材料强度的概率分布中的正态分布来确定。在规范中k值的解释是这样的:“当标准差为0.25倍的砂浆强度等级要求的强度的情况下,fm,0为1.2倍的f2,进行试配后的砂浆测得的强度均不低于强度等级要求的强度78.8%”。 当标准差为0.30倍的砂浆强度等级要求的强度的情况下,fm,0为1.25倍的f2,进行试配后的砂浆测得的强度均不低于强度等级要求的强度79.9%”。本研究通过以下介绍的强度综合评定法可以对砌筑砂浆配合比规程中的试配强度计算方法中的k值范围进行评判。通过非统计学的角度,评判k值是否可以代替进行试配强度的计算。
2、强度综合评定法评判JGJ/T98-2010的试配强度计算方法
强度综合评定法是基于混凝土的较为完整的评定体系得来的。由于混凝土与砂浆的配比机理相似,所以可以借鉴混凝土的强度综合评定公式以及概念。但是由于砂浆的立方体抗压试块相对于混凝土试块组数较少。所以拟采用非统计方法进行砂浆试配强度计算。即mf21.15fm,k和fmin0.95fm,k;其中mf2指的是同一验收批的砂浆立方体抗压强度的平均值;fm,k指的是砂浆立方体抗压强度标准值; fmin指的是同一验收批的砂浆立方体抗压强度的最小值。如果按照混凝土的生产质量水平划分,混凝土的实际强度要不低于强度等级所要求的强度的85%。但是通过砌筑砂浆施工工作的总结,砌体为一种特殊的结构,是多种材料的结合体。砌筑砂浆仅仅是多种材料中的一种,所以砌筑砂浆的强度对于砌体的强度影响是有限的。通过利用砌筑砂浆工程施工资料的收集与统计,当砌筑砂浆的抗压强度降低10%的情况下,砌体强度值则一般下降5%左右。在此情况下可以确定在一般的生产条件下,砌筑砂浆的强度达到强度等级规定的强度的75%~80%即可满足施工要求。所以可以将混凝土的强度综合评定公式中的fmin0.95fm,k修改为fmin0.75fm,k.。比较适合现阶段砌筑砂浆施工的实际情况。由于fm,0=kfm,k带入公式mf21.15fm,k、fmin0.75fm,k中可以得到kmf21.15fm,0和kfmin0.75fm..0 。在这两个公式中mf2的物理意义是同一验收批的砂浆立方体抗压强度的平均值,而fmin则为砂浆立方体抗压强度的最小值。所以则有kmf2kfmin0.75fm,00.75fmin。根据工程实际与试验中的验证不同批次的砂浆立方体的抗压强度的平均值与抗压强度的最小值之间的差距不大于1.533,即为1.15与0.75之商。所以k值的范围可以是1.533k0.75。所以在JGJ/T98-2010的试配强度计算方法中提出的k值为1.15、1.2、1.25均在这一范围内,符合强度综合评定法计算的强度需求范围。
几点建议与看法
通过以上对JGJ/T98-2010中规定的试配强度计算方法进行强度综合评定法评判,我们可以看出其符合强度综合评定法计算的强度需求范围。但是我感觉还是有不足之处有待于在以后的规定中做出完善与修改。本文就JGJ/T98-2010中规定的试配强度计算方法提出以下几点建议与看法:
(1)JGJ/T98-2010的试配强度计算方法中提出的k值在强度综合评定法评判的范围内,可以证明k值的取值是合理的,但是在JGJ/T98-2010的规范中k值的准确值则是由统计学角度来进行确定的。现阶段由于砂浆试模由砖底模改变为钢底模,所以变异系数、标准差均应与JGJ98-2000有所不同。但这一点并未在JGJ/T98-2010中体现出来。在此情况下k值的准确值仍然需要一个长期的资料统计与分析,最好对各种不同条件下的砌筑砂浆施工,采用不同的试配强度计算方法。
(2)钢底模相对于砖底模的强度较大,所以引起的变异系数就会相对减小。标准差也会相对降低,这样就会导致利用JGJ/T98-2010中规定的试配强度计算方法计算出的试配强度相对较高。
所以还要在以后的工作中加强收集钢底模的砌筑砂浆施工的有效数据,通过对大量资料的统计得出新的标准差与k值。这样会使试配强度计算方法施工更加精确,为以后新的砌筑砂浆配合比规程的规范提供参考。
参考文献:
[1] JGJ98-2000 砌筑砂浆配合比设计规程
[2]JGJ/T98-2010 砌筑砂浆配合比设计规程
【关键词】儿童;营养不良;贫困农村
6岁以下是儿童生长发育的关键时期,这一时期患营养不良,将会对儿童的生长发育产生诸多近期和远期的不良反应。全球婴幼儿死因中50%以上,都直接或间接地与营养不良有关。儿童的营养状况是衡量人群营养状况的敏感指标,也是国际上开展营养监测所采用的常见指标。
国内外的研究显示:儿童营养不良的影响因素主要由贫穷所致食物短缺、家长缺乏营养知识、儿童偏食以及忽视科学喂养等方面构成。
1调查对象和方法
1.1调查对象本调查系2009年中国疾病预防控制中心“建立贫困地区6岁以下儿童营养健康状况相关危险因素检测数据信息系统”项目的子项目之一。采用多阶段随机整群抽样方法,确定将商都县和扎鲁特旗作为调查点,共抽取了4个乡8个居委会(村),628名0-5岁儿童为调查对象。
1.2调查指标测量和结果判定
1.2.1儿童体重和身高(长)测定体重测量:采用RCS-160数显电子人体秤,能自行站立的儿童直接电子秤称重,幼小儿童则由母亲抱其测量后再单独测量母亲体重,二者之差即为儿童体重,重复测量两次。
身高(长)测量:3岁以下儿童身长测量使用WB-A卧式测量床,3岁及以上儿童使用SZ-200坐高身高计进行测量。
1.2.2营养状况评价指标根据0-5岁儿童的生长发育特点,本次营养状况评价采用Z评分法,参考2000年中国CDC推荐的性别年龄别身高体重参考值,作为评价儿童营养不良的评价指标。本次主要选择发育迟缓率、低体重率和消瘦率为判定儿童营养不良情况评价指标。
1.2.3营养状况评价标准根据WHO通过cubic splines(三次样条函数)对曲线进行平滑处理的BoxCox-Power-Exponential(BCPE)方法所绘制的儿童生长曲线来进行比较:中重度发育迟缓―年龄别低于参考标准身高中位数减两个标准差和三个标准差;中重度消瘦和低体重―年龄别体重低于参考标准体重中位数减两个标准差和三个标准差;中、重度营养不良―低于标准年龄别身高、年龄别体重、身高别体重两个标准差和(或)三个标准差。
1.3统计分析用EpiInfo软件建立数据库和逻辑检错程序,资料统一录入。采用spss13.0统计软件进行数据录入及统计分析,采用率进行统计描述,运用χ2检验进行比较分析,假设检验的水准均设定为0.05。
2结果
2.1基本情况本次在商都县和扎鲁特旗共调查了0-5岁儿童628人,分别为312人(49.7%)和316人(50.3%)(见表1);男孩317人(50.5%),女孩311人(49.5%),各年龄组儿童人数比例基本均衡(见表2)。调查儿童中,民族因素无显著差异。
2.2内蒙古商都县和扎鲁特旗0-5岁儿童营养不良情况
2.2.1营养不良情况概况与2006年全国农村0-5岁儿童营养不良水平相比,我区商都县和扎鲁特旗0-5岁儿童发育迟缓率降低约2.1倍,差异有统计学意义(X2=37.18,P
2.2.2两个地区之间0-5岁儿童营养不良水平比较商都县和扎鲁特旗的0-5岁儿童营养不良率差异有统计学意义(P
3讨论
2009年我区商都县和扎鲁特旗0-5岁儿童营养情况与2006年全国农村儿童平均水平相比,儿童生长发育迟缓率(3.8%)低于全国农村平均水平(11.7%),而低体重率(9.4%)和消瘦率(8.8%)均高于全国农村平均水平(6.9%和2.4%)。这一结果主要与该地区社会经济、文化教育水平、以及喂养和母亲的照料等因素密切相关。
3.1家庭贫困经济的发达和落后必然影响儿童营养素的摄取和营养状况[1],虽然造成儿童营养不良的因素是多方面的,且各种因素间相互影响,但贫困往往是造成儿童营养不良的根本原因[2]。抽样调查的两个地区为国家级贫困县,调查中年人均总纯收入不足1500元(人民币)的分布,商都县为42.6%(133/312),扎鲁特旗达47.2%(149/316),两地差异无统计学意义(X2=1.30,P>0.05)。家庭收入的低下可影响母亲及儿童的膳食结构,进而造成营养不良。
3.2母亲/双亲文化程度偏低缺乏科学喂养知识是影响儿童健康的重要因素。在调查中发现,贫困地区儿童的父母或抚养人受教育程度普遍较低,其中初中或初中以下的文化程度占到了60%以上。由于缺乏科学的喂养知识,添加辅食的时间过晚或者品种过于单一,都会导致儿童机体的抵抗力低下,反复患呼吸道、消化道疾病导致营养不良发生率升高[3]。
综上所述,要加强我区贫困地区妇幼保健队伍的建设,提高队伍的专业性和指导性;其次,开展健康教育,加强母亲的儿童营养相关知识,进行科学喂养,巩固和提高0-4个月母乳喂养率[4]的同时,注意幼儿期儿童及时添加辅食,注意各种微量元素的摄入和平衡。保证儿童生长发育所需的各种营养素,改变儿童不恰当的饮食习惯等。
参考文献
[1]刘爱东,赵丽云,于冬梅,等.中国5岁以下儿童营养不良现状及其变化趋势的研究[J].卫生研究,2008,37(03):324-326.
[2]陈春明,何武,常素英.中国儿童营养状况15年变化分析――中国儿童生长发育主要影响因素的变化[J].卫生研究,2008,35(06):765-768.
[3]Brown plementary feeding of young children in developing countries:A review of current scientific knowledge[M].Geneva:WHO,1998.
[4]富振英,常素英,等.1998年中国4个月以内婴儿纯母乳喂养与生长发育[J].卫生研究,2000,29(05).
关键词:高职英语 教学 统计
中图分类号:H319 文献标识码: A 文章编号:1672-1578(2012)01-0030-02
1 引言
高职英语教学的目的是培养学生基本的英语听、说、读、写、译技能,使学生在校期间具备一定的英语应用能力,能够很快适应社会的发展。
高职英语教学的基础阶段要求在一到二年级完成,也就是要求大多数学生在前两年时间通过英语等级测试。在此阶段,虽然学生都明白自己的学习目标和应该达到的要求,对于如何实行学习计划大多数学生却十分茫然。而老师对于学生的每一个具体要求掌握的技能的水平也缺乏具体了解,以至于在教学中不能争对性教学。本文就两个班级的学生大学英语三级成绩进行了分析,了解教学要求以及存在的一些问题,探讨了如何对症下药,全面提高学生们的英语水平。
2 调查方法
2.1调查对象
某高职院校一年级两个班的50个学生参加了11年6月的大学英语三级测试,对他们所取得的成绩进行统计分析。其中男生5人,女生45人。
2.2数据收集与分析
从学校考务中心获得该班级大学英语成绩总分及各分项得分,运用SPASS软件对其进行分析。
3 分析结果与讨论
参加本次数据统计的大学英语考试成绩情况如下:
表一:平均分与及格率
表二:大学英语三级考试的各类题型描述统计
从表格一可以看出及格率达到了59.08%,也就说这次考试还是能比较真实地反映了学生们的英语水平。然而从分项成绩来看,有几个题型的结果却不尽人意。根据表三的结果可以得知:dfb=3,dfw=196,查F值表,F(3,196)0.05=2.65,F(3,196)0.01=3.88。F=82.251>F(3,196)0.01=3.88,则P<0.01。由此我们就可得知,这次考试至少有两组题型存在着显著性差异。也就是说学生对每个题型所考知识点的掌握的程度有着明显差别。也就说是学生的英语各项水平并不是全面发展,而是参差不齐。
根据表二,我们可以得知试题第一部分听力的平均分为13.06,标准差为3.113,相对于其它三个题型,标准差值较高,也就说明学生的分数离散度大,分布范围较广。第二部分为语法,平均分仅为10.80,及格率仅为34%标准差为2.295。相对来说标准差较小,学生的得分分布较为集中。但是其平均分却不及格,这就说明,整个班级的学生的语法基础普遍薄弱。第三部分是阅读,平均分为15.40,也未达到及格线。但是其标准差为4.066,相对于其它三部分,它的标准差最大,也就是说在这一部分中学生所得分数差距很大,及格率为38%,由此可判断这一部分的成绩很不理想理想。第四部分为翻译,平均分为19.72,高于及格线,其标准差为1.959,也就是说这一部分的成绩相差较小,而且成绩普遍较高。四个部分比较,此部分得分大大超出其它三个部分。
根据上述数据分析,我们教师该怎么在以后的教学中进行针对性和有效性的教学呢?对于听力而言,虽然平均分已经达到及格,但这并不意味着教师就可以不引起重视了,因为这一部分的标准差还比较大,也就说还有一部分学生的听力成绩很不理想,那么教师在教学过程中就应该在努力培养优生的同时还要关注落后学生的水平,在课堂上要让他们跟上学习的步伐。所以选择听力材料的时候不要太难,应该照顾这一部分学生,不能让他们感到太难最终失去兴趣而放弃学习。同时也可以建议他们在课外多练习听力。课堂上最好采取全英文教学,让学生经常处于英文环境中。不能因为有些同学听不懂而采取半汉半英教学,因为久而久之学生会产生依赖心理,听不懂的老师会汉语解释,以至于他们懒得去听英语。这样对学生听力水平提高产生很大障碍。
语法教学一直是老师和学生大难题。从这次一考试又可以看出大多数学生的语法基础知识掌握的不牢固。但是语法是英语学习的根基,所以教师尤其是精读教师在平时的教学中应该多讲解,只有学生的语法知识上去了,其它的各项水平才能提高。如果课堂时间有限,可以鼓励学生课余时间复习巩固语法,如可以购买适合他们的语法书,最好是有配套练习的,自学时候如果遇到不懂的问题让他们自己向老师请教。而且对重难点之处要学会做笔记。笔者认为要想语法学的好一定要多做一些练习,只有在练习中才能重新认识和记忆你所学的语法知识。如果只是背诵语法规则,那样不但容易忘记而且还容易搞混淆,最终没有实际效果。教师的讲解加上学生自己练习肯定会有助于成绩的提高。
阅读的及格率很低,平均分也没及格,标准差又是最大的,可以得知,学生的阅读水平差距非常大。对于基础阶段的学生而言,他们能读懂一般性题材的文章,了解大意进行简单的分析即可。但是大多数这最基础的要求都没有达到,说明阅读教学还存在很大漏洞。要想提高他们的阅读水平,主要是靠平时多读。那么就得培养他们的阅读兴趣,比如可以让他们自己去购买喜爱的英文杂志,选择自己感兴趣的版面阅读。每天坚持阅读,厚积薄发,阅读水平就可以上一个新的台阶。
最后一部分是翻译,这个部分也算是是本次考试中最为理想的部分。成绩明显好于其它三部分。这也就说明学生对英语的应用能力还是达到了一定的水平。也算是达到我们的教学方针要求,重在应用。
4 结论
以上论述表明职校教师在注重学生英语应用能力的同时,还应该大力提高学生的听力、阅读和语法水平。最好做到学生听、说、读、写、译的全面发展,让学生的英语综合能力得到提高。
参考文献:
[1]王孝玲.教育统计学[M].上海:华东师范大学出版社,2007.
[2]刘润清.外语教学的科研方法[M]. 北京:北京外语教学与研究出版社,1999.
【关键词】天线测试 波瓣宽度 标准差
1 天线性能判定的争议
随着移动通信网络的发展,运营商对天线的质量已非常重视,但在天线辐射性能指标合格判定方面出现争议,基本有以下四种意见:
(1)按平均值判定,平均值需满足指标要求;
(2)按最差值判定,天线最差值需满足指标要求;
(3)按照平均值加最差值判定,在平均值满足指标要求的情况下,最差值可以适当劣化;
(4)采用统计学方法,按照平均值、标准差及最差值综合判定。
天线辐射性能各指标具有很强的关联性,为确保天线的整体性能,在设计时往往根据使用场景牺牲部分非关键性指标或者某些指标的部分频点,因此对天线进行合理的评价是有必要的。
2 各种判定方法的特点
目前国内标准往往只提出天线指标要求,并没有提出具体的判定方法,操作时多采用前三种判定方法。国际上,由下一代通信网国际移动标准化组织(NGMN,Next Generation Mobile Netwoks)推荐第4种方法。
国内标准一般推荐测试高、中、低三个频点。对窄带天线,辐射性能变化一般不明显,使用平均值、最差值判定方式能够体现天线的总体性能,且由于测试频点少、效率高,测试成本低,具有一定的优势。对宽频甚至超宽频天线,辐射性能可能有较大的波动,三个频点已无法真实地体现天线性能。日常测试中往往选择六个、九个甚至更多的频点,有些测试值比较分散,仅仅采用平均值已难以区分天线的性能,而采用平均值、标准差及最差值综合判定的方法具有明显的优势。在平均值相同的情况下,标准差小则说明测试离散性小,天线一致性好,频率可扩展性强。
3 不同判定方法的比较
为验证不同判定方法的区别,笔者选取两副不同厂家的天线,频率范围1 710~2 170MHz,半功率波束宽度65°,增益18dBi,参照下一代通信网国际移动标准化组织(NGMN)推荐的方法进行统计分析,比较两副天线的差异。为充分体现天线的实际指标,选择20个频点进行测试,得到的天线水平面半功率波束宽度参数如表1所示。
两副天线都满足目前行业标准的要求,且平均值指标比较接近。根据表1的数据分别绘制天线水平面半功率波束宽度曲线图,如图1、图2所示。1号天线曲线平滑,波束宽度一致性较好,频率可扩展性好;2号天线指标出现明显波动,已接近行标极限。
从表1中统计出两副天线的角度分布区间,获得表2中的天线水平面半功率波束宽度分布数据以及图3、图4的分布图。通过统计,1号天线有87.5%的测试点落入区间64°—69°;2号天线仅有57.5%的测试点落入区间64°—69°,且落入指定区间的频段不连续。参照下一代通信网国际移动标准化组织(NGMN)推荐的表示方法,1号天线测试结果为(66.6°±2.3°),2号天线测试结果为(66.0°±4.6°)。由此可见,1号天线波束宽度明显更集中,采用平均值、标准差及最差值综合判定的方法更能全面体现天线的性能。
4 结束语
通过以上数据及分析,两副天线均能满足行业标准要求,且平均值非常接近,按目前平均值、最差值方法不能充分体现优秀产品的性能。建议在宽频、超宽频天线测试时,应采集足够多的频点,给出测试平均值、最大值、最小值、标准差、分布区间等数据,进行更加准确科学的测试结果评估,为运营商采购天线的质量提供更严谨的保证。
参考文献:
[1] Dottie Mcleab, Kevin Linehan. Recommendation on Base Station Antenna Standards by NGMN Alliance N-P-BASTA White Paper Version 9.6[A]. The 2013 Meeting of NGMN Alliance[C]. 2013.
[2] 王伟,段宝岩,马伯渊. 一种大型反射面天线面板测试与调整方法及其应用[J]. 电子学报, 2008(6): 1114-1118.
[3] 李福剑,李彦文. 天线测试中的误差分析[J]. 舰船电子对抗, 2007(1): 115-118.
关键词:社会经济统计学;数据;教学
社会经济统计学是高校经济管理专业的必修课之一,在经管类的专业课中属于教学难度较大的一门。不少学生反映统计学课程枯燥、难学、不实用,即使在考试中能够通过,在现实中也不知如何加以应用。改变这种状况的一个根本出发点,在于回归社会经济统计学课程的原始目的,以数据导向的原则对课程进行全面改革。
一、目前社会经济统计学教学中存在的主要问题
在过去,我国统计学界一直将社会经济统计学与数理统计学划分为两个性质不同的学派,将社会经济统计学完全限制于描述统计范畴,从而影响了社会经济统计学的应用。近年来,随着经济管理研究中数学模型的应用日益增加,统计学界又出现了一种矫枉过正的倾向,即过分偏向数理统计学,否认社会经济统计学的独立性。近年出版的各种统计学教材中,数理统计的内容所占比重不断增加,甚至到了满书都是数学公式的程度。
目前的社会经济统计学课程由于过分偏向数理统计,在教学中仍以统计公式推导为主。许多统计学教师都是数学专业出身,对于严谨的数学逻辑框架情有独钟,但其面对的教学对象却属于带有明显文科性质的经管类专业学生,没有能力也没有兴趣去追求数学公式的完美。这就造成了教与学之间的矛盾。
社会经济现象与自然科学现象有着本质的不同,一个重要的特点就是研究对象是人的活动,许多活动是很难用精确的数学逻辑来理解的。在自然科学研究中,通过严格控制实验过程,可以使数据表现出稳定的行为特征,与特定的研究模型相吻合。而在社会经济研究中,研究对象是不受约束的个人或者企业,其行为受到各种因素的影响,有时候会表现得十分异常。
以回归分析为例,在数理统计学的教学中,学生拿到的教学习题数据都是性质良好的,回归结果往往表现出较强的统计显著性。但在真实的经济分析中,一次回归能够得到显著系数是非常难得的,由于现实中“噪声”的影响,大多数回归模型都无法通过统计检验。例如,从理论上说,居民的收入与支出之间应当存在着线性或者二次曲线型的相关关系,但学生在利用真实的统计数据进行分析时,往往很难得出这样的结论。一些数理统计成绩很好的学生在使用统计数据撰写论文时,经常会陷入一种困惑,即发现现实中的数据特征与自己所学的理论完全不能吻合。
鉴于这样的问题,在社会经济统计学教学中,应当将更多的精力用于帮助学生形成认识和理解数据的能力,要教育学生适应各种“不完美”的数据,学会从数据中剔除“噪声”的影响,发现数据的本质。教学实践表明,这样的教学改革思路不但能够使课程更加适应现实需要,而且能够极大地调动学生的学习兴趣。
二、数据导向的统计学教学思路
数据导向在统计学教学中主要表现在以下三个方面:
1.注重培养学生对于数据质量的认识
数据质量是进行统计分析之前必须考虑的一个重要问题,由于各种人为因素的干扰,社会经济统计数据往往存在着不同程度的质量问题。在教学中,应当注重培养学生对调查数据质量的认识能力。
调查是所有统计工作的起点,调查数据的质量直接影响到统计分析的效果。人们在日常所接触到的统计数据,都是通过各种渠道调查得来的,如果学生不了解调查的原理,就很难理解数据中各种错误的产生原因。在许多社会经济统计学教材中,统计调查所占的比重都很小,有些甚至直接与“抽样估计”的内容合并在一起,把抽样误差分析作为统计调查的惟一内容。事实上,统计调查所涉及的内容是非常广泛的,抽样误差只是其中很小的一个方面。把统计调查理解为仅仅是抽样误差计算,是一个极大的误区。
基于这种考虑,应当大幅度提高统计调查内容在课程中所占的比重,使之达到全部课时数的1/3左右。教学内容应当包括统计调查的分类、各种抽样调查形式的优缺点、调查误差的来源等等,其核心在于使学生理解影响原始数据质量的各种因素。
在有关抽样调查的内容中,如何确保抽样的随机性是一项重要的内容,对这项内容的深入讨论,能够帮助学生理解随机性对于统计工作的意义,以及在现实中各种可能出现的违背随机性要求的情况。
调查中的非抽样误差是统计学研究的前沿,在传统的统计学教材中往往很少涉及,但这部分内容对于学生理解调查误差的来源有着重要的作用,因此在教学中也应当进行介绍。例如,目前许多媒体都喜欢引用网上调查的数据来分析社会经济现象,但从统计学角度来看,网上调查的抽样框是存在偏差的,其调查结果不能真实地反映全体居民的意见。要认识到这一点,就需要学生对于抽样框的概念、抽样框误差的形式等有一定的认识。对这部分内容进行讲授时,需要教师有一定的社会经济调查实践经验,能够结合现实情况来加以分析。这部分内容如果讲授得当,对于学生来说是很有趣味的。
在条件允许的情况下,教师还可以组织学生参与统计调查的社会实践,通过亲手做几份调查问卷来加深对于统计数据质量的理解。
2.以真实数据替代虚拟的教学数据
传统的统计学教学,侧重于对方法的介绍。教学中使用的数据往往是虚拟数据,或者是经过精选和剪切后的真实数据,这类数据的惟一作用就是让学生练习在课堂中学习到的公式。学生只需要把数据代入公式,就能够得到一个近乎完美的计算结果。这种学习方式带来的一个负面影响是学生误以为统计就是一门利用公式进行计算的科学,而忽略了根据不同数据选择不同计算方法的要求。
采用数据导向的教学方法,要求在教学中抛弃虚构的教学数据,而使用现实中的真实数据作为教学案例。教师对于选择的数据提交给学生,让学生根据所学的各种统计知识进行自主分析。教师应当向学生传递一种权变的统计观念,鼓励学生用不同的方法对同一批数据进行反复处理,从中选择最有效的处理方法。当学生拘泥于某一种习惯的分析方法时,教师应当提示他们思考为什么优先采用了这种方法,而没有采用另一种方法。比如,许多学生在进行综合评价时,习惯选择使用算术平均数,此时,教师可以组织他们讨论是否能够使用几何平均数或者中位数等其他的平均指标。
在教学中,我们曾向学生提供了美国从1900年以来的所有统计年鉴的电子文件,要求学生从中选择出一些有价值的指标,分析美国的经济成长情况、劳动力变化情况等等。由于数据量非常庞大,学生可以选择出许多不同的角度来进行分析,包括横向的州与州的比较,纵向的年度间比较,不同指标间的相互比较等等。每一种分析方法都需要学生深入理解课堂中学习到的各种原理,通过这样的数据分析实践,学生既能够更好地理解统计的精髓,又能够产生浓厚的学习兴趣。
3.借助实验方法解释统计概念
数理统计学的教学侧重于公式的推导,而社会经济统计学则要求让学生更多地理解概念的含义。在教学实践中发现,经管专业学生对于统计分布、参数估计这样的概念往往很难理解,例如在讲授抽样估计的内容时,许多学生无法理解“样本平均数的标准差”这样一个概念,因为在他们的心目中,样本平均数是一次调查中获得的常量,对一个常量计算标准差是很难想象的。尽管教师可以完美地推导出样本平均数标准差的计算公式,但对于学生来说,这只是一个数学游戏,没有任何现实意义。
统计本身是一门来自于实验的科学,数理统计最早起源于对赌场中各种胜率的计算。要帮助学生形成对推断统计概念的理解,就应当从实验出发,通过可触及的数据来理解概率、分布等抽象概念。