前言:我们精心挑选了数篇优质统计学的参数文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
正确认识和评价大学生学习成绩的影响因素,是制定和执行合理的教学计划、教学大纲、教学方法,提高学生学习成绩的主要依据。而学生的学习成绩是一个系统因素集成的必然结果。系统因素的一个主要组成部分是主观因素,它是影响学习成绩的主要原因,即学生自身因素——包括学习能力、学科知识与能力、综合素质、心理素质、身体素质等。
和主观因素相对的因素是客观因素。对大学生而言,学生主观努力程度是影响其学习成绩好坏的主要因素。除此之外,我们也应注意到性别、地区性质、寝室环境等客观因素对大学生学习的影响。
在对学习成绩进行评估时,目前常用的有综合指数法、测试法、评分法、层次分析法和概率统计法。这些方法大部分需要一些数据附加信息或者先验知识,而这些知识又不容易得到;指标体系过于繁琐,很多数据难以收集,对我们来说不易理解和应用。
因此我们决定结合所学的统计分析方法来进行研究,通过问卷或当面咨询方式取得原始数据,运用相应检验初步探讨了性别、地区性质、寝室环境等因素对大学生学习成绩的影响结果。由于不满足t检验关于均值、方差和分布的假设,在下文中我们用一些非参数的检验方法来判断性别因素和地区因素对大学生成绩的影响。
一、研究方法
Wilcoxon-Mann-Whithey秩和检验
假定两总体分布样本和,检验问题为:。
把两样本混合在一起,将个数按照从小到大的顺序排列,令为在这N个数中的秩。根据单样本的Wilcoxon符号检验可知,用表示混合样本中Y观测值大于X观测值的个数,它是对Y相对于X的秩求和。
当数据为大样本时,,双边检验中令,此时,K可以通过正态分布求得任意点的分布函数,a,b由上式Z确定。在显著性水平为下检验的拒绝域为:。
当X和Y中有相同数值时,此时排序有相同的数据则采用平均秩。
Kruskal-Wallis检验
当样本数据取自完全随机设计并且存在3个或更多组时,我们先把多个样本混合起来求秩,再按样本组求秩和。这种Kruskal-Wallis方法也称为H检验。
用表示第i个处理的第j个重复观察,表示第i个处理的观察样本量,将数据形态表中所有数据从大到小给秩。若有相同秩,则同秩和检验中采取平均秩。对每一样本观察值的秩求和,所有数据混合后的秩和为,在零假设下:。
即当统计量H的值时拒绝零假设(k个总置相同),即表明处理间有差异。
当个处理观测值有结点时,则H校正为:。
二、实证分析
(一)研究对象
在本次研究中,我们以湖北省武汉市中南财经政法大学统数学院11级统计学在读本科生为调查对象,以该院11级本科生的成绩差异影响因素为研究对象,在中南财经政法大学南湖校区共抽取40名大学生了解其绩点和地区、寝室成员等信息,其中男生16人,占40%,女生24人,占60%。
(二)研究内容
1.性别因素
为了分析性别这一客观因素的影响,我们从教务部获取并整理研究对象的绩点。
首先运用R软件画出原始数据的箱线图如下:
图1 男女生绩点的箱线图
从图1可以很直观地看出,男女生的绩点存在很明显的差别。女生的绩点普遍要比男生高,虽然绩点很高的男生和绩点很低的女生在图中反应为离群值,但其现实中存在也是正常状况所以不足为奇。
用F代表女生,M代表男生,则Mann-Whithey检验的原假设为。
先将两组数据混合从小到大排列,并注明各绩点对应的组别和秩。统计计算可得:女生人数24,男生16,用表示男生在混合样本中的秩:则由得。因为,或运用R软件的Wilcox检验直接计算的p为0.0007164小于0.05,故拒绝原假设即认为男女生的绩点间存在显著性差异。
以上分析可以看出,性别对学生成绩的影响是比较大的,而且女生的平均绩点大于男生的平均绩点。通过深入调查,我们了解到男生比女生成绩差的原因是自制力不强,沉迷于桌游和网游,而女生们学习则相对较认真,坚持上自习,按时完成作业。
地区因素
为了观察地区性质给学生成绩带来的影响,我们把数据归为两类——城市和农村,用U代表城市(Urban),R代表男生(Rural)。
列出城市和农村学生绩点的W-M-W秩和检验表后可得:农村人数17,城市23,用表示农村人数在混合样本中的秩,则,由于,接受原假设即认为城市和农村的大学生间绩点不存在显著性差异。
因此,地区性质的差异对学生成绩没有显著性的影响。这也从另一方面体现出,随着经济的发展和社会的进步,较之以前农村的教育水平有了很大的提升,来自农村还是城市并不能成为判断学生成绩好坏的显著因素,只能说是在某方面造成了些许影响。
寝室环境因素
寝室氛围在大学生活中扮演着十分重要的角色,一个好的寝室环境能营造好的学习氛围,学习效果也会有所差异。因此我们将男女生各寝室的平均绩点进行了对比分析,如表1所示。
表1 12个寝室学生绩点比较表
A B C D E F
重
复 2.54(19.5) 2.96(34) 2.55(21) 3.22(40) 2.91(33) 2.5(13.5)
2.64(26) 2.75(28) 2.53(17) 3.21(39) 2.49(12) 2.57(23.5)
2.61(25) 2.83(32) 2.88(32) 3.12(36) 2.5(13.5) 2.51(15)
2.37(7) 2.87(31) 2.87(31) 3.13(37.5) 2.43(9)
处理内秩和 77.5 92 101 153 58.5 61
G H I J K L
重
复 2.99(35) 2.78(29) 2.45(10) 1.82(3) 2.53(17) 2.34(6)
3.13(37.5) 2.53(17) 2.46(11) 2.01(4) 2.54(19.5) 2.56(22)
2.32(5) 1.68(2) 2.71(27)
2.41(8) 1.65(1) 2.57(23.5)
处理内秩和 73 46 34 10 87 28
统计分析:
,因为,故拒绝即认为各寝室学生间的绩点存在差异。在R中可以调用Kruskal-Wallis检验程序得,同样可得结论。
分析结果可知,寝室因素对学生的学业成绩影响显著,并不是因为不同的房子对学生的成绩有影响,而是由寝室内部学生造成的。这种影响主要表现为:大学生平时的学习和生活主要以室友为单位,不同的学习氛围极易导致不同的学习行为,所以也就不难理解这一检验结果。因此我们也可以建议高等学校应加强学生宿舍管理,把寝室作为学风建设的重要环节。
关键词:参与式教学;参与式教学设计;QQ群
1背景分析
图1QQ群的网络教学功能常用的网络通信工具有QQ、微信、MSN、Email,其中以QQ最为普及。QQ群具体功能如图1所示,它为网络化学习提供了一个理想的免费平台,本文重点分析QQ群环境下的参与式教学设计。按照第四代参与式设计理念,师生应合作设计教学方案,但受困于目前“上课有交流,下课无联系”的教师和学生课后不见面的现状,难以开展有效的交流合作。依托QQ群推行参与式教学设计可以发挥其网络通信、资源共享的优势,克服无法当面交流的局限,实现师生间的即时沟通。相关学者的研究未能对如何运用QQ群进行参与式教学设计展开详细分析,也未能对可能遇到的问题及其解决措施展开探讨[1-2]。鉴于此,本文拟对参与式教学设计的具体流程,以及教学设计中可能遇到的问题展开探索性分析。
2参与式教学设计的流程规划
2.1建群
根据授课人数来确定创建QQ群的类型。然后登陆进入QQ,在群界面里点击创建QQ群,并将进入该群的选项设置为必须经过审核才能成为群成员。建群完成之后,将群号码公布,通知学生加入该群,并要求学生将自己的群名片以“班级+学号+姓名”清楚标识,以便开展交流讨论。而且便于在学生申请加入时,群管理员进行资格审查。
2.2学习主题
作为学生讨论的内容,学习主题不宜过大、过多,应集中于某一专题。如《公司战略与风险管理》课程主要包括三块内容:公司战略管理、风险管理和内部控制,那么相应地可以三个学习主题,分别对应三部分内容,每次只讨论一个主题。学习主题应清楚地阐述该部分的教学目标、教学内容和教学方法,如公司战略管理,教学目标定位于培养学生对于公司发展的战略把握能力;教学内容包括:战略分析、战略选择、战略实施和控制;教学方法以案例教学为主,并且对公司战略管理的目标、内容和方法详细阐述。学生依据学习主题,再通过自己阅读教材,思考通过学习本门课程获得什么,应学习什么内容,采取何种教学方式是最容易接受的,从而为开展讨论分析奠定基础。学习主题可以由教师上传到群共享中,同时上传相应的辅助材料,如教程各章节的教学目标、内容和教授方法,案例教学、模拟演练、小组讨论、角色扮演等教学方法的适用范围及注意事项等,以便于学生在思考教学设计中能及时获取相关的辅助资源,帮助其作出合理的设计规划。
2.3学生分组
一般按6~8人一组,分组的标准不固定,可以按学号、座位、寝室等方式分组,也可以学生自由组合,但是每次小组讨论应该采用不同的分组方式,便于让学生有机会和不同的人合作,利于培养其沟通、协助能力。
2.4小组讨论
在分组完成之后,学生即可开展小组讨论,这种讨论可以利用课堂时间进行,但更广泛深入地探讨需要学生课后通过QQ群的讨论组功能展开。因为分组之后,可能组员分布比较分散,难以集中,此时,由一名组员发起邀请,让其他组员参与到新设立的讨论组中,就该学习主题发表意见看法,及时补充完善,即使无法同时在线交流也无影响,因为有留言记录,组员可以通过留言记录了解讨论进入到何种程度,进而发表自己对此的观点看法,而且讨论记录便于讨论结束后,由选出的总结人整理提炼,形成最终意见,上传提交。小组合作学习具有如下优势:使学习者产生更多和更高水平的洞察力、认知能力、道德推理能力、更深入的理解力、更敏锐的批判性思维和更深的记忆[3]。学生通过小组合作学习,能比独自学习获得更深刻的认识和更广泛的能力锻炼。
2.5上传小组意见
事先规定讨论意见上传的时间期限,一般1~2周。以文件共享的形式收集各小组意见,先在群共享中上传一个空白的意见记录表格文档,然后各个小组均可以下载该文档,将本小组对教学目标、教学内容和教学方法的意见录入对应的记录中,保存之后再上传,这样不断地把各小组的意见汇集到该文档之中,实现意见的即时收集。
2.6教师评价、分析和实施优化方案
教师根据收集的意见文档,分析学生对于学习《公司战略与风险管理》课程的期望目标,了解他们希望在能力、知识上获得何种程度的提升,掌握何种教学方式是最受学生欢迎和接受的,进而采取合理的教学设计方案。在实施教学方案之后,学生与教师进行互动交流,不断调整教学方案、优化设计,使其能切实满足学生的需要,具体的实施过程如图2所示。根据交流反馈的信息,在教学重点处组织课堂讨论,以加深学习质量;在教学难点处组织讨论,以启发性问题帮助学生解决疑难,提高效率;在教学生长点组织讨论,拓展优化学生的思维空间,帮助学困生加深对知识的理解。
3推行参与式教学设计的问题分析及解决措施
作为一种新兴的教学模式,参与式教学设计在具体的推行过程中存在诸多困惑和问题,如学生积极性不高,参与度较低或者因增加学生、教师工作负担,致使参与者消极应付甚至抵制等不利局面,对于这些问题,如果没有切实有效的应对措施,必然会使参与式教学设计无法达到预期效果,甚至失败。因此,需要针对不同的问题,给出相应的解决对策,下面予以逐一阐述。
3.1学生参与积极性不高
针对此类情况,需区别对待。班上的学生必然会出现分化,有积极性高的,也有积极性不高的,这取决于个体差异和环境影响,也有可能是对参与式教学设计不了解所导致的。此时,需要耐心讲道理、做解释,鼓励学生参与讨论、发表意见。并对参与式教学设计的理念,具体流程,各种教学方法的优缺点等进行详尽的阐述,以便学生了解、掌握参与式教学设计,并能积极地参与到其中。在学生的考核评价中,也可将学生是否积极参与教学设计作为其平时成绩的评定依据,以提高学生参与的积极性。
3.2学生缺乏教学设计的相关知识,难以做出合理的规划设计
由于学生未参与过教学,对教学设计不了解,且对所需设计的课程内容未投入足够的时间、精力预先学习准备,学生对所要设计的课程内容并不了解,要想学生对教学设计提出合理化建议存在困难。因此,需要事先为学生提供一个基本的教学方案,包括教学目标、教学内容和教学方法,如《公司战略与风险管理》中的公司战略模块,其教学目标是培养学生对公司战略的分析、设计、执行、控制的方法,能完成完整的公司战略制定流程;教学内容包括战略分析、战略选择、战略实施与战略控制的理论与方法;教学方法采取课堂讲授和案例分析相结合的形式。首先给出初始的教学模式,然后鼓励学生自己学习了解课程内容,教学设计的相关知识,进而鼓励其运用所学知识提出有效的建议,对原教学模式进行优化改进。
3.3参与式教学设计加重了教师与学生的工作量,致使其形成抵触心理
由于参与式教学设计需要师生间大量的沟通、协作,而且方案需经过多轮反复修改、完善,教师和学生已习惯于课堂授课、听讲的教学模式,下课后要各自忙于自己的工作、学习,投入大量时间、精力到这种尝试探索,无法预知最终效果的实验性教学设计之中,难免会产生厌烦心理,不愿参与配合,最终导致活动失败。因此,在进行参与式教学设计时,一定要事先规划实施步骤、流程,预先考虑各种可能出现的不利因素,提前做好预防措施,并且重视宣传教育工作,让教师和学生明白,进行参与式教学设计,表面上多花了时间和精力,但可以让学生更好地了解自己要学的课程,知晓通过学习该课程将掌握何种知识,该门课程能提升哪种能力,从而放弃抵触,转而积极接受。并且,由于学生自己亲自参与到教学模式的设计之中,对该教学模式不再抵触,能采取一种接受、合作的态度,有利于提升教学效果。为降低参与式教学设计中师生的工作量,可以考虑设计能高效利用QQ群,学习主题、开展小组讨论、实现资源共享、收集反馈信息的科学方法,以降低工作量,提高学习效率。
3.4缺乏合理的准备组织,难以开展有效的课堂讨论
课堂讨论是指以加深学生对所学内容的认识,明辨是非或获得新的结论为目的,组织学生各抒己见以取得共识的教学方法。如果未能掌握讨论活动组织技巧,仅仅是将学生分组,要求其开展讨论,学生会感到茫然,以应付的态度参与讨论,或者投入大量时间、精力参与,却未能对主要的知识点进行深入探讨,浮于表面。为提高课堂讨论效果,需要从以下方面做好组织:第一,明确讨论的目的;第二,提出有价值的问题;第三,捕捉讨论的时机。教师应在学生认识普遍出现偏差时组织讨论,及时纠正学生的错误;在教师提问出现“卡壳”时组织讨论,让学生茅塞顿开;在学生思维出现“低谷”时及时组织讨论,将学生的思维再次推向“”,形成高低起伏的教学节奏;第四,把握教学的张力、恰当引导。组织讨论时,教师要合理设置知识的难度,知识模块之间联系的跨度,问题的难易度和讨论的密度等。在讨论中,教师要引导学生打开思路,各抒己见;要巡视了解、引导,避免讨论偏离主题;要启发诱导,使讨论得到深化,使学生的思维得到升华;第五,延缓评价,总结提炼。
4结论
参与式教学设计的具体流程包括创建QQ群、学习主题、学生分组、小组讨论、上传讨论意见、评价分析、实施方案。整个流程是一个循环往复的过程,一个流程结束,总结经验、教训,开始一轮新的流程循环,周而复始。在整个师生参与教学设计的过程中,QQ群起到重要的交流媒介作用,作为现代社会重要的网络信息沟通工具,QQ群对于参与式教学设计的顺利开展至关重要。在这个活动之中,尤为重要的是事先预期可能发生的各种问题,并及时采取有效的解决措施。如针对学生不了解参与式教学设计的问题,可以由教师专门做解释、沟通,并在群共享里上传相应的说明资料,便于学生了解、掌握参与式教学设计的目的、流程和方法。
基于QQ群的参与式教学设计的价值体现在四个方面:其一为促进学生学习方面的价值,有助于提高学生的积极性和主动性,增强学生的学习责任感,发展其自主、终身学习能力;其二为改进教师教学方面的价值,让教师更准确的了解学生需求,提高教学效率和效果;其三为改善师生间交流与协作方面的价值,为师生间相互交流、相互理解搭建一个良好的平台,形成一种相互信任、相互尊重、民主协商的氛围;其四为依托即时通信软件开展参与式教学设计,探索具体的方法与技巧,建构合理的流程与规则,提供实践指引。可将其分别略称为学习价值、教学价值、交流价值和技术价值。
作者:刘锦芳 单位:湖南工业大学财经学院
参考文献:
[1]屈丹丹,孙宽宁.基于QQ群的大学生参与式教学设计研究[J].当代教育科学,2012(15):14-16.
关键词:岩石力学参数统计分析Matlab正态分布
隧道支护设计所依附的数据具有变异性和不确定性,为了确保支护设计的安全性,应加强对测得数据的处理,以便为设计提供可靠的依据。本文以岩石力学参数为例介绍信息处理的方法。
1.岩石力学参数的预处理
隧道工程的勘察、设计、施工过程常常是在不确定性条件下进行的,由此造成了不少工程事故,一直是个影响工程安全但急需解决的工程难点。不确定性的客观原因主要在于岩石性质及其工程性状具有较大的变异性,同时也由于工程师们难以对岩石的特征了解得很多、很全面。在这种条件下进行决策,就要对试验观测到的数据进行尽可能详尽的统计分析,便于对岩石力学参数进行可靠的估计,从而为支护设计提供可靠的依据。这种估计建立在概率理论的基础上,基于Matlab软件所得的结果是岩石力学工程可靠性设计的基础。
为了预估岩石力学参数,需要进行各种试验和观测,收集大量的数据。在取得这些数据之后,还必须经过处理才能显示出它的规律性,从而得到有代表性的特征值,供设计、分析、施工之用。特别在评价岩石力学工程的可靠性、估计失效概率时,更需要进一步了解岩石力学参数的概率分布特征。通常的方法是剔除粗差并根据收集到的数据拟合成某一概率模型,然后进行各种概率分析。
剔除粗差的常用统计判别法有三倍标准差判别法(Pauta准则)、小概率事件判别法、端值判别法、t检验准则剔除异常数据法、狄克逊(Dixon)方法等。本文采用端值判别法。
端值判别法又称格拉布斯(Grubbs)方法。设实验所测定值是正态分布X=N(μ,a)。X的随机子样为x1,x2,……,xn。现按子样的测试数据由小到大排列如下:
x(1),x(2)……x(n)
设x(1),x(n)为过小、过大值,即可怀疑的异常数据,则可按Grubb s方法判定异常数据。
1.1计算舍弃值的临界值T
设x(1)是怀疑的,令
(1-1)
设x(n)是怀疑的,令
(1-2)
上式: 为平均值:
(1-3)
s为标准差:
(1-4)
1.2选定危机率a
按Grubbs方法造成错判时,其错判的危机率为a。一般常用的a为5%或1%。其概率意义是,当测试数据在服从正态分布的条件下,
1.3异常数据判定
当T(i)≥T(n,a),则其相应的X(i)是可怀疑的异常数据,应从子样数据中剔除;反之,当T(i)<T(n,a),则不能判定X(i)是异常数据。
在一个子样(一组数据)中存在多于一个的异常数据时,应依测定值与平均值的差值,按大小顺序逐个判定。
运用Grubbs方法按上述步骤对子样中单个异常数据进行判定,方法是简便的。如果通过公式的移项与简化,以上下限控制来确定测试数据的正常值展布范围,有利于了解异常数据的空间分布。
利用测试数据这些统计量,做出在某一概率下的、某个范围内的随机变量x的期望(即平均值 ),按Grubbs方法:
(1-5)
令(1-6)
则按子样容量n和某一概率下的临界值T(n,a)可得:
(1-7)
因而 则测试数据的正常值上下限应满足:
(1-8)
当被检验的子样数据在(1-8)式范围内时,可认定这些测试数据是正常数据;反之,某些数据超出这个正常范围时,可判定为异常数据。由式(1-4),(1-5)知,随机子样容量的变化直接影响到测试数据展布的上下限和检验尺度的确定,因此,根据Grubbs方法逐个判定的原则,应在判定出异常数据后再重新计算 ,重新确定控制范围,直到再无异常数据存在时为止。
岩石的物理力学性质各项测试数据的概率分布曲线,大多数符合正态分布,岩石指标一般根据子样容量取其数学平均值。由于子样的标准差s是反映与平均值的离散程度,因此,运用标准差s根据Grubbs给出的临界值T(n,a),作为判定子样中的异常数据,是有实际意义的。只有当被检测的数据符合正态分布,才能用来作为支护等设计的数据依据,否则说明取样不合理,要重新取样。
2.岩石力学参数的统计分析
2.1参数概率模型的选择
在岩石力学参数的可靠性分析中,是以一定的概率模型来描述状态变量所具有的不确定性。在实际处理时,就要在充分认识随机变量物理性的本征的基础上,寻求随机变量的统计规律性,求统计参数的数值,建立适宜的概率模型。
建立适宜的概率模型,首先就要选择参数的分布类型。在岩石力学参数可靠性分析中,随机模拟方法是由指定的输入变量,概率分布产生模拟的随机变量,可靠指标法是基于正态变量或非正态变量经当量正态化进行计算的,因此,根据给定数据选择和建立系统输入随机变量的概率分布,直接关系到分析结果的准确性和精确性,或者说,关系到可靠性分析的可靠性,因为,任何输入概率模型的误差远不能由计算方法的精度得以补偿。自然,正确地选择和建立输入概率模型是至关重要的。
选择概率分布的主要依据是有关该随机变量的物理知识和占有的数据。在某些情况下,不考虑特定分布的参数值,可以利用所分析系统中某一随机变量的先验知识,根据对该随机变量产生过程的认识,选择总体上似乎比较适宜的概率分布,或者至少可以排除某些分布。即使根据已有的知识尚不能决定应用哪种分布,起码可以决定一些定性资料,这对选择概率分布也是很有用的。
随机变量及其统计规律性,是通过随机变量的分布和分布参数来描述的,只有己知分布参数值,随机变量X的分布函数才能完全确定。在岩石力学工程领域中,总体的分布参数精确值一般是未知的,均需通过参数估计来获得估计值。
2.2随机变量分布的检验
对于比较重要的隧道工程,分布假定之后,还需采用数值的统计假设检验方法,对假设分布进行有效性检验。检验的步骤如下:
(1)建立假设,根据经验分布图形或频率直方图的形状,对总体作出某一理论分布的假设。
(2)给出统计量,选择某种适当的函数,作出检验标准即给出统计量。
(3)按观测数据进行统计量的计算。
(4)根据实际问题的要求,取显著性水平α。
(5)作出判断确定统计量的临界值,依此作出拒绝或不拒绝假设的判断。假设检验的方法有多种,采用W检验法。
2.3 W检验法
W检验法具有灵敏度高、计算简单、需要样本容量较小的优点。W检验法是由样本X1,X2,…Xn的顺序统计量X(1), X(1),… X(n)构成检验统计量:
(2-1)
其中
这里
对任何分布的样本值(x1, x2,… xn),W的观测值(仍用W表示)都满足 ,而且分布越接近正态分布,W的值越接近1。
W检验法的检验法则为:
若 ,则拒绝正态性假设,即认为总体不服从正态分布;
若 ,则接受正态性假设,即认为总体服从正态分布。
3.结论与展望
隧道工程一直是岩土工程中的一个研究热点,但由于岩石的物理力学性质的不确定性,在实际应用中经常发生事故,给公司和人民带来了极大的损失。结合工程地质数据,本文以概率统计为基础,基于Matlab数据矩阵软件,研究了岩石力学参数的分布状态,为工程数据的可靠信研究提供了新的统计方式。
关键词:交通工程 教学改革 四位一体 三参数
中图分类号:G642 文献标识码:A DOI:10.3969/j.issn.1672-8181.2013.21.002
交通流三参数即流量、速度与密度,是开展交通流特性研究的重要参数,在学习的过程中不仅要了解基本概念,还要知道各种测量方法、分布特性及相互之间的关系。作者在教学过程中感觉到,对于初学交通工程专业的学生而言,会感到既陌生又熟悉。熟悉是因为基本概念都不是很难理解,陌生是因为当真正应用时又不知道该如何入手,例如怎么设计调查方案,如何进行科学的分析等。因此,在具体的教学过程中,如何针对交通流三参数的特点,科学地总结教学模式并开展一定的探索与改革,使学生从被动的教导变成积极主动的学习,对提高教学质量加深学生对专业知识的理解,具有重要的现实意义。
1 “四位一体”教学模式的基本概念
“四位一体”教学就是把教学理念、课程内容体系、教学方法和教学手段融合在一起的教学方法。即以课堂理论教学分析为基础,应用多媒体教学,利用实物进行实践教学,利用专业教学实践网站把上述几种方式有机结合在一起的新的教学模式。该教学模式统筹兼顾了教学目标、资源、平台、运行等各种影响并遵循教学管理的内在规律,在教学过程中,将课堂教学、学习、实践及科研环节融为一体,并对每个环节进行相应的教学改革,达到相互融合。“四位一体”的教学模式改变了传统的单一模式,将学与研有机结合起来,更易被学生接受,教学效果更好。目前,国内许多知名高校都进行了“四位一体”的教学模式的探索,如东南大学就将传统的知识传授型向研究型转变,建构了以学生为中心、以教师为主导的理论教学、实践教学、自主研学、网络助学的模式。
2 交通流三参数的基本特性
交通流三参数有:交通流量、速度和密集度,如何科学分析它们的特性及其相互关系,是建立科学的交通系统的规划设计、管理和控制的基础。交通流量是单位时间内通过道路某一地点或某一断面的实际交通参与者的数量,它是一个随时间变化的量值,根据研究的需要又分为年平均日交通量、月平均日交通量、周平均日交通量、高峰小时交通量等,同时交通量在空间与时间分布上具有不同的特性,在学习的过程中需要准确的理解。交通量的调查方法有许多种,总体上分为人工调查与仪器设备调查方法,但无论是哪种方法都必须深刻理解所调查对象的研究目的,从而合理的设计调查方案。
速度可以简单的理解为距离除以行驶时间的商,但在交通工程学中又分为地点速度、时间平均速度、区间平均速度等。地点速度也称为瞬时速度,是车辆通过道路某一点时的速度,时间平均速度是观测时间内通过道路某断面所有车辆地点车速的算术平均值,而区间平均车速的则有两种理解,一是车辆行驶距离与对应的平均行驶时间的商,二是某一时刻路段上所有车辆地点速度的平均值,二者虽然表面理解不同,但实质上是相同的。速度的调查方法也有多种,总体上也可以分为人工现场调查与采用一定的仪器采集数据后进行分析。
密集度的理解有两种,一是占用率,二是密度。其中占用率又包括了空间占用率与时间占用率,同时密度又与车头间距之间存在一定的关系,即要充分理解交通三参数的基本概念不仅要从简单定义上去体会,而且还需要更多的从实际的工程案例中去寻找相关的规律。
3 “四位一体”的教学模式在“交通流三参数”中的应用
笔者在“交通工程学”的教学过程中,尝试开展了“启发、体验、质疑、提高”四位一体的培养模式,对提高学生学习兴趣、掌握工程实践方法、学会分析解决现实问题,提升科研实践能力有着重要效果。
3.1 启发
在教学过程中,改变传统的讲授模式,将单一的老师讲解为主转换为老师讲解与提问相结合,根据课程内容设置不同的小问题,让学生带着问题去思考,从而激发学习的兴趣。如交通量的表达方式里面有很多种类型,讲解时首先介绍平均日交通量与年平均日交通量的表达方式与变化特征,然后提出如果以此类推,还可以哪些?在此基础上进一步提出交通量调查的目的可能是什么,调查数据可以有那些作用,反映什么问题?掌握地点车速的测量方法对于交通工程专业的学生来说很重要,而人工结合相关仪器进行测量是最基本也是最常见的方法之一。在测量过程中如何便于数据整理,减小测量误差很重要,因此在教学过程中首先讲解速度的不同单位的表达形式,让学生分析二者的关系,在得出后在此基础上进一步提出,在实际调查过程中,又可以如何利用这个关系?统计交通量与速度时都有流动车法,在讲解交通量与车速调查方法时,提出在一次调查过程中如何将两者结合起来。
3.2 体验
交通流三参数的实践性很强,不仅要掌握基本概念,还要学会实地交通调查分析。主要从两个方面开展教学:一是亲身体验数据的观测过程,在教学过程中,专门安排一周的时间让学生自己去实际测量开展调查。主要内容有:路段机动车和非机动车交通量调查;交叉口机动车、非机动车和行人交通量调查;路段的地点车速与区间车速调查等。如在交叉口流量调查过程中,每个方向至少需要两人,记录机动车、非机动车、行人的分类、流量、流向,在流量调查基础上,绘制交叉口流量图。二是对具体的工程案例进行数据分析。如给出某城市中心区的道路采用摄像法获取的视频后,首先介绍数据读取方法,利用Kmplayer软件读取数据。打开界面,右击鼠标播放跳转到转到时间/帧,鼠标点击画面,开始播放视频,按空格键暂停,再按恢复播放。然后讲解数据统计方法,选择道路的一个断面,统计视频中通过该断面每一辆的速度和到达时刻,然后通过简单运算和合并即可得到所需数据。在讲解基本分析方法后,让学生分组去进行成果整理。上述内容若在课堂上讲授,学生会感到索然无味,无法将知识点与具体问题联系到一起。但如果采取将课堂内容与具体实践结合起来,通过设计调查方案、开展数据处理与分析等,学生不仅易于理解,也不会出现死记硬背现象,实践技能得到极大提升。
3.3 质疑
主要是对学生具体的工程案例调查与数据分析过程中出现的问题进行指导。专门安排2节课的时间,要求各组将整理的成果用PPT汇报,主要内容包括各小组的调查与分析内容、内部分工及相关软件学习与运用情况,调查数据成果展示,心得及感想等。对学生的汇报成果进行一一点评,同时对调查过程中出现的问题进行讲解,如调查地点的选择是否合理,调查方案设计是否科学,数据分析是否有问题,如何科学的使用仪器设备,如何形成研究报告,如何展示研究成果等。通过全方位体验,使学生从实践过程中加深了对专业知识的理解,巩固了学习的成果。
3.4 提高
通过校企联合,鼓励学生参与各级各类科研项目的实践活动。目前扬州大学建筑科学与工程学院在教学实践过程中,多次组织学生参与了江苏省交通科学研究院、南京市交通规划设计研究院等单位组织的交通规划调查课题,并取得了一致好评。鼓励学生积极申报学院、学校的大学生科技竞赛项目,并积极参加全国交通科技大赛,其中有一个参赛作品获三等奖。
4 结论
经过一定的教学实践,在交通工程学课程中“交通流三参数”的教学中采用“启发、体验、质疑、提高”四位一体的教学培养模式,取得了较好的教学效果,对学生提升专业学习兴趣,培养分析解决问题的能力,积极参与科学研究发挥了重要作用。
参考文献:
[1]郑家茂,潘晓卉.理论教学、实践教学、自主研学、网络助学“四位一体”教学模式的构建[J].中国大学教学,2008,(12):4-7.
[2]周林,陈雨海.构建“四位一体”教学管理新模式[J].中国高等教育,2009,(11):46-48.
[3]李红英.“四位一体”综合教学模式在建筑材料课程中的运用[J].高等建筑教育,2007,(2):85-87.
[4]中国公路学会《交通工程手册》编委会.交通工程手册[M].人民交通出版社,1998.
关键词:“快餐式”信息技术;传统计算机教学;情境化;任务驱动
据中国信息产业部统计,截至2013年底,全国拥有智能无线终端系统的人数已突破4亿。随着这些通讯工具的不断普及,特别是便携式、智能化程度极高的信息工具的广泛使用,使得“快餐式”信息技术成为了人们日常生活中密不可分的一种技术行为。
什么是“快餐式”信息技术?其显著特点是植根在便携式智能系统与工具基础上,如系统为IOS系统、安卓系统、Windows Mobile系统、塞班系统等,以及承载这些系统的终端产品,如苹果、三星、黑莓、华为手机及平板电脑等,它们传递的信息快速,查询便捷,特别是信息容量巨大。但是真正容纳在海量信息中的有用部分又不是特别多,它就像我们平时所吃的快餐一样,虽能吃饱,但是营养价值却不高,也就是量大质低。
“快餐式”信息技术与传统信息技术的对比
随着工业全球化、科研技术的不断加速,“快餐式”信息技术存在的土壤越来越肥沃。廉价、便携的无线终端设备与信息资讯的海量快捷,使之逐渐替代传统PC成为现代人获取信息的首选。作为植根在基础教育的信息技术教师,深刻地感受到“快餐式”信息技术对传统信息技术教学的冲击与影响。例如,通过笔者的调查与统计,执教的沿海地区初级中学校园里,一个建制约50人的班级中,拥有智能手机或平板电脑的学生人数几乎是100%,同时能熟练操作工具(这里熟练操作指能为智能工具预装系统、应用软件,能运用相应软件进行信息通讯与处理等)的学生人数则为总人数的30%~40%。由此可见,在没有通过传统校本教育的情况下,因为“快餐式”信息技术的智能化、简单化,使得学生能通过自我学习,达到一个普及的状态。那么在这样的一个快餐文化充斥的社会中,作为传统信息技术教育如何坚守好自己的一方净土,将传统信息技术教学与这种快餐文化相结合,走出一条符合社会潮流的当代信息技术教育新途径,就非常值得信息技术教师思考与研究。为此,信息技术教师首先要明确传统信息技术与“快餐式”信息技术间各自的优缺点(如下表),并尝试能否取长补短。
针对传统信息技术与“快餐式”信息技术的优缺点,我们可以通过日常生活中的一个事例来简单说明。例如,班级搞一个团队活动,需要有信息查询、文稿撰写、同学间的相互交流与讨论、幻灯片的制作、数据表格的处理以及最终作品的投送与。那“快餐式”信息技术能否包办一切呢?分割来看,信息的查询、讨论与总结、结果的投送与、智能化终端设备完全可以,但是在文档的处理、幻灯片的制作、数据表格的处理,甚至可能一些视频、音频的后期处理上,PC的操作优势就显露无疑。智能终端的输入不方便,文档处理的不专业,数据表格统计的高专业性要求,都限制了便携智能终端的性能,也决定了其不可能在短时间内取代传统信息技术。因此在这样一种“快餐式”信息横扫社会的大趋势下,作为基础信息技术教育工作者,更应该坚持传统信息技术教育不动摇、不放松的思想。
如何做好两者的融合
如何做好对传统信息技术的技术传承,不让学生一到计算机房就上网聊天,打网络游戏。关键还是要找准学生的兴趣点,变枯燥的教学为兴趣支撑下的模拟化、任务式的教学。现在信息技术课本的编写还是以模块化、章节化的形式呈现,一个软件一个软件的介绍,学生在学习中都是孤立的。但实际上传统信息技术教学的优点就在于多任务、多窗口协同工作上见长。如果我们不把这种优势放大,那自然不可能吸引学生的学习注意力,更谈不上对信息技术的传授。因此我们可以尝试打破书本章节限制,将章节的知识点进行重新组合,以某种情境任务展现给学生,让学生在教师所创设的情境中体会任务要求,并通过任务驱动引导其学习目标与研究方式进行转变。将传统信息技术与“快餐式”信息技术相融合。我们还可以把制作班级小报作为半学期的学习任务,进行情境创设,在信息资料的准备上讲述互联网技术;在文字编排上讲Word软件;在数据处理上讲Excel软件;在图片处理上讲Photoshop,等等。这里要强调的是针对不同年级的学生的信息技术能力,一定要将知识点的难易程度进行合理分割与控制。在初一上学期,我们可以只要求学生会上网查找资料,并能将资料内容复制粘贴到字处理软件中,简单排版即可,而关于网络的设置、文字的深度美化则不需要深入讲解。但是到了初一下学期或更高年级,则可以将任务环境设置得更复杂些,使学习呈现梯度性。在这个过程中教师也要转变职业特质,变讲授型教育为指导型帮助。由于是情境模拟、任务驱动,因此对学生不可能做一刀切的要求,在任务布置以后,可以让学生通过多种方式与途径去完成,教师及时跟进。这种跟进,教师可以用智能通讯终端打破课堂限制,指导在平时,总结与拔高在课堂,从而借助当前智能终端的普及,把有形的信息技术课变成无形的社会化课堂,最终调动学生学习的自主性、积极性。
关键词:图像处理;学生体质参数;测量系统;自动化
中图分类号:TP393 文献标志码:B 文章编号:1673-8454(2015)12-0084-04
一、引言
学生时期是身体发育的高峰期,也是体质强壮的关键时期。随着经济的发展,人们的物质文化生活逐步提升,各年龄段学生的身体素质却呈现逐年下降的趋势,此问题引起了社会的广泛关注。因此,掌握学生的生长发育规律,并快速、简洁、准确的测量学生的体质参数具有现实意义。常用的传统接触式体质参数测量方式费时费力,并且由于人为原因容易造成误差,而数字图像处理技术具有测量简单、准确、自动化程度高等特点,因此,基于图像处理技术设计一套高效、便捷、自动化的学生体质参数测量系统,利用信息化手段准确获取学生体质参数,为相关教育部门提供可靠数据支撑,有助于促进学生的全面发展。
二、体质参数测量方法及必要性分析
1.测量的概念及分类
人体测量学是一门用测量的方法研究人体体格特征的科学,是指通过测量人体各部分的尺寸来确定个体和群体之间的差别,从而为各种工业设计和工程设计提供人体测量数据。人体测量技术自上世纪70年代中期逐渐成为服装数字化技术的重要研究课题,在30多年的发展中,大致经历了由手工测量向计算机辅助测量、由接触式测量向非接触式测量、由二维测量向三维测量的方式转变,并向自动测量以及利用计算机执行测量、处理和分析操作的方向发展[1]。人体测量方法根据测量工具是否与人体接触可以分为接触式测量和非接触式测量[2]。
(1)接触式测量
接触式测量即传统的测量方法,也称手工测量,主要测量工具有软尺、测高计、测距计、角度计等。该方法优点是简单、直观,可以直接获取到精确有效的人体参数,目前仍在一定范围内使用。其不足主要体现在以下两方面:一是由于测试者的经验不同,被测数据会产生一定程度的差异;二是当测量范围较大或样本容量较大时,会出现测量效率低、耗时长等问题。
(2)非接触式人体测量
非接触式人体测量是现代化人体测量技术的主要特征。它弥补了传统接触式人体测量方法的不足,使测量更加方便、快捷。三维人体自动测量是非接触式人体测量的一个重要分支和方向。三维人体自动测量作为现代图像测量技术的一个分支,以现代光学为基础,融合光电子学、计算机图像学、信息处理、计算机视觉等科学技术为一体[3]。
非接触式测量分为主动式和被动式非接触测量。主动式非接触测量方法主要是通过发射光线、接受反射光成像的方式来进行测量。测量的数据信息完整、精确,但该类方法对设备的要求比较严格,且成本相对较高,对测量人员也有专业的要求,并且向被测者发射光线,极可能引起被测者的心理反感,影响测量结果。而被动式非接触测量对设备以及测量人员的要求都相对偏低,也不会引起被测者的心理反感。非接触式人体测量又包括很多方法,如表1所示。
2.学生体质参数测量必要性和可行性分析
一是当代学生体质出现一系列问题,通过测量有助于避免这些问题,为教育部门提供数据支撑和决策支持,促进学生全面发展。
二是基于图像处理的技术已经相当成熟,且相对于其它测量方法,有以下优点:①开发成本比较低,对设备的要求低,不需要专门的专业设备。②操作简单、方便,对测量人员的素质要求不高。③可以实现离线化、自动化处理,处理效率高。
三、系统设计
1.测量指标的选取
身体形态是人体生命活动的物质基础,能够反映一定的身体机能。由于当今校园里学生群体普遍存在坐姿不正以及长期保持坐立等引起的背部发生畸变的问题,因此,根据学生青春期发育特点,选取身高、臂展、头围、坐高等指标作为测量指标。
2.测量的原理
本研究是基于图像处理的技术实现人体测量,实现原理基于被动式双目视觉原理。所需设备主要有两个数码相机和一个标定尺,两个数码相机用以获取被测者的正面图像和侧面图像,标定尺用以标定单位距离在图像中的映射长度,为还原真实长度提供参考依据。所得图像按照图像预处理(灰度处理、二值化处理)、图像轮廓提取、特征点识别和标定等步骤进行处理,最后根据标定的比例关系还原真实长度,实现人体参数的自动化获取。
3.系统的数据流程
系统的数据流程图如图1所示,首先通过两个已经定标好的数码相机同时对被测者进行图像采集,得到被测者的正面和侧面图像;然后分别对图像进行预处理,包括图像灰度化、图像二值化、图像边缘检测及轮廓提取,根据预处理图像结合人体形态特征进行人体特征点的标定,最后根据双目视觉原理,将图像中的坐标点转化为实际人体物理坐标,最后根据物理坐标计算人体各项测量指标的真实数据。
4.相关技术
(1)图像灰度化
图像灰度化即彩色图像转化为灰度图的过程。彩色图像中每个像素的颜色由R、G、B三个分量决定,而每个分量有255个值,则每个像素点的取值为0~255*255*255。而灰度图像是R、G、B三个分量相同的一种特殊彩色图像,每个像素点的值为0~255。由于尺寸的提取与照片的色彩没有关系,为了提高处理的速度和效率,可以将彩色图像经过灰度处理转化为灰度图像,灰度转换的方法有以下几种:
浮点算法:Gray=R*0.3+G*0.59+B*0.11
整数方法:Gray=(R*30+G*0.59+B*11)/100
移位方法:Gray=(R*76+G*151+B*28)>>8
平均值法:Gray=(R+G+B)/3
仅取绿色:Gray=G
通过上述任一方法得到Gray后,将原来RGB(R,G,B)中的R,G,B统一用Gray替换,形成新的RGB(Gray,Gray,Gray),即完成了图像的灰度变换。对比分析表明,第5种方法可以将人体与背景有效的分离,有利于后期操作,故采用仅取绿色的方法进行灰度处理。
(2)图像二值化
二值化是图像处理的基本操作,任何图像处理基本离不开二值化。为了使整个图像呈现出明显的黑白视觉效果,将图像像素点的灰度值设置为0或255,常用的方法是设定一个阈值T,用T将图像的数据分成两部分:
g(x,y)=0 (灰度值小于阈值(T))
255(灰度值大于阈值(T))
经过大量的实验测试,本研究选取阈值为100可以得到最佳的处理效果。
(3)图像边缘检测及轮廓提取
边缘存在于目标与背景、目标与目标、区域与区域之间,图像的边缘是局部特征不连续出现的部分,也就是图像局部亮度变化最显著的部分,是图像最基本的特征之一。大部分信息都蕴含于图像边缘处,是图像分割、图像分类、图像配准和模式识别所依赖的重要特征。图像边缘检测的基本步骤为滤波、增强、检测和定位。轮廓提取的基本方法就是边缘检测法,即借助于空域微分子进行,通过将模本与图像卷积完成。常用的边缘检测方法有梯度算子、Sobel算子、Roberts算子、Canny算子等。
(4)特征点的标定及提取
标定尺的标定作用是建立一个真实物理坐标和图像像素坐标的一一对应关系,本研究采用一种相对简单的二维平面标定方法,即标定尺选为一条长为100cm的尺子,根据其在图像中映射长度,计算真实距离与图像距离的比例关系,根据这个比例关系,可以还原人体各个指标参数的真实数据。
①身高的确定,主要包括头顶点和足底点的标定。从图像左上角即图像第一个像素点(0,0)处开始,从左向右自顶向下进行逐点扫描,当遇到第一个白点即像素值为255,停止扫描,并记录该点的坐标(x1,y1),那么y=y1这条线就是头顶线;利用同样的方法从图像的左下角从左向右从下向上逐点进行扫描,遇到第一个白点记录坐标(x2,y2),那么y=y2即为足底线。人体实际身高在图像上的映射长度为:y(身高)=y2-y1。
②坐高的确定方法同上。
③臂展的确定,主要包括臂展两端的标定。臂展左端点坐标点确定方法与身高确定方法类似,从图像左上角坐标(0,0)处开始,但扫描方向不同,先进行自上而下再从左向右进行逐点扫描,遇到第一个像素值为255的点停止扫描,记录坐标(x3,y3);右端点坐标采取同样的方法,从图像的右上方坐标(imag.width,0)自上而下,由右向左进行扫描,遇到第一个像素值为255的点停止并记录坐标(x4,y4),那么实际臂展在图像上的映射长度为y(臂展)=x4-x3。
④头围的测量。要进行头围的测量,必须对头围进行建模。本研究以椭圆模型对头围进行数学建模,将测量结果与真实数据进行比较分析,对两组数据进行函数拟合得到头围,把误差控制在合理的范围之内。首先根据椭圆公式:+=1(a>b>0)(2a为椭圆的长轴,2b为椭圆的短轴,焦点在x轴上),确定a和b的值,运用椭圆周长近似公式L=2πb+4(a-b)求出椭圆周长。从眉间点为起点,经枕后点再至眉间点的围长,两侧部位为两耳上方略高的位置,因此以两耳位置上方2个像素处为椭圆短轴的两个端点,进行头围测量。首先在头部区域上下扫描,找出两耳的高度,即脸部最宽的部分为两耳所在位置,从而找到头围所在的高度y5;然后在此高度位置,分别从左右两测进行扫描,遇到像素值为255的记录下来,得到两个坐标点(x左,y5)和(x右,y5),从而得到椭圆模型的短轴长度。同样的方法,在侧面图像的同一高度进行扫描,亦会得到椭圆模型的长轴长度。根据公式进行转换得到头围的长度。
5.单位转换
以上方法中得到的坐标或者长度均是采用像素为单位,要得到实际的人体参数,就必须将图像中的像素转化为实际的物理长度。在进行人体图像处理之前,须进行一个实际物理坐标在图像中的映射转化,即将一个单位长度(100cm)的标准尺寸的标尺放在拍摄地点即被测者的位置进行拍照,通过图像处理得到它在图像中的像素长度L(标尺),从而得出图像像素到物理坐标的映射长度,即L(实际)=L(像素)*(100/L(标尺))cm。
四、系统的实现
1.系统的编制
运用Labview2013进行语言编写,在Windows7操作系统环境下进行开发。Labview是一种图形化的编程语言,又称“G”语言。包含前面板和程序框图两个部分,具备可视化的编程环境。使用这种语言编程时,代码量相对较少,取而代之的是流程图,在进行程序调试的时候,能够清楚看到数据流的执行情况,使编程简单直观。
2.程序界面设计
将每个功能模块的处理情况直观的体现出来,可以清楚的看到每个功能模块的处理效果,方便发现问题并对程序进行调试和修改。界面有以下几部分组成:一是两个选择图像的对话框提供图像的输入功能,分别为正面图像和侧面图像;二是数据保存位置的选择框,用以选择人体参数的输出位置,本系统是将数据存储在excel表中;三是下侧两个按钮分别用以执行和终止,当点击“执行”按钮时,开始图像的处理,图像执行完毕后,按下“终止”按钮退出程序;四是右上方的数据显示区域,每处理完一组数据,会自动显示在显示区域。
3.测量结果分析
本研究选取济南市某小学二年级8岁左右的40名小学生为测量对象,通过传统接触式测量和使用基于图像处理的系统测量分别得出数据(见图3),进行对比分析。
分析发现,利用本系统提取的数据与传统接触式测量方式所得数据相比,精度更高,并且方便快捷,具有很好的泛用性,误差基本控制在0.5cm之内,能够符合人体尺寸信息提取的要求。该部分将再适当扩充。
五、结束语
(1)通过人体正面和侧面两张图像,并通过图像处理方法,实现对人体参数的测量,建立三维人体模型。
(2)通过图像处理的方法相对于传统手工测量方法易于操作、方便快捷、省时高效、具有离线化处理等优势。但也有不足之处,获取的信息仅仅来自两张图片,不能很好的进行三维的计算,信息量有限,对结果提取会产生一定的困难和误差。
(3)针对学生群体选取的指标相对较少,基于图像处理技术只能获取学生形态方面的指标,不能全面反映当前学生的体质出现的问题,且只能横向反映某个阶段学生群体出现的体质问题,没有定期跟踪对学生进行测量,不能正确反映学生体质长期纵向发展情况。
参考文献:
[1]李勇,付小莉,尚会超.三维人体测量方法的研究[J].纺织学报,2001(4):261-263.
[2]罗仕鉴,朱上上,孙守迁.人体测量技术的现状与发展趋势[J].人类工效学,2002,8(2):31-34.
[3]张颖,邹奉元.三维人体测量技术的原理及应用[J].浙江工程学院学报,2003,20(4):310-314.
[4]Meadows D.M..Generation of surface contour by moirc patterns[J].Applied Optics,1990,9(9):1467-1478.
[5]李勇,付小莉.基于红外的三维人体自动测量系统[J].纺织学报,2003,24(1):69-71.
[6]丛杉,张渭源.数字技术在服装定制中的应用[J].东华大学学报:自然科学版,2006,32(1):125-130.
[7]Roger Y,Tsai.Aversatile camera calibration technique for hign-accuracy 3D machine vision metrology using off-the-shelf TV cameras and lenses[J].IEEE Journal of Robotic and Automation,1987,3(4):323-342.
【摘要】目的:对机械通气治疗新生儿肺出血参数设置进行临床应用研究。方法:选择2009年6月-2010年6月在我院新生儿病房收治的肺出血新生儿中的50例。男27例,女23例, 足月儿31例,早产儿19例,体重》2500g 38例,〈2500g12例。随机分为两组,每组25例, 对照组给予常频机械通气治疗,治疗组予低机械通气参数治疗。结果:治疗组25例存活22例 (88%),死亡2例(8%),放弃治疗1例(4%);对照组25例存活16例(64%),死亡6例(24%),放弃治疗3例(12%)。两组患儿孕周、体重、原发病统计学无显著性差异。结论::初设PIP、PEEP均低于常规机械通气值,即使需调高PIP、PEEP也不超过常规机械通气参数,可应用于临床新生儿肺出血治疗。
【关键词】机械通气;新生儿;肺出血;临床应用
机械通气是利用呼吸机的机械装置产生气流和提供不等氧浓度,通过增加通气量、改善换气功能和减少呼吸的能量消耗,以达到改善或纠正乏氧和二氧化碳潴留及酸碱平衡失衡的治疗措施[1]。机械通气是治疗新生儿肺出血的特效疗法:肺出血时大量血性液体充盈在肺泡及细小支气管内,既影响了气体进入有效的交换区,又影响了气体的弥散过程,因而需要通过辅助通气来改善机体缺氧的状况,以防止低氧血症和酸中毒对肺组织的进一步损害[2]。
1对象与方法
1.1研究对象 :选择2009年6月-2010年6月在我院新生儿病房住院,符合新生儿肺出血诊断标准的新生儿肺出血患儿共50例。其中男27例,女23例,足月儿31例,早产儿19例,体重》2500g 38例,〈2500g12例。原发病:重度窒息26例,占52%,新生儿肺炎(包括吸入性和感染性)8例,占16%,肺透明膜病4例,占8%,硬肿症2例,占4%,低体重儿5例,占10%,败血症4例,占8%,先天性心脏病1例,占2%,随机分为两组,每组25例,两组患儿性别、胎龄、体重、原发病统计学检验差异均无统计学意义(P>0. 05),具有可比性。
1.2诊断标准:依据新生儿肺出血的诊断与治疗方案[3]中的临床诊断标准,50例患儿均诊断明确。
1.3方法:两组患儿均在保暖、纠酸、抗感染、改善微循环、维生素K1、立止血等药物综合治疗基础上,对照组给予常频机械通气治疗:初调呼吸机参数:PIP 25-30cmH20, PEEP 5-7cmH20,RR 35~45次/min,I:E 1∶1~1.5, Flow 8~12L/min,Ti 0.6s, FiO2 0.6-0.8;治疗组予低机械通气参数治疗:初调呼吸机参数: PIP 22-28cmH20, PEEP 4-6cmH20,RR 40~50次/min,I:E 1∶1~1.5, Flow 6~8L/min,Ti 0.5-0.6s, FiO2 0.6-0.8,初设PIP、PEEP均低于常规机械通气参数值,即使需调高PIP、PEEP也不超过常规机械通气参数。上机30min后测血气,若PaO2过低,缺氧症状不改善,则逐渐调整PIP或PEEP、FiO2,但调整范围不超过上述参数高限[4]。
1.3 统计学分析:应用SPSS统计软件处理,计量资料以均数士标准差表示,同期组间比较采用t检验,P
2结果
(1)治疗组25例存活22例 (88%),死亡2例(8%),放弃治疗1例(4%);对照组25例存活16例(64%),死亡6例(24%),放弃治疗3例(12%)。两组患儿孕周、体重、原发病统计学无显著性差异。两组存活率比较:Χ2=8.0559,统计学显著性差异(P
(2)两组机械通气参数设置比较:PIP统计学显著性差异(P 0.05)。该研究降低了高PIP引起的危害,但抢救成功率反而上升,达到了机械通气的目的。
3讨论
(1)新生儿肺出血是新生儿的主要死亡原因之一,是由多种疾病引起的临床危重征象。早期诊断非常困难[5],一旦口鼻涌出血性泡沫液体已属晚期,病死率极高。生后1周内起病约占95%,其中生后12小时内发病约占半数;超过1周者为数极少。原发病有多种,如早产、低体重出生儿、感染性肺炎、重度窒息、先天性心脏病、硬肿症、颅内出血、羊水吸入性肺炎、多脏器出血、败血症等,都可能引起新生儿肺出血。主要表现有拒哺,不吸吮或吸吮无力;气急,呼吸快速而不规则,半数有呼吸暂停,可见鼻翼扇动;青紫,多见于鼻唇沟发青;,患儿不能安睡、痛苦表情、哭闹,但声音微弱似抽泣哀伤;低体温,可在35℃以下,四肢发凉;出血,开始为血性泡沫痰液,重时可口鼻出血、窒息。家长应在出血之前带孩子就诊,医生可根据肺部听诊体征和胸部拍片,及早做出诊断[6]。
(2)治疗应采取综合治疗,如保暖、保持呼吸道通畅、吸氧、治疗原发病、纠正酸中毒及出凝血障碍、补充血容量等,呼吸机的应用大大提高了治愈率。发生肺出血时,病情已相当危重,往往出现呼吸不规则或频发性呼吸暂停。肺出血时大量血性液体充盈在肺泡及细小支气管内,既影响了气体进入有效的交换区,又影响了气体的弥散过程,使PaO2降低、PaCO2升高,因而需要通过辅助通气来改善机体缺氧的状况,以防止低氧血症和酸中毒对肺组织的进一步损害,机械通气是治疗新生儿肺出血的重要手段,同时也能达到“压迫性”止血的目的[7],目前最常用的通气模式为IPPV+PEEP。对肺出血高危儿只要有低氧血症,尤其合并低体温或酸中毒者,应行气管插管,以便能起到早期治疗或预防肺出血的作用,适当的机械通气可扩张肺泡,改善两肺的通气和换气功能,提高PaO2和降低PaCO2,有压迫性止血的作用。机械通气早期,应30 min检测血气1次,依据血气调整呼吸机参数。在治疗期间,如PIP<20 cmH2O,平均气道压(MAP)<7 cmH2O,仍能维持正常血气,表示肺顺应性趋于正常,肺出血基本停止。有研究表明[8-9],对于肺出血患儿仅给予CPAP供氧,效果不佳,病死率极高,因此一旦诊断为肺出血,就应早期使用IPPV+PEEP通气模式,而不必过于强调CPAPIMVIPPV+PEEP的循序过渡。
治疗组抢救成功率88%,高于国内有关报道,并且过度通气、颅内出血、气胸等并发症减少;临床观察无静脉回流障碍及心功能影响,同时采用有效抗生素控制感染,肝素控制DIC,最后痊愈。因此,认为在综合治疗的基础上,呼吸机可减少肺出血,改善通气障碍,提高氧饱和度,提高治愈率。本研究与常规机械通气最大不同之处:初设PIP、PEEP均低于常规机械通气值,即使需调高PIP、PEEP也不超过常规机械通气参数,可应用于临床新生儿肺出血治疗[11]。
参考文献
[1] 傅建平, 刘辉保, 江海红, 胡安辉, 袁水生. 机械通气治疗新生儿肺出血50例临床分析[J]. 青岛医药卫生 , 2009,(04):105-108.
[2] 吴迅, 袁淑燕. 机械通气在危重新生儿肺出血治疗中的探讨[J]. 岭南急诊医学杂志 , 2006,(03):132-135.
[3] 中华医学会儿科学分会新生儿学组,中华儿科杂志编辑委员会.新生儿肺出血诊断与治疗方案[J].中华儿科杂志,2001,39(4):248.
[4] 陈宗文, 余秀兰, 田秀英. 机械通气治疗新生儿肺出血41例疗效分析[J]. 重庆医学 , 2010,(04):141-143.
[5] 南向珍. 婴幼儿肺出血23例临床分析[J] 温州医学院学报 , 2007,(04):105-109.
[6] 马圣洁. 机械通气治疗新生儿肺出血48例临床分析[J]. 中国煤炭工业医学杂志 , 2008,(06):114-116.
[7] 周晓光,肖昕,农绍汉,等.新生儿肺出血[J].新生儿机械通气治疗学,2004,3(1):366-373.
[8] 王珍.新生儿肺出血38例临床分析[J].中国医药导报,2007,4(16):79.
[9] 李晓艳,阙学俊.新生儿肺出血发病机制的研究进展[J].中国现代医生,2008,46(10):22.
[关键词]地质统计学;环境科学;水体污染;大气污染
doi:10.3969/j.issn.1673 - 0194.2016.12.139
[中图分类号]P628+.2 [文献标识码]A [文章编号]1673-0194(2016)12-0-01
地质统计学被称作空间信息统计学,是数学地质领域中发展较为迅速且具有广泛发展空间的一门学科。它将区域之间的变化作为理论基础,结合多孔介质空间结构变异函数,研究空间分布中具备一定规律性的自然现象,随后使用取样方案进行优化,对一些不规则取样进行处理并插值计算。在矿业、石油、农业、林业等行业中具有广泛的发展空间,取得了较大的研究应用成果。
1 地质统计学发展历程
20世纪中期,南非的矿物工程师DG Krige结合对南非金铀砾岩的研究经验以及对金矿储量的计算,根据样本区域位置的差异及样本关联性差异,首次提出了对每一个样本赋予相应的权值并在此基础上进行波动加权,以此方式代替传统的平均加权计算法。20世纪60年代,法国著名的统计学家G Matheron经过大量实验后,将DG Krige的研究升华为了具体的理论结果,并系统地提出了区域变量这个概念,由此形成了地质统计学这门新型学科。
地质统计学基本理论是在1978年由我国地质专家侯景儒引进的,前后历经了几十年的发展,至今为止无论是在理论方法还是实践应用方面都已经取得了一些进步,但是在环境科学领域方面的应用还不够成熟。
在短短的半个世纪内,地质统计学已经在各个领域中被广泛使用,目前为止形成了两个理论学派,其中一个是以法国统计学家G Matheron为主的“枫丹白露地质统计学派”,另一个是以美国的统计学及AG Journel为主的“斯坦福地质统计学派”,这两种学派根据其计算方法及应用方式的区别又分别被称为“参数地质统计”和“非参数地质统计”。地质统计学领域还出现了局部空间估计法如普通克立格法、对数克立格法和因子克立格法等。此外,我国一些相关领域的研究人员也研究出了一批以地质统计学为基础的软件。
2 地质统计学在环境科学方面的应用
20世纪初期,人们利用统计方法研究空间变异性,该方法提出将所收集的信息转变为单独的数值进行观测。可是随着信息化时代的发展,人们掌握的信息量越来越多,依靠收集的信息进行空间变异性研究的弊端越来越明显,很难实现对空间变异性的客观研究和评价。随着地质统计学的完善和进步,地质统计学在环境科学领域取得了很大的成就。
2.1 土壤环境研究中的地质统计学
自然环境下的土壤分布系统非常复杂,同样性质的土壤受土壤深度和周围环境的影响,土壤分布状况存在很大的差异。研究证明,土壤的自然密度、粒径等特性在同一水平或不同深度上的分布也是不同的。这些土壤特性的非均匀分布状态决定了土壤特性在空间中的变异性,从而导致土壤理化性质也存在一定程度的空间变异性。
2.2 地质统计学在水环境研究中的运用
水环境污染迁移参数的离散性与随机性两大问题是水环境污染领域中的重点研究课题。地质统计学被引进该领域之前,利用传统地下水水流和水质迁移模型的参数求证方式,对迁移参数的空间变异性进行合理的研究与评价。如果单纯使用确定性或偶然性的研究模型是很难正确且全面地描述整个水环境污染物迁移参数的变异背景,地质统计学可以对空间信息与偶然信息进行随机性处理,可以对这种随机性进行客观有效的分析。
2.3 地质统计学在环境科学其他领域中的运用
由于地质统计学可以有效描述同时具备结构性与随机性的环境参数,因此利用地质统计学研究大气污染物分布也有很好的研究效果,例如:孟健宇和马晓明就通过指示克立格法对某个城市大气中含有的二氧化硫浓度的变异特征进行分析与研究,最后得出该方法是研究大气污染差值的最佳手段这一结论。
3 地质统计学在环境科学领域中的展望
随着地质统计学的不断进步和完善,其实践方式和理论已经在环境科学研究方面得到了很好的应用,在土壤有毒物质研究以及水环境污染等研究课题方面取得了可观的成绩。由于土壤多孔介质特性中显著存在空间的变异特征,地质统计学对于这种随机性的事物来说是最佳研究手段。现阶段,对于土壤污染物的空间分布研究重点在重金属领域,并逐渐延伸到部分难降解污染物质的研究中,例如:影响内分泌物质及一些强致癌物质,他们的分布形态类似于重金属,地质统计学在这一类物质的研究当中具有十分突出的优势。自然界中含水介质的非均匀性导致了其他水环境污染参数迁移物质中具有高度变异性,特别是环境十分复杂的地下水环境系统。在以后的环境科学研究中,可以将地质统计学的分析方法、分形理论和灰色系统等一系列的研究方法和相关理论结合在一起进行使用,这样不仅会进一步降低研究复杂性,还可以更加准确地进行污染物迁移预测以及污染物迁移参数的价值估算,提高环境科学研究的准确性和先进性,为环境模拟和环境评价建立高效、科学的模型。
4 结 语
将地质统计学的研究理论和方法,与地理信息系统的研究工具相结合,为目前的环境科学研究提供了更加科学有效的研究方法。在此基础上将地质统计学的应用扩大到其他领域中,比如:水体污染和大气污染研究领域,可以通过地质统计学更加科学、客观地评价环境污染。
主要参考文献
[1]陶月赞,郑恒强,汪学福.用Kriging方法评价地下水监测网密度[J].水文, 2003(2).
关键词: 医学硕士;学位论文;数理统计;调查
摘 要:目的 分析医学硕士研究生学位论文中数理统计应用情况. 方法 随机抽取2000/2001年100位河南医科大学应届医学硕士学位论文初稿,对其中数理统计应用情况进行统计分析. 结果 论文中采用单因素设计者占94.0%,多因素设计占6.0%,应用正确率为96.6%;论文中使用经典基本数理统计方法为97.9%,统计学方法的正确应用率为75.7%;应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误. 结论 应加强硕士学位论文的数理统计设计和审查工作.
Keywords:medical master graduates;thesis;statistics;in-vestigation
Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.
0 引言
数理统计的应用正确与否是论文科学性的重要标志.近年在医学学术期刊(包括国内著名的核心期刊)上发表的论著,数理统计方面还存在问题,甚至导出错误的结论[1-4] .数理统计作为一门应用学科已成为医学硕士研究生学位课程的主要内容之一,越来越受到硕士研究生的重视.为了解医学硕士生学位论文中数理统计的应用情况,为课题的统计设计和论文审查提供科学依据,为教学改革提供参考,作者随机抽取河南医科大学应届硕士学位论文100篇,对其数理统计应用情况进行分析.
1 材料和方法
2000/2001年河南医科大学共有医学硕士研究毕业生222人,应用随机数表随机抽取100名硕士研究生学位论文的初稿作为研究对象,对实验设计类型、使用的统计学分析方法及使用的统计学工具,存在的问题等进行调查.结果推断利用SAS(6.12)统计分析系统进行分析.
2 结果
2.1 实验设计类型 硕士学位论文中采用单因素设计的比重较大,占94.0%,统计学设计正确率较高(Tab1).
2.2 统计学方法 论文中使用经典的基本统计学方法的占绝对多数,为97.9%(856/874),统计学方法的正确应用率为75.7%,且不同的统计学方法之间的正确应用率存在着差别.应用参数统计方法者518次,应用正确者357次,正确应用率为68.9%;应用非参数统计方法者346次,应用正确者305次,正确应用率为88.1%.对参数统计方法的正确应用率低于非参数统计方法(χ2 =35.8,P
表1 硕士论文的实验设计类型及正确应用情况 略
表2 论文中应用的统计学方法分布及正确应用情况 略
表3 获取结果时使用的计算工具 略
2.3 数理统计问题 论文中存在的问题在参数统计与非参数统计中的构成不同,应用参数统计时出现的问题是未进行使用条件判断者159次,未正确应用统计方法者9次,推断结论有误者19次;而应用非参数统计时出现问题是未进行使用条件判断者8次,未正确应用统计方法者14次,推断结论有误者21次(两者相比χ2 =48.31,P
3 讨论
在硕士研究生的基础理论教学中,开设数理统计学的主要目的是为了指导研究生正确地应用统计学的原理与方法,解决医学研究中如何科学地进行科研资料的搜集、整理和分析推断问题.传统的经典的和基本的统计学理论与方法仍然是当前硕士研究生进 行科研工作的统计学方面的主要工具.论文中采用的完全随机、配对及配伍等单因素设计的比重较大占94.0%,多因素设计占的比重较少为6.0%,总的来说,其统计学设计的正确率是比较高的.说明学生对统计学设计理论比较重视并能正确应用.论文中使用经典的基本统计学方法占绝对多数为97.9%(856/874),主要为t检验、F检验、χ2 检验及秩和检验等,这与这些方法成熟、简单明了且实用性极强有很大关系,而近些年来新发展的比较前沿的统计学分析方法[5-12] ,由于对设计要求严格,使用过程复杂,非专业人员在短时间内难以掌握而实际应用较少.这提示在今后的研究生教学过程中,除应继续进行基础部分内容的学习外,还应加强新的统计学方法和使用条件的教学力度.
论文中以基本的经典的统计学方法为主,但实际应用时的正确应用率仅为75.7%,且不同的统计学方法之间的正确应用率存在着差别,对参数统计方法的正确应用率低于非参数统计方法.经进一步分析,应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误.作为一门应用学科,数理统计学有着其独特的逻辑性,概念多、公式多且连贯性强,众多的公式和分析方法既有联系又有区别,同时有着严格的适用条件.传统的教材编写和教学重点是统计学方法的计算技巧,其结果容易将学生引导到仅注重学习统计计算方法上,忽略了各种方法的适用条件和对资料的综合分析.所以t检验、F检验等经典的统计方法虽看似简单,但要正确应用到实际工作中,对学生来说仍有相当难度.秩和检验等非参数统计由于其适用条件较参数统计宽松,使得其正确应用率高于参数检验,而并非学生对非参数检验掌握的比参数检验更好.
随着计算机技术和统计软件的完善与普及,各种复杂的统计计算不必再用手工计算.本次研究表明大部分人(91.0%)通过应用著名的统计分析软件SPSS及SAS获取结果,这些结果比手工计算的更准确、更规范,所以各种统计方法的计算过程大可不必细致介绍,而要重点介绍各种数理统计方法的使用条件,加强资料分析实践,提高硕士生解决实际问题的能力.
参考文献
[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.
[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.
[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.
[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.
[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.
[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.
[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.
[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.
[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.
[10]Sun XW,Fang JQ,Yang XF.Number-theoretic method for pa-rameters estimation in multivariate nonlinear regression with ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(1):6-7.
关键词:贝叶斯;经典统计;统计思想;统计方法
一、引言
经典统计学派和贝叶斯统计学派是在统计学的历史上逐渐发展起来的两大主要学派。贝叶斯方法是由英国学者Bayes在其论文中首先提出来的,并在和经典学派的争论中逐渐发展起来,目前被越来越多的统计工作者所研究和广泛应用。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两个统计学派的比较研究中发现,二者在其基本思想以及统计推断时不尽相同,与此同时,二者也都有自己的优点与缺点。正确理解这些不同,对于我们今后正确地运用统计方法分析实际问题起着举足轻重的作用。因此,本文对这两种统计方法的基本思想作了对比,分析了各自的优势及缺点,并说明了他们在用于统计推断时表现的差别,有助于我们进一步理解这两种基本的统计分析方法。
二、基本思想的对比
1.区别一
经典统计学认为概率必须符合科学的要求,是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。而贝叶斯统计认为一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。
2.区别二
经典学派很注重利用已经出现的样本观察值,没观察到的样本不予考虑。贝叶斯学派很注重先验信息的收集、挖掘和加工,使他们数量化成先验分布,参加到统计推断中,以此提高统计推断的质量。
3.区别三
经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”。
4.区别四
经典统计学派判断方法是让检验统计量与临界值进行比较。贝叶斯的判断方法是在获得后验分布之后,可分别计算原假设H0和备择假设H1的后验概率。
5.总结
贝叶斯统计学派与经典统计学派在很多问题上都有分歧但是它们最根本的分歧是:第一,是否利用先验信息。由于产品的设计、生产都有一定的继承性,这样就存在许多相关产品的信息以及先验信息可以利用,贝叶斯统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高统计精度;而经典统计学派忽略了这些信息。第二,是否将参数e看成随机变量。贝叶斯统计学派的最基本的观点是任一未知量e都可以看成随机变量,可以用一个概率分布去描述,这个分布就是先验分布。因为任一未知量都具有不确定性,而在表述不确定性时,概率与概率分布是最好的语言;相反,经典统计学派却把未知量e就简单看成一个未知参数,来对它进行统计推断。
三、两种统计方法的优缺点
1.贝叶斯统计的优点与缺点
贝叶斯统计以从经验中学习为目标,将历史信息与样本似然函数结合在一起,使之形成一套比经典统计更加灵活,更加直观,更加易于理解的统计方法,在计量模型中正在受到越来越广泛的应用。特别是在小样本的情况下,点估计和区间估计可以有比经典统计更加精确的结果;其次,在用贝叶斯后验分布进行推断后,可以将第一类、第二类错误所造成的损失考虑在内,因而比经典统计更加实用;另外,在处理多余参数的问题上,贝叶斯统计可以直接在后验密度中将多余的参数积分掉,这又比经典统计方法方便得多。
贝叶斯统计在很多方面比经典统计有明显的优势,然而,仍然有许多本身存在的问题和缺陷制约和阻碍着它的发展。例如,先验分布的确定是近几十年来研究的主要问题;其次,我们一般只知道后验分布的核,计算后验密度函数的推导与计算具有非常大的难度,也没有可以广泛应用各种模型的软件和程序。
2.经典统计的优点及缺点
经典统计学作为统计学的根基,有着它自身所无法比拟的优点。首先,它用于推断过程的数据是样本数据,排除经常很难量化的先验知识。其次,它对于方法的评估有一系列的准则。只要可能,就能找到最优方法。
但与此同时,它的缺点也比较显著:首先,在小样本的情况下,点估计和区间估计没有贝叶斯的结果精确;其次,它不能将第一类、第二类错误所造成的损失考虑在内;最后,在处理多余参数的问题上,没有贝叶斯统计方法方便。
3.总结
贝叶斯统计学派与经典统计学派虽然有很大区别,但是它们各有优缺点,各有其适用的范围,我们要具体问题具体分析,以获得一种更适合解决实际问题的方法。而且,在很多情况下,二者得出的结论在形式上是相同的。
四、两种统计方法在统计推断时的差别
1.在点估计与区间估计方面的区别
贝叶斯定理是贝叶斯统计学的理论基础,函数p(x|θ)集中了总体信息和样本信息,被称为似然函数,它是未知参数θ的函数。在经典统计中同样承认似然函数,在这一点的理解上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ的函数,而样本x在似然函数中是一组观察值,使似然函数值达到最大的θ值有比其他θ值更大的说服力,此θ值即为经典统计中的最大似然估计而我们可以证明,在贝叶斯统计中,当在“无信息”的条件下,θ的最大后验估计就是经典统计中的最大似然估计。在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。
在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。
2.在假设检验方面的区别
经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(x|H0为真),x是样本向量。而在贝叶斯统计中,可以直接求得在样本X给定的条件下,参数的后验概率,因而得出H0和H1和后验概率,即判定的是P(H0为真| x)和P(H0为假|x)。这是两种检验方法间的根本区别。
在贝叶斯统计的检验中,先验信息的分布和参数的变化可以引起拒绝域的变化,而贝叶斯统计在后验均值估计中的最基本特征是伸缩性。
贝叶斯统计在检验问题中的一个优势在于多重检验问题,这是经典统计所办不到的。例如:在一次企业对两种生产方法的比较检验中,我们将假设设为:H0:θ=0;H1:θ0,H0表示两种方法无显著差别,H1表示方法一优于方法二,H2表示方法二优于方法一。贝叶斯统计在后验概率中计算H1和H2的概率,而经典统计方法则很难去处理此类
问题。
五、实例分析
下面我们通过一个例子对两种思想进行一些比较。例:以随机变量θ代表某人群中个体的智商真值,θ i为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为υ,则第i个个体在一次智商测验中的得分可以表示为:Xij=υ+ei+eij其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄的儿童的智商真值θ~N(100,225),个体智商测验得分x~N(θ*,100)。现在一名该年龄的儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平?(2)若取θ*在(a,b)为正常,问该儿童智商是否属于正常?
1.用经典统计方法解答
对第一问,建立检验问题:H0:θ*100,按照经典统计学方法,若取。α=0.05,则拒绝域为{x:x>=116.45}尚不能认为该儿童智商高于平均水平。
对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。
2.用贝叶斯方法解答
在贝叶斯学派中,当θ i未知时,将其看作随机变量,与0具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。根据贝叶斯理论,θ的先验分布是N(100,225),测验结果x*~N(0,100),儿童智商的后验分布为正态分布N(110.38,69.23)。
对第一问,同样设H0:0‘100,查正态分布表可以得到P(H0lX=115)=0,106,P(H1lx=115)=0,894,根据风险最小原则拒绝H0,接受H1。
对第二问,设H0:a
由此可以看出:按贝叶斯的观点,多重假设检验的情形并不比两个假设的检验更困难,因为它只需要多算几个后验概率即可;它同时利用了样本和
的先验信息,且由于导出了样本x下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。
自从Paelinck提出“空间经济计量学”这个术语,Cliff和Ord(1973,1981)对空间自回归模型的开拓性工作,发展出广泛的模型、参数估计和检验技术,使得经济计量学建模中综合空间因素变得更加有效。
Anselin(1988)对空间经济计量学进行了系统的研究,它以及Cliff和Ord(1973,1981)这三本著作至今仍被广泛引用。Anselin对空间经济计量学的定义是:“在区域科学模型的统计分析中,研究由空间引起的各种特性的一系列方法。”Anselin所提到的区域科学模型,指明确将区域、位置及空间交互影响综合在模型中,并且它们的估计及确定也是基于参照地理的(即:截面的或时-空的)数据,数据可能来自于空间上的点,也可能是来自于某个区域,前者对应于经纬坐标,后者对应于区域之间的相对位置。
国外近几年空间经济计量学得以迅速发展,如Anselin和Florax(1995)指出的,主要得益于以下几点:
(1)人们对于空间及空间交互影响的作用的重新认识。对空间的重新关注并不局限于经济学,在其它社会科学中也得以反映。
(2)与地理对应的社会经济大型数据库的逐步实用性。在美国以及欧洲,官方统计部门提供的以区域和地区为统计单元的大型数据库很容易得到,并且价格低廉。这些数据可以进行空前数量的截面或时空观测分析,这时,空间(或时空)自相关可能成为标准而非一种特殊情况。
(3)地理信息系统(GIS)和空间数据分析软件,以高效和低成本的计算技术处理空间观测的发展。GIS的使用,允许地理数据的有效存储、快速恢复及交互可视化,为空间分析技术的艺术化提供了巨大的机会。至少目前线性模型中,缺少针对空间数据和空间经济计量学的软件的情况已经大为改观。目前已有一些专门的空间统计分析软件,并且SAS、S-PLUS等著名统计软件中,都已经包括用于空间统计分析的模块。
(二)空间经济计量学与相关学科的关系
空间统计学是研究空间问题的另一门学科,它是应用数学的一个快速发展的分支。它起源于20世纪50年代早期,用以帮助采矿业进行矿藏量的计算。最早的工作是采矿工程师D.G.Krige和统计学家H.S.Sichel在南非进行的。70年代随着计算机的普及以及运算速度的大幅提高,空间统计分析技术逐渐扩展到地球科学的其它领域。目前已经普遍存在于需要处理时间上或空间上相关的数据的科技领域中。
空间经济计量学与空间统计学的区分不太容易。Haining和Anselin的观点认为空间统计学的研究大多由数据驱动,而空间经济计量学由模型驱动,即从特定的理论或模型出发,重点放在问题的估计、解释和检验上。空间统计学的主流是研究生态学和地质学中的物质现象,空间经济计量学主要研究与区域及城市经济有关的模型。有一种观点认为二者的区分应基于作者将其工作对应于空间经济计量学还是空间统计学,这种区分办法可能较为简单。
地质统计学(Geostatistics)发展于20世纪60年代,主要用于研究地质学现象的空间结构和进行空间估值。例如,在探矿过程中,通常是在空间上布点进行钻探,然后对采样得到的样品进行分析,估计矿藏的分布和储量。由于矿藏不开采的话,在时间上结构几乎是不变的,因此地质统计学研究的问题主要是空间相关。空间经济计量学所研究的问题不仅存在空间相关,往往所研究的问题在时间上也存在相关。
在区域经济学的理论中,人们建立了各种理论以及关系式来描述人类在空间上的行为,如研究城镇问题的“引力模型”等。但在利用模型进行定量研究问题的时候,需要将理论或关系式用数学模型来进行刻划,利用统计方法对模型进行估计、检验,并进行评价,这些正好是属于经济计量学研究的范畴。应该说,空间经济计量学主要研究区域经济问题,依据的是区域经济学理论,但它还需要综合数学,以及空间统计学等学科,因此它不等同于区域经济学,而是一门交叉学科。
二、研究的问题
空间经济计量学主要研究存在空间效应的问题。空间效应主要包括空间相关和空间差异性。在研究中涉及空间相邻、空间相邻矩阵等概念。
(一)空间相关
空间相关指在样本观测中,位于位置i的观测与其它j≠i的观测有关,即
附图
存在空间相关的原因有两方面:相邻空间单元存在测量误差,空间交互影响的存在。测量误差是由于调查过程中,数据的采集与空间中的单位有关,如数据是按省、市、县等统计的,但设定的空间单位与研究问题不一致,存在测量误差。
空间相关不仅意味着空间上的观测缺乏独立性,并且意味着潜在于这种空间相关中的空间结构,也就是说空间相关的强度及模式由绝对位置和相对位置(布局,距离)决定。
对于空间相关,空间自回归通常是其核心内容,空间自回归模型的一般形式为:
附图
在这个模型中,β解释变量X(n×k矩阵)的参数向量(k×1),ρ是空间滞后相关变量的参数,λ是残差空间自回归(空间AR)结构中的参数。
W[,1]和W[,2]为n×n矩阵,是标准化或未标准化的空间加权矩阵,分别对应于因变量以及扰动项中的空间自回归过程,这两个矩阵可以不同,这意味着两个过程由不同的空间结构生成。
这个模型可以退化成为普通的线性回归模型、(纯)空间自回归模型、混合回归与空间自回归模型、残差空间自回归模型等形式。
对这个模型,普通最小二乘估计不仅是有偏的,而且是不一致的,参数的估计通常采用极大似然估计,近几年,有学者尝试采用贝叶斯估计对参数进行估计。
(二)空间差异性
空间差异性指空间上的区域缺乏均一性,如存在中心区和郊区、先进和后进地区等。例如,我国沿海地区和中西部地区经济存在较大差别。
对于空间差异性,只要将空间单元的特性考虑进去,大多可以用经典经济计量学方法解决。但当空间差异性与空间相关共同存在时,经典经济计量学方法不再适用,而且这时问题可能变得非常复杂,因为这时要区分空间差异性与空间相关可能非常困难。
研究空间差异性的模型主要有:
E.Casetti提出的空间扩展模型(1972)和回归参数漂移分析方法(简称DARP)模型(1982)。这时,空间差异性表现为模型参数随空间位置变化,并以空间单元的位置信息作为辅助变量(称为扩展参数)。
y=Xβ+ε
附图
模型(3)为以经纬坐标(Z[,x],Z[,y])作为扩展参数的空间扩展模型。同样可以以到中心区域的距离作为扩展参数设计模型。
将模型(3)的第二个式子右边加入随机扰动项,则为DARP模型。E.Casetti(1992)进一步提出了贝叶斯空间扩展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加权回归模型(简称GWR模型)。
附图
(三)时空数据空间模型
在模型中考虑时间维增加了描述的复杂性,但综合时间空间的模型在实际工作中非常有用。在经典的经济计量学模型中,这是综合截面和时间序列数据的情形。如果数据不存在空间相关,则可以采用PanelData模型。Anselin(1988)将似不相关(SUR)模型扩展到空间的情形,提出空间SUR模型。
三、应用前景及需要进一步研究的问题
(一)在中国的应用前景
在我国,地质统计学是较早应用空间统计学的领域,在20世纪80年代中国科学院就有人研究并应用Krige模型。空间统计学除了在地质学的研究中发挥作用,近十年来,周国法、徐汝梅等学者研究生态学中的空间相互作用,并于1998年出版了《生物地理统计学》。20世纪80年代以来,我国利用卫星遥感技术,对土地、森林、农业、矿产、能源、作物估产、灾患检测等进行应用,开始了我国空间统计学在经济领域应用中统计调查的工作,为了将空间遥感调查技术逐步纳入到我国统计的常规性工作中,1998年10月,国家统计局成立了空间统计研究室,并与中国科学院地理所合作,组成了“空间信息多重采样设计的空间统计学应用研究”课题组,运用遥感技术和空间分析对我国农业耕地、森林、草地等资源以及城镇动态变化进行调查,该项目获得国家统计局2000年课题研究一等奖。
在我国地质统计学、生物地理统计学及利用遥感技术进行的各种调查,都属于空间统计学的范畴。地质统计学、生物地理统计学主要研究空间相关及空间估值,在生物地理统计学的研究中还包括物种的空间扩散过程。所用的方法主要是各种Krige模型、方差图模型,以及空间自回归模型。空间动态采样的研究,与地质矿产调查类似,主要涉及样本在空间上的布局、有效样本量的确定、采样误差的计算等问题的研究,根据其研究的问题和方法,也可以将其归入统计学的抽样调查分支之中。
随着我国按地区进行统计的统计基础资料不断积累,尤其是遥感技术应用到统计调查中来,都将使得按时间和空间排列的数据资料极为丰富,对数据进行空间甚至时空分析成为可能,人们将逐渐从时间的角度转向普遍从时空的角度来考虑问题。
从经济分析的角度看,空间经济计量学在我国以下几个方面将有很大的应用前景。
由于区域之间存在相关性,或者存在差异性,因此一项政策对每个区域的影响是不同的,通过运用空间经济计量学方法对各区域进行研究之后,找到政策在各区域上作用的关系,对于政府决策、正确制订政策具有很大的参考价值。
由于区域之间存在先进地区和后进地区,通过空间经济计量学方法可以对先进地区与后进地区之间的相互关系进行研究。
按区域编制投入产出表时,空间的概念将发挥作用。
对房地产的价值进行评估时,在考虑外界影响因素的基础上,充分考虑地区之间的相互关系,将对正确评估房地产的价值有很大帮助。
对环境污染进行研究时,运用空间经济计量学方法对污染的传播方式进行研究,有助于人们对环境污染进行控制。
在交通领域的研究,可以利用空间经济计量学方法对人员、货物在空间上的流动方式进行研究,同时对通道上的不同区段进行研究。
在对某种疾病(如流感)在空间上的传播过程进行研究之后,对于疾病的预防控制将有很大的帮助。
建立了空间的概念之后,人们对于在空间上的抽样将综合考虑空间单元之间的相关性。而空间抽样在空间上的布点方式也可以用作商业网点的布局研究。
总之,只要问题涉及到空间的概念,空间经济计量学就将发挥其作用。对空间经济计量学的深入研究及应用,将促使人们面对问题的时候,从空间或时空的角度思考问题。
(二)需要进一步研究的问题
目前的研究中,系统内的空间单元受到系统内其它位置单元的影响,但边界处的单元还受到系统外与之相邻的单元的影响,如何将这个影响考虑在模型中值得研究。
在具体问题中,距离的概念需要加以认真对待,单用地理上的距离有时并不合适,例如国与国之间的经济联系在今天并不是距离远近决定的,电子化交易使得资金的流动非常迅速方便,因此,在研究这类问题时,如何将贸易、人员、资金的流动充分考虑到空间加权矩阵中去,尚值得研究。
贝叶斯方法在统计学各个分支的应用越来越广,空间贝叶斯模型也是目前空间经济计量学研究的热点之一。
可变单元的问题。当数据汇总的级别变化,可能整个模型的描述都发生变化,对于不同的问题,可能影响模型变化的汇总的级别也不同,能否有一个统一的模式对系统进行描述尚待进一步研究。
时空数据的综合分析,参数估计的渐近性质,模型的各种检验方法等,还有待进一步的研究。
经济问题中,许多需要研究的对象是多维的,即研究对象是一个向量,如何在空间问题中建立一系列空间VAR模型,尚需研究。
不易获得较为详细且价格低廉的区域统计数据,将大大限制空间经济计量学模型的应用。建立我国区域统计数据库,要求价格低廉且方便实用,是摆在统计工作者面前的一个重要课题。
【参考文献】
1Anselin,L.1988.SpatialEconometrics.MethodsandModels,DordrechtKluwerAcademic
Publishers.
2Anselin,L.andR.J.G.M.Floraxed.1995.NewDirectionsinSpatialEconometrics,Springer-Verlag.
3Brundson,C.,A.S.Fotheringham,andM.E.Chalton.1996."GeographicallyWeighted
Regression:AMethodforExploringSpatialNonstationarity,"GeographicalAnalysis,
Vol.28,p281-298.
4Brunsdon,C.,A.S.Fotheringham,andM.E.Chalton.1999."SomeNotesonParametric
SignificanceTestsforGeographicallyWeightedRegression,"JournalofRegional
Science,Vol.39,No.3,p497-524.
5Casetti,E.1972."GeneratingModelsbyExpansionMethod:ApplicationstoGeographic
Research,"GeographicalAnalysis,Vol.4,p81-91.
6Casetti,E.1982."DriftAnalysisofRegressionParameters:AnApplicationtothe
InvestigationofFertilityofFertilityDevelopmentRelations,"ModelingandSimulation
13,p961-966.
7Casetti,E.1992."BayesianRegressionandtheExpansionMetod,"Geographical
Analysis,Vol.24,p58-74.
8Cliff,A.D.andJ.K.Ord.1981.SpatialProcesses:ModelsandApplications,Pion.
9Haining,R.P.SpatialDataAnalysisintheSocialandEnvironmentalScience,Cambridge
UniversityPress.1990.
10Paelinck,JeanH.P.andLeoH.Klaassen.1979.SpatialEconometrics,SaxonHouse,
TeakfieldLtd.
11庄大方,张稳,罗建国.土地资源遥感调查中的空间信息多重采样框架设计与GIS实现,统计研究,1999年第1期.
自从Paelinck提出“空间经济计量学”这个术语,Cliff和Ord(1973,1981)对空间自回归模型的开拓性工作,发展出广泛的模型、参数估计和检验技术,使得经济计量学建模中综合空间因素变得更加有效。
Anselin(1988)对空间经济计量学进行了系统的研究,它以及Cliff和Ord(1973,1981)这三本著作至今仍被广泛引用。Anselin对空间经济计量学的定义是:“在区域科学模型的统计分析中,研究由空间引起的各种特性的一系列方法。”Anselin所提到的区域科学模型,指明确将区域、位置及空间交互影响综合在模型中,并且它们的估计及确定也是基于参照地理的(即:截面的或时-空的)数据,数据可能来自于空间上的点,也可能是来自于某个区域,前者对应于经纬坐标,后者对应于区域之间的相对位置。
国外近几年空间经济计量学得以迅速发展,如Anselin和Florax(1995)指出的,主要得益于以下几点:
(1)人们对于空间及空间交互影响的作用的重新认识。对空间的重新关注并不局限于经济学,在其它社会科学中也得以反映。
(2)与地理对应的社会经济大型数据库的逐步实用性。在美国以及欧洲,官方统计部门提供的以区域和地区为统计单元的大型数据库很容易得到,并且价格低廉。这些数据可以进行空前数量的截面或时空观测分析,这时,空间(或时空)自相关可能成为标准而非一种特殊情况。
(3)地理信息系统(GIS)和空间数据分析软件,以高效和低成本的计算技术处理空间观测的发展。GIS的使用,允许地理数据的有效存储、快速恢复及交互可视化,为空间分析技术的艺术化提供了巨大的机会。至少目前线性模型中,缺少针对空间数据和空间经济计量学的软件的情况已经大为改观。目前已有一些专门的空间统计分析软件,并且SAS、S-PLUS等著名统计软件中,都已经包括用于空间统计分析的模块。
(二)空间经济计量学与相关学科的关系
空间统计学是研究空间问题的另一门学科,它是应用数学的一个快速发展的分支。它起源于20世纪50年代早期,用以帮助采矿业进行矿藏量的计算。最早的工作是采矿工程师D.G.Krige和统计学家H.S.Sichel在南非进行的。70年代随着计算机的普及以及运算速度的大幅提高,空间统计分析技术逐渐扩展到地球科学的其它领域。目前已经普遍存在于需要处理时间上或空间上相关的数据的科技领域中。
空间经济计量学与空间统计学的区分不太容易。Haining和Anselin的观点认为空间统计学的研究大多由数据驱动,而空间经济计量学由模型驱动,即从特定的理论或模型出发,重点放在问题的估计、解释和检验上。空间统计学的主流是研究生态学和地质学中的物质现象,空间经济计量学主要研究与区域及城市经济有关的模型。有一种观点认为二者的区分应基于作者将其工作对应于空间经济计量学还是空间统计学,这种区分办法可能较为简单。
地质统计学(Geostatistics)发展于20世纪60年代,主要用于研究地质学现象的空间结构和进行空间估值。例如,在探矿过程中,通常是在空间上布点进行钻探,然后对采样得到的样品进行分析,估计矿藏的分布和储量。由于矿藏不开采的话,在时间上结构几乎是不变的,因此地质统计学研究的问题主要是空间相关。空间经济计量学所研究的问题不仅存在空间相关,往往所研究的问题在时间上也存在相关。
在区域经济学的理论中,人们建立了各种理论以及关系式来描述人类在空间上的行为,如研究城镇问题的“引力模型”等。但在利用模型进行定量研究问题的时候,需要将理论或关系式用数学模型来进行刻划,利用统计方法对模型进行估计、检验,并进行评价,这些正好是属于经济计量学研究的范畴。应该说,空间经济计量学主要研究区域经济问题,依据的是区域经济学理论,但它还需要综合数学,以及空间统计学等学科,因此它不等同于区域经济学,而是一门交叉学科。
二、研究的问题
空间经济计量学主要研究存在空间效应的问题。空间效应主要包括空间相关和空间差异性。在研究中涉及空间相邻、空间相邻矩阵等概念。
(一)空间相关
空间相关指在样本观测中,位于位置i的观测与其它j≠i的观测有关,即
附图
存在空间相关的原因有两方面:相邻空间单元存在测量误差,空间交互影响的存在。测量误差是由于调查过程中,数据的采集与空间中的单位有关,如数据是按省、市、县等统计的,但设定的空间单位与研究问题不一致,存在测量误差。
空间相关不仅意味着空间上的观测缺乏独立性,并且意味着潜在于这种空间相关中的空间结构,也就是说空间相关的强度及模式由绝对位置和相对位置(布局,距离)决定。
对于空间相关,空间自回归通常是其核心内容,空间自回归模型的一般形式为:
附图
在这个模型中,β解释变量X(n×k矩阵)的参数向量(k×1),ρ是空间滞后相关变量的参数,λ是残差空间自回归(空间AR)结构中的参数。
W[,1]和W[,2]为n×n矩阵,是标准化或未标准化的空间加权矩阵,分别对应于因变量以及扰动项中的空间自回归过程,这两个矩阵可以不同,这意味着两个过程由不同的空间结构生成。
这个模型可以退化成为普通的线性回归模型、(纯)空间自回归模型、混合回归与空间自回归模型、残差空间自回归模型等形式。
对这个模型,普通最小二乘估计不仅是有偏的,而且是不一致的,参数的估计通常采用极大似然估计,近几年,有学者尝试采用贝叶斯估计对参数进行估计。
(二)空间差异性
空间差异性指空间上的区域缺乏均一性,如存在中心区和郊区、先进和后进地区等。例如,我国沿海地区和中西部地区经济存在较大差别。
对于空间差异性,只要将空间单元的特性考虑进去,大多可以用经典经济计量学方法解决。但当空间差异性与空间相关共同存在时,经典经济计量学方法不再适用,而且这时问题可能变得非常复杂,因为这时要区分空间差异性与空间相关可能非常困难。
研究空间差异性的模型主要有:
E.Casetti提出的空间扩展模型(1972)和回归参数漂移分析方法(简称DARP)模型(1982)。这时,空间差异性表现为模型参数随空间位置变化,并以空间单元的位置信息作为辅助变量(称为扩展参数)。
y=Xβ+ε
附图
模型(3)为以经纬坐标(Z[,x],Z[,y])作为扩展参数的空间扩展模型。同样可以以到中心区域的距离作为扩展参数设计模型。
将模型(3)的第二个式子右边加入随机扰动项,则为DARP模型。E.Casetti(1992)进一步提出了贝叶斯空间扩展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加权回归模型(简称GWR模型)。
附图
(三)时空数据空间模型
在模型中考虑时间维增加了描述的复杂性,但综合时间空间的模型在实际工作中非常有用。在经典的经济计量学模型中,这是综合截面和时间序列数据的情形。如果数据不存在空间相关,则可以采用PanelData模型。Anselin(1988)将似不相关(SUR)模型扩展到空间的情形,提出空间SUR模型。
三、应用前景及需要进一步研究的问题
(一)在中国的应用前景
在我国,地质统计学是较早应用空间统计学的领域,在20世纪80年代中国科学院就有人研究并应用Krige模型。空间统计学除了在地质学的研究中发挥作用,近十年来,周国法、徐汝梅等学者研究生态学中的空间相互作用,并于1998年出版了《生物地理统计学》。20世纪80年代以来,我国利用卫星遥感技术,对土地、森林、农业、矿产、能源、作物估产、灾患检测等进行应用,开始了我国空间统计学在经济领域应用中统计调查的工作,为了将空间遥感调查技术逐步纳入到我国统计的常规性工作中,1998年10月,国家统计局成立了空间统计研究室,并与中国科学院地理所合作,组成了“空间信息多重采样设计的空间统计学应用研究”课题组,运用遥感技术和空间分析对我国农业耕地、森林、草地等资源以及城镇动态变化进行调查,该项目获得国家统计局2000年课题研究一等奖。
在我国地质统计学、生物地理统计学及利用遥感技术进行的各种调查,都属于空间统计学的范畴。地质统计学、生物地理统计学主要研究空间相关及空间估值,在生物地理统计学的研究中还包括物种的空间扩散过程。所用的方法主要是各种Krige模型、方差图模型,以及空间自回归模型。空间动态采样的研究,与地质矿产调查类似,主要涉及样本在空间上的布局、有效样本量的确定、采样误差的计算等问题的研究,根据其研究的问题和方法,也可以将其归入统计学的抽样调查分支之中。
随着我国按地区进行统计的统计基础资料不断积累,尤其是遥感技术应用到统计调查中来,都将使得按时间和空间排列的数据资料极为丰富,对数据进行空间甚至时空分析成为可能,人们将逐渐从时间的角度转向普遍从时空的角度来考虑问题。
从经济分析的角度看,空间经济计量学在我国以下几个方面将有很大的应用前景。
由于区域之间存在相关性,或者存在差异性,因此一项政策对每个区域的影响是不同的,通过运用空间经济计量学方法对各区域进行研究之后,找到政策在各区域上作用的关系,对于政府决策、正确制订政策具有很大的参考价值。
由于区域之间存在先进地区和后进地区,通过空间经济计量学方法可以对先进地区与后进地区之间的相互关系进行研究。
按区域编制投入产出表时,空间的概念将发挥作用。
对房地产的价值进行评估时,在考虑外界影响因素的基础上,充分考虑地区之间的相互关系,将对正确评估房地产的价值有很大帮助。
对环境污染进行研究时,运用空间经济计量学方法对污染的传播方式进行研究,有助于人们对环境污染进行控制。
在交通领域的研究,可以利用空间经济计量学方法对人员、货物在空间上的流动方式进行研究,同时对通道上的不同区段进行研究。
在对某种疾病(如流感)在空间上的传播过程进行研究之后,对于疾病的预防控制将有很大的帮助。
建立了空间的概念之后,人们对于在空间上的抽样将综合考虑空间单元之间的相关性。而空间抽样在空间上的布点方式也可以用作商业网点的布局研究。
总之,只要问题涉及到空间的概念,空间经济计量学就将发挥其作用。对空间经济计量学的深入研究及应用,将促使人们面对问题的时候,从空间或时空的角度思考问题。
(二)需要进一步研究的问题
目前的研究中,系统内的空间单元受到系统内其它位置单元的影响,但边界处的单元还受到系统外与之相邻的单元的影响,如何将这个影响考虑在模型中值得研究。
在具体问题中,距离的概念需要加以认真对待,单用地理上的距离有时并不合适,例如国与国之间的经济联系在今天并不是距离远近决定的,电子化交易使得资金的流动非常迅速方便,因此,在研究这类问题时,如何将贸易、人员、资金的流动充分考虑到空间加权矩阵中去,尚值得研究。
贝叶斯方法在统计学各个分支的应用越来越广,空间贝叶斯模型也是目前空间经济计量学研究的热点之一。
可变单元的问题。当数据汇总的级别变化,可能整个模型的描述都发生变化,对于不同的问题,可能影响模型变化的汇总的级别也不同,能否有一个统一的模式对系统进行描述尚待进一步研究。
时空数据的综合分析,参数估计的渐近性质,模型的各种检验方法等,还有待进一步的研究。
经济问题中,许多需要研究的对象是多维的,即研究对象是一个向量,如何在空间问题中建立一系列空间VAR模型,尚需研究。
不易获得较为详细且价格低廉的区域统计数据,将大大限制空间经济计量学模型的应用。建立我国区域统计数据库,要求价格低廉且方便实用,是摆在统计工作者面前的一个重要课题。
【参考文献】
1Anselin,L.1988.SpatialEconometrics.MethodsandModels,DordrechtKluwerAcademic
Publishers.
2Anselin,L.andR.J.G.M.Floraxed.1995.NewDirectionsinSpatialEconometrics,Springer-Verlag.
3Brundson,C.,A.S.Fotheringham,andM.E.Chalton.1996."GeographicallyWeighted
Regression:AMethodforExploringSpatialNonstationarity,"GeographicalAnalysis,
Vol.28,p281-298.
4Brunsdon,C.,A.S.Fotheringham,andM.E.Chalton.1999."SomeNotesonParametric
SignificanceTestsforGeographicallyWeightedRegression,"JournalofRegional
Science,Vol.39,No.3,p497-524.
5Casetti,E.1972."GeneratingModelsbyExpansionMethod:ApplicationstoGeographic
Research,"GeographicalAnalysis,Vol.4,p81-91.
6Casetti,E.1982."DriftAnalysisofRegressionParameters:AnApplicationtothe
InvestigationofFertilityofFertilityDevelopmentRelations,"ModelingandSimulation
13,p961-966.
7Casetti,E.1992."BayesianRegressionandtheExpansionMetod,"Geographical
Analysis,Vol.24,p58-74.
8Cliff,A.D.andJ.K.Ord.1981.SpatialProcesses:ModelsandApplications,Pion.
9Haining,R.P.SpatialDataAnalysisintheSocialandEnvironmentalScience,Cambridge
UniversityPress.1990.
10Paelinck,JeanH.P.andLeoH.Klaassen.1979.SpatialEconometrics,SaxonHouse,
TeakfieldLtd.
11庄大方,张稳,罗建国.土地资源遥感调查中的空间信息多重采样框架设计与GIS实现,统计研究,1999年第1期.
一、R语言的特点及应用现状
R语言早期由新西兰奥克兰大学的RossIhaka和RobertGentleman开发,现在则由“R开发核心团队”负责开发。R语言免费的软件,可从R网站(http://r-pro-)及其分布于世界各地的镜像网站上自由下载,具有丰富的统计函数及强大的画图功能,而且用户还可以通过安装新的套件(Packages)进一步增强其功能。R语言的代码是公开的,用户既可以查看函数的源代码学习统计编程,也可以通过修改源代码实现新的功能。鉴于其强大的统计计算与图形展示功能,且完全免费和源代码开放的特点,其近年来发展迅速。目前,国外众多大学统计相关课程及笔者较为了解的动物科学专业相关课程都将R作为教学工具软件。然而,目前国内高校统计相关课程教学中统计软件的使用虽种类繁多,有SPSS,SAS,Matlab,Minitab,Stata,Origin,MSxcel等,据笔者了解将R软件运用于大学统计教学的案例还非常少。因此,如何将R软件应用于大学生物统计学教学还需更多的研究和探讨。
二、R语言的基本功能
R语言在统计描述、统计作图、统计分布及统计检验等方面丰富的函数为生物统计教学提供了便利的资源。这些函数可分类总结如下:统计描述:常用的统计描述函数有算术平均数mean,标准差sd,方差var,极差range,中位数median,和sum,最大值max,最小值min。同时,还可以用summary对不同类型数据进行简单统计描述,用table对多变量分类数据进行统计,用frequency对频数资料进行整理。统计作图:简单统计作图函数包括柱状图barplot、饼图pie、直方图hist、茎叶图stem、箱线图boxplot、散点图plot等图示方法;除此之外,还可以使用lattice程序包制作更为复杂的多变量、多数据集的组合图形,及3D图形。统计分布:在统计教学中统计分布是重要的一部分函数,R中常用的统计分布有正态分布normal,二项式分布binom,卡方分布chisq,指数分布exp,F分布f,泊松分布pois,t分布t,及均匀分布u-nif。将这些统计分布名称前面分别加上字母d、q和p即可获得这些统计分布的分布密度density,分位数quantile,概率函数probability。如dnorm(),即为正态分布密度函数。统计检验:R中常见的统计检验函数有t检验t.test,方差分析aov,卡方检验chisq.test,及相关检验cor.test。需要注意的是,在调用相关函数时,需提供正确的数据变量及参数选项。
三、生物统计教学实例分析
从而证明现代统计学的发展及其在社会政治经济生活中发挥作用越来越大的趋势,数理统计研究问题的理念及其方法已对统计学的发展产生重要的革命性影响
[关键词] 数理统计 工作 特点 地位
一、数理统计的主要特点
数理统计就是通过对随机现象有限次的观测或试验所得数据进行归纳,找出这有限数据的内在数量规律性,并据此对整体相应现象的数量规律性做出推断或判断的一门学科。
从数理统计的学科特征来看,数理统计是应用数学中最重要、最活跃的学科之一。由此可见!数理统计从学科划分来说,应属于数学学科,但是其重在应用!而不是纯数学理论或方法的研究,故其采用的方法也就重在归纳法,而不是数学的演绎法。
二、数理统计在统计学中的地位
1.数理统计在统计思想发展中的地位。统计作为一项社会实践活动,已有几千年的历史。“统而计之”,就是人们对统计的朴素认识。随着社会生产力的不断进步,当代的统计已不圄于“统而计之”的范畴。
(1)统计作为人们认识社会的最有力的武器之一,已广泛应用于社会、政治、经济、科技等众多领域,而每一个领域有其复杂多样性,若采用简单地“统”,即全面调查几乎是不可能的,但是全面地了解每一个领域的基本情况及不同领域之间的数量联系的规律性,又为现代社会管理所必需。数理统计研究问题的思路和方法,自然而然地为统计学所利用,即数理统计为现代统计学的发展点燃了解决复杂现实问题的科学思想火花――为用总体的部分去说明总体奠定了数理基础。
(2)20世纪30 年代以来,随着政府要有效地干预国民经济理念的形成,政府以社会经济生活直接参与者的身份出现,基于对全局数据的掌握,大大地推动了统计思想的发展,不仅投入了大量的资金对统计这支“武器”进行开发,更重要的是从立法的角度对统计行为进行规范。在当今许多国家的统计法规中,都明确地规定抽样调查在统计调查中的重要地位。比如,在我国1996 年5月经修改后颁布并实施的《中华人民共和国统计法》第二章第十条就明确规定:“统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,收集、整理基本统计资料”。而抽样调查的基本原理就基于数理统计的推断原理。可见,数理统计的推断理念在统计实践中的地位已用法律的形式确定下来。
(3)作为社会经济活动主体的企业单位,在世界经济全球化、区域经济一体化的发展背景下,不仅没有足够的资金、技术支持从事某一方面的全面调查,有时也没有必要通过全面调查以获得生产经营方面的全面数据资料,而抽样调查就足以提供相应可靠的数据作为企业生产经营决策的依据。这也说明数理统计有着微观的现实需要,为微观经济管理活动开辟了无限广阔的前景。在微观统计应用中有着坚实的思想根基。
(4)统计的理念,已不仅仅在于用历史数据描述历史的发展特征,而当代更强调通过对历史数据的收集、整理和分析,去预测未来,而这种预测的基础同样基于数理统计的原理。即从历史的时序数据中找出数据的内在数量规律性,以把握未来的走向,即数理统计的分析原理在时间序列数据预测中的作用,同样功不可没。
2.数理统计在统计方法中的地位。随着数理统计解决现实问题的理念在统计思想中地位的确立,数理统计在统计方法中的重要地位也相应地得以确立。
大数定律为数理统计应用于统计学搭起了连接的纽带。大量观察法是现代统计学的基本方法之一,而大数定律又是大量观察法的基础。统计学若没有大量观察法的支撑,则统计分析中的基本指标――平均数与相对数,则失去其应有的作用和意义,可见数理统计在统计方法中的基础地位不容置疑。
3.数理统计在统计内容中的地位。统计学是一门关于如何收集、整理和分析统计数据的一门方法论科学。不管数理统计对统计思想的发展有多大的影响,也不管数理统计在统计方法中居于何种地位,数理统计在统计学中的地位还是主要体现在统计分析中的地位。数理统计对数据的收集方法与整理方法的实际影响要比其对统计数据分析方法的影响小得多。也就是说,统计学作为一门方法论科学,其研究领域要比数理统计宽广得多。试图用数理统计取代统计学的观点显然是不正确的,同样试图用大统计学取代数理统计的观点也不正确,毕竟数理统计作为一门数学学科有其自身的不可替代的特点。因此,数理统计在统计内容中的地位,也只能主要体现在统计分析方面。
(1)统计数据收集方法的研究仍然是现代统计学的主要内容之一。正如前所述,在我国现阶段如何获得大量真实有效的统计数据,是我们所面临的迫切任务之一。不真实、不全面的统计数据,使国家的宏观管理"经济理论’经济模型和经济政策的统计检验,以及企业的生产经营预测、决策,都不能有效地进行。可见,“统计数据的质量是统计全部工作的生命”的观点的正确性。而数理统计在统计数据收集方面的影响仅体现在统计数据调查方式方法方面,即抽样调查如何组织实施的方式方法,在统计数据收集方法中得以突出和强调。
关键词:生物统计;R语言;软件教学;教学研讨
生命科学领域的学习和研究内容决定了生物统计学课程是此领域本科学生的必修课程。但与生命科学领域其他专业课程相比,生物统计学理论性强、内容抽象、计算公式繁多。生命科学专业学生由于受形象思维方式的影响,较难接受和理解生物统计学的抽象概念和逻辑推理。课堂调查显示学生在心理上对本课程产生一定的抵触情绪,学习兴趣不高,学习效果不好。随着近年来本科教育目标及培养方案的不断调整,作为专业基础课程的生物统计学教学课时不断被压缩。但与此同时,生物统计学领域的新概念和新方法不断出现,学生由于进一步深造和工作对生物统计学知识的需求也不断增加,我们也必须不断增加和调整生物统计课程的教学内容。教学内容的不断膨胀和发展需求与教学学时压缩之间的矛盾是摆在国内众多任课教师面前的现实问题。因此,在学生认知不足、学习积极性不高的情况下,如何在有限的教学学时内高质量地完成生物统计学课程的教学,为学生奠定一个坚实的试验设计和统计分析的基础,是摆在每位从事生物统计课程教学教师面前的巨大挑战。
不同于传统的生物统计学教学对统计理论的过多强调,现代生物统计学教学过程中需对计算机技术在统计计算中应用能力的培养给予足够的重视。鉴于现在大学生计算机操作能力普遍较好且有兴趣的特点,在生物统计学课程教学中引入计算机教学为该课程改革提供了契机。运用计算机教学需要选择一个合适的统计分析软件,与常用的Excel和SAS软件相比,R语言既是一款更适合在生命科学相关专业本科生教学中进行使用的统计分析软件。
一、R语言的特点及应用现状
R语言早期由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发,现在则由“R开发核心团队”负责开发。R语言免费的软件,可从R网站(http://)及其分布于世界各地的镜像网站上自由下载,具有丰富的统计函数及强大的画图功能,而且用户还可以通过安装新的套件(Packages)进一步增强其功能。R语言的代码是公开的,用户既可以查看函数的源代码学习统计编程,也可以通过修改源代码实现新的功能。鉴于其强大的统计计算与图形展示功能,且完全免费和源代码开放的特点,其近年来发展迅速。目前,国外众多大学统计相关课程及笔者较为了解的动物科学专业相关课程都将R作为教学工具软件。然而,目前国内高校统计相关课程教学中统计软件的使用虽种类繁多,有SPSS,SAS,Matlab,Minitab,Stata,Origin,MS xcel等,据笔者了解将R软件运用于大学统计教学的案例还非常少。因此,如何将R软件应用于大学生物统计学教学还需更多的研究和探讨。
二、R语言的基本功能
R语言在统计描述、统计作图、统计分布及统计检验等方面丰富的函数为生物统计教学提供了便利的资源。这些函数可分类总结如下:
统计描述:常用的统计描述函数有算术平均数mean,标准差sd,方差var,极差range,中位数median,和sum,最大值max,最小值min。同时,还可以用summary对不同类型数据进行简单统计描述,用table对多变量分类数据进行统计,用frequency对频数资料进行整理。统计作图:简单统计作图函数包括柱状图barplot、饼图pie、直方图hist、茎叶图stem、箱线图boxplot、散点图plot等图示方法;除此之外,还可以使用lattice程序包制作更为复杂的多变量、多数据集的组合图形,及3D图形。统计分布:在统计教学中统计分布是重要的一部分函数,R中常用的统计分布有正态分布normal,二项式分布binom,卡方分布chisq,指数分布exp,F分布f,泊松分布pois,t分布t,及均匀分布unif。将这些统计分布名称前面分别加上字母d、q和p即可获得这些统计分布的分布密度density,分位数quantile,概率函数probability。如dnorm(),即为正态分布密度函数。统计检验:R中常见的统计检验函数有t检验t.test,方差分析aov,卡方检验chisq.test,及相关检验cor.test。需要注意的是,在调用相关函数时,需提供正确的数据变量及参数选项。
三、生物统计教学实例分析
生物统计学的教学内容包括很多理论内容,例如各种统计分布、种统计检验的原理等。这些内容往往比较抽象,以口头讲解的方式通常难以在有限的时间内高效地传递这些信息,学生接受程度较低,教学效果不理想。生物统计学课程中讲解标准误时涉及到的“样本平均数的抽样分布”即是一个较为抽象的概念。此时可以使用R语言的数据模拟及图形演示功能演示样本平均数的生成过程及其分布。具体实现过程如下:(1)设定包括群体大小、样本大小、抽样次数、总体均数、总体方差等群体参数,使用rnorm()函数模拟生成服从正态分布的群体数据。(2)使用hist()函数作总体频数分布图。(3)用sample()函数对总体进行抽样,计算并记录样本均数,使用plot()函数和point()函数演示抽样过程及样本平均数。(4)使用hist()函数制作样本平均数的抽样分布频数图,使用sd(),mean()等函数统计输出样本平均数的抽样分布。