美章网 精品范文 统计学抽样方法范文

统计学抽样方法范文

前言:我们精心挑选了数篇优质统计学抽样方法文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

统计学抽样方法

第1篇

关键词:高中数学;数学统计学;现代经济

统计学是发现社会数量关系的一项重要数学工具,不管是对现代经济的发展还是对高中数学的学习都要依靠通过统计学计算出科学的信息数据。统计学在现代经济发展中涉及到许多方面:预测、评估、分类等相关领域。同时,在现代经济的发展中,也对统计方法、统计分析提出了相关要求。不管是为了自身提高学习成绩,还是为了促进现代经济的发展,高中阶段的统计学学习尤为重要[1]。

一、统计学对现代经济发展的益处

高中统计学对现代经济的益处主要体现在以下几个点:第一,解决经济学问题,高中数学统计学对现代经济发展其至关重要的作用,对于一些实际经济问题通过建立数学模型、运用高中数学统计方法、分析计算、最后得出结论。这些结论不仅可以预测现代经济的未来走向,还可以为相应的经济类工程项目提供参考。在现代经济发展中统计学的应用及其广泛,人们对于经济活动的评估方式也由定性向定量转变。高中数学统计学的应用,可以使現代经济科学化、合理化。应用高中数学统计学可以让经济的风险控制在一个合理范围内。

二、高中数学统计学的应用

统计学是高中数学必修课。通过对高中数学统计学的学习,可以让高中生的数学逻辑思维更加敏捷,思考问题的方式更加严谨,让学生达到全面发展。一方面,通过统计学的学习,为高中生未来的工作、生活提供了诸多便利;另一方面,可为日后的现代经济发展做出贡献。高中数学统计学的应用,可以通过以下两个方法来进行。

(一)抽样

抽样法由系统抽样、分层抽样等方面构成。系统抽样,在抽样的过程中,需要将总体分成若干部分,从每一小部分中进行抽取。例如,某学校要了解高中生的身高状况,依据1∶20的比例抽取样本,把高中生看作一个整体,依据1∶20的比例抽取样本,则要将所有高中生按整体分为20个部分,这样的分法符合系统抽样的应用条件,进而使用系统抽样法来解决生活中在校调查学生身高的问题。分层抽样,例如,某学校高一学生总数500人,高二学生人数总计400人,高三学生人数总350人,要调查3个年级学生对学校规章制度的看法,依据1∶9的比例抽取样本,这些学生是3个不同的年级,可划分为3个部分,依据既定比例抽取,各年级学生对应抽取的人数也会不同,这问题要求与分层抽样法的理念基本一致,因而对于这类问题要用分层抽样的方法来解决。

(二)样本估计

样本估计是统计学中最常见的,对样本估计的学习最主要的是提高对样本数量的认识,样本数量与估计值准确率相互关联,即样本数量越多,则估计值越准确。例如:某一整体可划分为60个个体,将各个个体进行1~60的编号,同时将它们划分为6个小组,组号分别为1~6,如果运用系统抽样抽取容量为6的样本,首次抽取个体号码为A,在第B次抽取时,个体号码个位数与A+B个位相一致,请问若A=3时,第5组号码为多少?经分析可得出,在A=3时,第B次抽取的个体号码个位数为A+B,由此表明第5组号码的个位数为3,再结合样本估计知识,便可得出具体的号码数字。由此可见,利用统计学解决生活中的实际问题无处不在,只有牢记相关的概念、方法,才能准确无误地解决问题。

第2篇

关键词:大数据;统计学;数据分析;抽样理论;理论

重构随着信息科学技术的高速度发展,当代获取和储存数据信息的能力不断增强而成本不断下降,这为大数据的应用提供了必要的技术环境和可能.应用大数据技术的优势愈来愈明显,它的应用能够帮助人类获取真正有价值的数据信息.近年来,专家学者有关大数据技术问题进行了大量的研究工作[1],很多领域也都受到了大数据分析的影响.这个时代将大数据称为未来的石油,它必将对这个时代和未来的社会经济以及科学技术的发展产生深远的意义和影响.目前对于大数据概念,主要是从数据来源和数据的处理工具与处理难度方面考虑,但国内外专家学者各有各的观点,并没有给出一致的精确定义.麦肯锡全球数据分析研究所指出大数据是数据集的大小超越了典型数据库工具集合、存储、管理和分析能力的数据集,大数据被Gartner定义为极端信息管理和处理一个或多个维度的传统信息技术问题[23].目前得到专家们认可的一种观点,即:“超大规模”是GB级数据,“海量”是TB级数据,而“大数据”是PB及其以上级别数据[2].

一些研究学者把大数据特征进行概括,称其具有数据规模巨大、类型多样、可利用价值密度低和处理速度快等特征,同时特别强调大数据区别于其他概念的最重要特征是快速动态变化的数据和形成流式数据.大数据技术发展所面临的问题是数据存储、数据处理和数据分析、数据显示和数据安全等.大数据的数据量大、多样性、复杂性及实时性等特点,使得数据存储环境有了很大变化[45],而大部分传统的统计方法只适合分析单个计算机存储的数据,这些问题无疑增加了数据处理和整合的困难.数据分析是大数据处理的核心过程,同时它也给传统统计学带来了巨大的挑战[6].产生大数据的数据源通常情况下具有高速度性和实时性,所以要求数据处理和分析系统也要有快速度和实时性特点,而传统统计分析方法通常不具备快速和实时等特点.基于大数据的特点,传统的数据统计理论已经不能适应大数据分析与研究的范畴,传统统计学面临着巨大的机遇与挑战,然而为了适应大数据这一新的研究对象,传统统计学必须进行改进,以继续和更好的服务于人类.目前国内外将大数据和统计学相结合的研究文献并不多.本文对大数据时代这一特定环境背景,统计学的抽样理论和总体理论的存在价值、统计方法的重构及统计结果的评价标准的重建等问题进行分析与研究.

1传统意义下的统计学

广泛的统计学包括三个类型的统计方法:①处理大量随机现象的统计方法,比如概率论与数理统计方法.②处理非随机非概率的描述统计方法,如指数编制、社会调查等方法.③处理和特定学科相关联的特殊方法,如经济统计方法、环境科学统计方法等[7].受收集、处理数据的工具和能力的限制,人们几乎不可能收集到全部的数据信息,因此传统的统计学理论和方法基本上都是在样本上进行的.或者即使能够得到所有数据,但从实际角度出发,因所需成本过大,也会放弃搜集全部数据.然而,选择最佳的抽样方法和统计分析方法,也只能最大程度还原总体一个特定方面或某些方面的特征.事实上我们所察觉到的数据特征也只是总体大量特征中的一小部分,更多的其他特征尚待发掘.总之,传统统计学是建立在抽样理论基础上,以点带面的统计分析方法,强调因果关系的统计分析结果,推断所测对象的总体本质的一门科学,是通过搜集、整理和分析研究数据从而探索数据内部存在规律的一门科学.

2统计学是大数据分析的核心

数的产生基于三个要素,分别是数、量和计量单位.在用数来表示事物的特征并采用了科学的计量单位后,就产生了真正意义上的数据,即有根据的数.科学数据是基于科学设计,通过使用观察和测量获得的数据,认知自然现象和社会现象的变化规律,或者用来检验已经存在的理论假设,由此得到了具有实际意义和理论意义的数据.从数据中获得科学数据的理论,即统计学理论.科学数据是通过统计学理论获得的,而统计学理论是为获得科学数据而产生的一门科学.若说数据是传达事物特征的精确语言,进行科学研究的必备条件,认知世界的重要工具,那么大数据分析就是让数据最大限度地发挥功能,充分表达并有效满足不同需求的基本要求.基于统计学的发展史及在数据分析中的作用,完成将数据转化为知识、挖掘数据内在规律、通过数据发现并解决实际问题、预测可能发生的结果等是研究大数据的任务,而这必然离不开统计学.以大数据为研究对象,通过数据挖掘、提取、分析等手段探索现象内在本质的数据科学必须在继承或改进统计学理论的基础上产生.

统计数据的发展变化经历了一系列过程,从只能收集到少量的数据到尽量多地收集数据,到科学利用样本数据,再到综合利用各类数据,以至于发展到今天的选择使用大数据的过程.而统计分析为了适应数据可观察集的不断增大,也经历了相应的各个不同阶段,产生了统计分组法、大量观察法、归纳推断法、综合指标法、模型方程法和数据挖掘法等分析方法,并且借助计算机以及其他软件的程度也越来越深.300多年来,随着数据量以指数速度的不断增长,统计学围绕如何搜集、整理和分析数据而展开,合理构建了应用方法体系,帮助各个学科解决了许多复杂问题.现在进入了大数据时代,统计学依旧是数据分析的灵魂,大数据分析是数据科学赋予统计学的新任务.对于统计学而言,来自新时代的数据科学挑战有可能促使新思想、新方法和新技术产生,这一挑战也意味着对于统计学理论将面临巨大的机遇.

3统计学在大数据时代下必须改革

传统统计学是通过对总体进行抽样来搜索数据,对样本数据进行整理、分析、描述等,从而推断所测对象的总体本质,甚至预测总体未来的一门综合性学科.从研究对象到统计结果的评判标准都是离不开样本的抽取,完全不能适应大数据的4V特点,所以统计学为适应大数据技术的发展,必须进行改革.从学科发展角度出发,大数据对海量数据进行存储、整合、处理和分析,可以看成是一种新的数据分析方法.数据关系的内在本质决定了大数据和统计学之间必然存在联系,大数据对统计学的发展提出了挑战,体现在大样本标准的调整、样本选取标准和形式的重新确定、统计软件有待升级和开发及实质性统计方法的大数据化.但是也提供了一个机遇,体现在统计质量的提高、统计成本的下降、统计学作用领域的扩大、统计学科体系的延伸以及统计学家地位的提升[7].

3.1大数据时代抽样和总体理论存在价值

传统统计学中的样本数据来自总体,而总体是客观存在的全体,可以通过观测到的或经过抽样而得到的数据来认知总体.但是在大数据时代,不再是随机样本,而是全部的数据,还需要假定一个看不见摸不着的总体吗?如果将大数据看成一个高维度的大样本集合,针对样本大的问题,按照传统统计学的方法,可以采用抽样的方法来减少样本容量,并且可以达到需要的精度;对于维度高的问题,可以采取对变量进行选择、降维、压缩、分解等方法来降低数据的复杂程度.但实际上很难做得到,大数据涵盖多学科领域、多源、混合的数据,各学科之间的数据融合,学科边界模糊,各范畴的数据集互相重叠,合成一体,而且大数据涉及到各种数据类型.因此想要通过抽样而使数据量达到传统统计学的统计分析能力范围是一件相当困难或是一件不可能的事.大量的结构数据和非结构数据交织在一起,系统首先要认清哪个是有价值的信息,哪个是噪声,以及哪些不同类型的数据信息来自于同一个地址的数据源,等等,传统的统计学是无法做到的.在大数据时代下,是否需要打破传统意义的抽样理论、总体及样本等概念和关系,是假设“样本=总体”,还是“样本趋近于总体”,还是不再使用总体和样本这两个概念,而重新定义一个更合适的概念,等等.人们该怎样“安排”抽样、总体及样本等理论,或人们该怎样修正抽样、总体、样本的“公理化”定义,这个问题是大数据时代下,传统统计学面临改进的首要问题.

3.2统计方法在大数据时代下的重构问题

在大数据时代下,传统的高维度表达、结构描述和群体行为分析方法已经不能精确表达大数据在异构性、交互性、时效性、突发性等方面的特点,传统的“假设-模型-检验”的统计方法受到了质疑,而且从“数据”到“数据”的统计模式还没有真正建立,急切需要一个新的理论体系来指引,从而建立新的分析模型.去除数据噪声、筛选有价值的数据、整合不同类型的数据、快速对数据做出分析并得出分析结果等一系列问题都有待于研究.大数据分析涉及到三个维度,即时间维度、空间维度和数据本身的维度,怎样才能全面、深入地分析大数据的复杂性与特性,掌握大数据的不确定性,构建高效的大数据计算模型,变成了大数据分析的突破口.科学数据的演变是一个从简单到复杂的各种形式不断丰富、相互包容的过程,是一个循序渐进的过程,而不是简单的由一种形式取代另一种形式.研究科学数据的统计学理论也是一样,也是由简单到复杂的各种形式相互包容、不断丰富的发展过程,而绝不是完全否定一种理论、由另一种理论形式所代替.大数据时代的到来统计学理论必须要进行不断的完善和发展,以适应呈指数增长的数据量的大数据分析的需要.

3.3如何构建大数据时代下统计结果的评价标准框架

大数据时代下,统计分析评价的标准又该如何变化?传统统计分析的评价标准有两个方面,一是可靠性评价,二是有效性评价,然而这两种评价标准都因抽样而生.可靠性评价是指用样本去推断总体有多大的把握程度,一般用概率来衡量.可靠性评价有时表现为置信水平,有时表现为显著性水平[8].怎么确定显著性水平一直是个存在争议的问题,特别是在模型拟合度评价和假设检验中,因为各自参照的分布类型不一样,其统计量就不一样,显著性评价的临界值也就不一样,可是临界值又与显著性水平的高低直接相关.而大数据在一定程度上是全体数据,因此不存在以样本推断总体的问题,那么在这种情况下,置信水平、可靠性问题怎么确定?依据是什么?有效性评价指的是真实性,即为误差的大小,它与准确性、精确性有关.通常准确性是指观察值与真实值的吻合程度,一般是无法衡量的,而精确性用抽样分布的标准差来衡量.显然,精确性是针对样本数据而言的,也就是说样本数据有精确性问题,同时也有准确性问题.抽样误差和非抽样误差都可能存在于样本数据中,抽样误差可以计算和控制,但是非抽样误差只能通过各种方式加以识别或判断[910].大多数情况下,对于样本量不是太大的样本,非抽样误差可以得到较好的防范,然而对于大数据的全体数据而言,没有抽样误差问题,只有非抽样误差问题,也就是说大数据的真实性只表现为准确性.但是由于大数据特有的种种特性,使得大数据的非抽样误差很难进行防范、控制,也很难对其进行准确性评价.总之,对于大数据分析来说,有些统计分析理论是否还有意义,确切说有哪些统计学中的理论可以适用于大数据分析,而哪些统计学中的理论需要改进,哪些统计学中的理论已不再适用于大数据统计研究,等等,都有待于研究.所以大数据时代的统计学必是在继承中求改进,改进中求发展,重构适应大数据时代的新统计学理论.

4结论

来自于社会各种数据源的数据量呈指数增长,大数据对社会发展的推动力呈指数效应,大数据已是生命活动的主要承载者.一个新事物的出现,必然导致传统观念和传统技术的变革.对传统统计学来说,大数据时代的到来无疑是一个挑战,虽然传统统计学必须做出改变,但是占据主导地位的依然会是统计学,它会引领人类合理分析利用大数据资源.大数据给统计学带来了机遇和挑战,统计学家们应该积极学习新事物,适应新环境,努力为大数据时代创造出新的统计方法,扩大统计学的应用范围.

参考文献:

[1]陈冬玲,曾文.频繁模式挖掘中基于CFP的应用模型[J]沈阳大学学报(自然科学版),2015,27(4):296300.

[3]卞友江.“大数据”概念考辨[J].新闻研究导刊,2013,35(5):2528.

[5]靳小龙,王元卓,程学旗.大数据的研究体系与现状[J].信息通信技术,2013(6):3543.

[6]覃雄派,王会举,杜小勇,等.大数据分析:Rdbms与Mapreduce的竞争与共生[J].软件学报,2012,23(1):32-45.

[7]游士兵,张佩,姚雪梅.大数据对统计学的挑战和机遇[J].珞珈管理评论,2013(2):165171.

[8]李金昌.大数据与统计新思维[J].统计研究,2014,31(1):1017.

第3篇

一、国内文献综述

笔者通过对一些高校统计学课程调查及知网搜集资料,发现很多讲授统计学的教师认为传统统计学教学内容、方法很难适应现代社会的需求。通过资料搜集和文献查找,如何更好的编排统计的教学内容和运用更好的教学方法主要体现在以下几方面:石秀丽(2011)学者认为根据经管类学生的特点应把统计方法、数量分析作为教学内容的重点,李慧敏(2016)等学者认为对经管类统计学的教学应激发学生的学习兴趣,大量的引入现实生活中的典型案例进行教学;宋继华(2013)等学者认为采用项目驱动方法教学能引导学生的思维,从而提高学生的积极性和应用能力。这些专家学者对统计学的教学内容都提出了创新性的研究,尤其是高职高专对经管类学生的统计学教学很多高校都采用了项目驱动的模式。

二、教学内容和教学方法创新

我国经济快速发展,很多决策都需要数据来支撑,统计方法及数据分析应用越来越广泛,并应用于管理、金融等领域,而今天又处于大数据时代,因此,掌握统计方法和数量分析的专业人才成为时下的新宠。所以,在经管类统计学教学中,我们必须大刀阔斧地改革传统统计学的教学内容、教学方法成为高校经管类统计学改革的重要课题。

1.教学内容编排上增加统计实务部分。统计学原理的内容主要包括总论、统计调查、统计整理、综合指标、动态数列分析、指数分析、抽样推断、相关分析等内容,这些内容主要是基本理论知识,针对当前社会需求和统计变化的特点,应该加大统计实务部分的内容,可以适当增加企业统计标准(常用统计标准)、主要统计指标(采购经理指数、消费信心指数等)、企业主要统计报表(生产活动统计)、国民经济核算体系、统计报告撰写(统计报告写作要求、原则、流程)等内容。

2.教学过程中引入实验教学。统计学教学过程中运用到大量的公式,主要是定量的分析,在传统教学中比较侧重这些公式的推导、计算。但在信息技术高速发达的今天,计算机统计软件的广泛应用,使计算变得更加简单、准确。因此,在统计教学过程中,统计计算技术已经不是教学的重点。由于大量复杂的计算可以交给计算机去完成,统计学教学应从数据技巧教学转向数据整理分析的训练,统计教学中适当增加实验教学,把统计方法与计算机的应用紧密结合,实现统计学教材的内容与EXCEL的应用全面结合。在一些章节可以专门增加一节内容,介绍如何用EXCEL实现本章数据处理问题,例如:在讲解统计整理、总量指标与相对指标、动态数列、统计指数、抽样调查、相关和回归分析时都可以借助于EXCEL来进行数据处理、分析。还可以利用计算机SPSS软件对回归分析和相关分析进行分析,利用计算机对平均数和标准差中等内容进行处理。通过实验教学可以在一定程度上改变学生统计思想,同时帮助其掌握一定的软件应用技能,如EXCEL、SPSS、SAS等。

3.引入综合案例教学法。案例教学在国外课程教学中运用较多,因为案例来源于生活,更能引起学生的学习兴趣,在传统统计学教学中也引入了一些案例,但这些案例大都是孤立的只是为了学习某个知识点而设定,这些案例并不是真实的案例,而且缺乏前后因果,与实际生活脱钩,学生学起来就没有深刻的记忆和兴趣。针对这种情况,在统计学课程教学中可以引入现实生活中实际发生的案例,将统计计算方法与数据分析方法用到解决实际管理问题中去,这样可以使教学效果事半功倍。例如:在综合指标这部分内容就可以设定某个企业的实际案例,通过这个案例可以解决总量指标、相对指标和平均指标的计算应用。

4.图表归纳教学法。统计学第一章内容是学习整个统计学的基础,只有把统计学的一些基本概念学懂了,才能更好的学习以后的内容,可是很多学生学了第一章以后对这些概念之间的关系还是模糊,为了解决这些问题设疑解惑,不断启疑思导,经过苦心孤诣,可以把这些基本概念编成如图1。

通过框图,可以把这些抽象的名称联系在一起,然后层次加以剖析,提纲挈领地板书这些名词的特点与作用,用形象生动的比喻语言说明各概念之间的联系和异同。采用这样直观清晰的框图教学,让学生一目了然,分析清楚这些概念之间的区别与联系,便于学生的理解与记忆。在讲完第四、五、六章后也总结归纳如图2。

第4篇

关键词:社会经济统计学;数据;教学

社会经济统计学是高校经济管理专业的必修课之一,在经管类的专业课中属于教学难度较大的一门。不少学生反映统计学课程枯燥、难学、不实用,即使在考试中能够通过,在现实中也不知如何加以应用。改变这种状况的一个根本出发点,在于回归社会经济统计学课程的原始目的,以数据导向的原则对课程进行全面改革。

一、目前社会经济统计学教学中存在的主要问题

在过去,我国统计学界一直将社会经济统计学与数理统计学划分为两个性质不同的学派,将社会经济统计学完全限制于描述统计范畴,从而影响了社会经济统计学的应用。近年来,随着经济管理研究中数学模型的应用日益增加,统计学界又出现了一种矫枉过正的倾向,即过分偏向数理统计学,否认社会经济统计学的独立性。近年出版的各种统计学教材中,数理统计的内容所占比重不断增加,甚至到了满书都是数学公式的程度。

目前的社会经济统计学课程由于过分偏向数理统计,在教学中仍以统计公式推导为主。许多统计学教师都是数学专业出身,对于严谨的数学逻辑框架情有独钟,但其面对的教学对象却属于带有明显文科性质的经管类专业学生,没有能力也没有兴趣去追求数学公式的完美。这就造成了教与学之间的矛盾。

社会经济现象与自然科学现象有着本质的不同,一个重要的特点就是研究对象是人的活动,许多活动是很难用精确的数学逻辑来理解的。在自然科学研究中,通过严格控制实验过程,可以使数据表现出稳定的行为特征,与特定的研究模型相吻合。而在社会经济研究中,研究对象是不受约束的个人或者企业,其行为受到各种因素的影响,有时候会表现得十分异常。

以回归分析为例,在数理统计学的教学中,学生拿到的教学习题数据都是性质良好的,回归结果往往表现出较强的统计显著性。但在真实的经济分析中,一次回归能够得到显著系数是非常难得的,由于现实中“噪声”的影响,大多数回归模型都无法通过统计检验。例如,从理论上说,居民的收入与支出之间应当存在着线性或者二次曲线型的相关关系,但学生在利用真实的统计数据进行分析时,往往很难得出这样的结论。一些数理统计成绩很好的学生在使用统计数据撰写论文时,经常会陷入一种困惑,即发现现实中的数据特征与自己所学的理论完全不能吻合。

鉴于这样的问题,在社会经济统计学教学中,应当将更多的精力用于帮助学生形成认识和理解数据的能力,要教育学生适应各种“不完美”的数据,学会从数据中剔除“噪声”的影响,发现数据的本质。教学实践表明,这样的教学改革思路不但能够使课程更加适应现实需要,而且能够极大地调动学生的学习兴趣。

二、数据导向的统计学教学思路

数据导向在统计学教学中主要表现在以下三个方面:

1.注重培养学生对于数据质量的认识

数据质量是进行统计分析之前必须考虑的一个重要问题,由于各种人为因素的干扰,社会经济统计数据往往存在着不同程度的质量问题。在教学中,应当注重培养学生对调查数据质量的认识能力。

调查是所有统计工作的起点,调查数据的质量直接影响到统计分析的效果。人们在日常所接触到的统计数据,都是通过各种渠道调查得来的,如果学生不了解调查的原理,就很难理解数据中各种错误的产生原因。在许多社会经济统计学教材中,统计调查所占的比重都很小,有些甚至直接与“抽样估计”的内容合并在一起,把抽样误差分析作为统计调查的惟一内容。事实上,统计调查所涉及的内容是非常广泛的,抽样误差只是其中很小的一个方面。把统计调查理解为仅仅是抽样误差计算,是一个极大的误区。

基于这种考虑,应当大幅度提高统计调查内容在课程中所占的比重,使之达到全部课时数的1/3左右。教学内容应当包括统计调查的分类、各种抽样调查形式的优缺点、调查误差的来源等等,其核心在于使学生理解影响原始数据质量的各种因素。

在有关抽样调查的内容中,如何确保抽样的随机性是一项重要的内容,对这项内容的深入讨论,能够帮助学生理解随机性对于统计工作的意义,以及在现实中各种可能出现的违背随机性要求的情况。

调查中的非抽样误差是统计学研究的前沿,在传统的统计学教材中往往很少涉及,但这部分内容对于学生理解调查误差的来源有着重要的作用,因此在教学中也应当进行介绍。例如,目前许多媒体都喜欢引用网上调查的数据来分析社会经济现象,但从统计学角度来看,网上调查的抽样框是存在偏差的,其调查结果不能真实地反映全体居民的意见。要认识到这一点,就需要学生对于抽样框的概念、抽样框误差的形式等有一定的认识。对这部分内容进行讲授时,需要教师有一定的社会经济调查实践经验,能够结合现实情况来加以分析。这部分内容如果讲授得当,对于学生来说是很有趣味的。

在条件允许的情况下,教师还可以组织学生参与统计调查的社会实践,通过亲手做几份调查问卷来加深对于统计数据质量的理解。

2.以真实数据替代虚拟的教学数据

传统的统计学教学,侧重于对方法的介绍。教学中使用的数据往往是虚拟数据,或者是经过精选和剪切后的真实数据,这类数据的惟一作用就是让学生练习在课堂中学习到的公式。学生只需要把数据代入公式,就能够得到一个近乎完美的计算结果。这种学习方式带来的一个负面影响是学生误以为统计就是一门利用公式进行计算的科学,而忽略了根据不同数据选择不同计算方法的要求。

采用数据导向的教学方法,要求在教学中抛弃虚构的教学数据,而使用现实中的真实数据作为教学案例。教师对于选择的数据提交给学生,让学生根据所学的各种统计知识进行自主分析。教师应当向学生传递一种权变的统计观念,鼓励学生用不同的方法对同一批数据进行反复处理,从中选择最有效的处理方法。当学生拘泥于某一种习惯的分析方法时,教师应当提示他们思考为什么优先采用了这种方法,而没有采用另一种方法。比如,许多学生在进行综合评价时,习惯选择使用算术平均数,此时,教师可以组织他们讨论是否能够使用几何平均数或者中位数等其他的平均指标。

在教学中,我们曾向学生提供了美国从1900年以来的所有统计年鉴的电子文件,要求学生从中选择出一些有价值的指标,分析美国的经济成长情况、劳动力变化情况等等。由于数据量非常庞大,学生可以选择出许多不同的角度来进行分析,包括横向的州与州的比较,纵向的年度间比较,不同指标间的相互比较等等。每一种分析方法都需要学生深入理解课堂中学习到的各种原理,通过这样的数据分析实践,学生既能够更好地理解统计的精髓,又能够产生浓厚的学习兴趣。

3.借助实验方法解释统计概念

数理统计学的教学侧重于公式的推导,而社会经济统计学则要求让学生更多地理解概念的含义。在教学实践中发现,经管专业学生对于统计分布、参数估计这样的概念往往很难理解,例如在讲授抽样估计的内容时,许多学生无法理解“样本平均数的标准差”这样一个概念,因为在他们的心目中,样本平均数是一次调查中获得的常量,对一个常量计算标准差是很难想象的。尽管教师可以完美地推导出样本平均数标准差的计算公式,但对于学生来说,这只是一个数学游戏,没有任何现实意义。

统计本身是一门来自于实验的科学,数理统计最早起源于对赌场中各种胜率的计算。要帮助学生形成对推断统计概念的理解,就应当从实验出发,通过可触及的数据来理解概率、分布等抽象概念。

第5篇

一、统计及其基本思想与方法

1 什么是统计学

问:一般认为,统计学这个词来源于拉丁语的国情学,原是国家管理人员感兴趣的事情。《大不列颠百科全书》对统计学下的定义是:“统计学是关于收集和分析数据的科学和艺术。”陈希孺院士认为:“统计学是有关收集和分析带有随机性误差的数据的科学和艺术。”

史宁中教授,作为统计学家,您是如何认识统计学的?

史教授:我们先来简单地回顾统计学的历史是有益处的。正如拉丁语所说,统计原本就是收集和分析国家管理中需要的各种数据,比如国民收入、各种税收。为了直观,人们才发明了各种报表、直方图、扇形图,等等。可以看到,这种传统意义上的统计学现在仍然是非常重要的,这也是我们现在小学统计教学中的主要内容之一。后来到了14世纪左右,随着航海业在欧洲兴起,航海保险业开始出现。为了合理地确定保险金与赔偿金,需要了解不同季节、不同路线航海出现事故的可能性大小,需要收集相关的数据,根据数据进行分析和判断,这被称为近代统计学的发端。到了19世纪末20世纪初,人们把数学、特别是概率论的有关知识引入到统计学,构建了统计学的基础。与古典统计学相比,虽然二者都是对数据的收集和分析,但却有本质的不同,因为后者进行分析的基础是“不确定性”,我们称之为“随机”。

到了现代,人们发现,对于大量数据的分析,采用随机的方法不仅方便而且准确。比如,对于国民收入,我们可以动用大量的人力来收集数据,但是谁都知道这样的数据不可能是准确的,远不如我们依据某种原则规划分出地区和人群,然后抽样、加权求和准确。再比如,对于股票市场,一天交易之后,可以得到精确的交易总量,但是人们宁可用部分核心企业的股票交易量来反映股票的变化,这便是“恒生指数”“上证指数”,等等。特别是到了2l世纪,银行、保险、电信,以及材料科学、基因组学等新兴学科的实验中涉及大量数据,其分析更需要借助随机方法了。我想,大概就是因为这些原因,国家才决定在现在中小学数学的教学中加入统计学的内容。

因此,你们谈到的关于统计学的定义都是可以的。但是,要把握统计学的根本思想方法却是非常困难的。

问:那么,您认为统计学的基本思想方法是什么呢?

史教授:这是一个不容易回答的问题。对于统计学的掌握很大程度上依赖于感悟,需要比较长的时间的理解与实践。我们先来回顾一下中小学传统数学的教学内容。这些内容主要是对日常生活中见到的图形和数量的抽象,研究的问题是图形的变化和计算法则,研究的基础是定义和假设,研究的方法主要是归纳、递归、类比和演绎推理。

统计学则不同。如我上面谈到的,统计学是通过数据来进行分析和推断的。因此,统计研究的基础是数据。这些数据的特点是,对于每一个数据而言,都具有不确定性,我们需要抽取一定数量的数据,才能从中获取信息。因此,统计学的研究依赖于对数的感悟,甚至是对一堆看似杂乱无章的数的感悟。通过对数据的归纳整理、分析判断,可以发现其中隐藏的规律。因为可以用各种方法对数据进行归纳整理、分析判断,所以,得到的结论也可能是不同的。而且,我们很难说哪一种方法是对的,哪一种方法是错的,我们只能说,能够更客观地反映实际背景的方法要更好一些。比如,我们希望知道某公司员工的收入情况,可以用平均数也可以用中位数,很难说哪个方法错。事实上,如果收入比较均衡,用平均数要好一些;如果收入比较极端,用中位数要好一些。当然,最好的方法是对收入。情况进行分类,但是分类的方法又有好坏之分。我们可以看到,统计学关心更多的是好与不好,而中小学传统数学关心更多的是对与错。

因此,统计学的基本思路是,根据所关心的问题寻求最好的方法,对数据进行分析和判断,得到必要的信息去解释实际背景。

2 统计学的研究对象

问:我们对于统计学有了一定的了解。从您的谈话中我们感觉到,统计学似乎是包罗―万象的。那么,统计学到底是研究什么呢?

史教授:是这样的,统计学的应用面非常广,凡是涉及数据分析的都可以成为统计学的研究领域。特别是到了近代,人们希望更加精细地了解实际背景,更多地借助数据分析,甚至人文科学也是如此,并且逐渐形成了专业的研究领域,比如计量经济学、计量社会学、计量教育学、计量心理学,等等。这些研究领域分析方法的基础大体是统计学。统计学并不研究某一个领域的具体内容,在本质上只是研究数据分析的方法,这包括创新的方法,也包括分析方法的好坏、分析方法的适用条件。

问:您能否结合中小学统计的内容谈得更具体一些?特别是在统计教学过程中,应当把握的基本原则是什么呢?

史教授:可以在统计研究中首先遇到的问题是如何获取“好”的数据。所谓“好”的数据,是指那些能够更加客观地反映实际背景的数据,而要获取好的数据要依赖于“好”的方法。根据数据的不同,方法主要分两大类,一是通过调查收集数据,二是通过实验制造数据-中小学统计教学中涉及的主要是前者,称为抽样调查(而后者通常被称为实验设计)_抽样调查又包含两个方面,一个是对已经存在的数据的收集,称之为抽样,比如市场的物价、学生的身高、企业的产值,等等;另一个是需要我们了解才能够获取的,称之为调查,比如美国总统的民意支持率、人们日常消费的主要项目、中小学生喜欢的歌手,等等。

根据问题的不同,所要采用的方法也可能不同,但是要建立两个基本原则。第一个基本原则是,采用能够获取好的数据的方法。为了获取好的数据,我们需要尽可能多地利用对于实际背景已有的先验知识。比如,希望知道学生的身高,先验知识是“年龄之间差别很大”。因此,最好是根据年龄段学生数的多少按比例抽取样本,我们称这种方法为分层抽样。可以看到,统计方法的直观想法是很明显的。如果对于实际背景一无所知,那么一定要抽取样本,这便是随机抽样。比如,希望知道学生喜欢的歌手,因为这些学生年龄之间差别可能不大,就可以采取随机抽样。当然也可以用分层抽样,但要麻烦得多。第二个基本原则是,采用简单的方法。能够基于上述两个原则的方法就是一个好方法。我们不要小看第二个原则,一个好的方法往往能够节省很多调查经费。这就是为什么咨询公司非常欢迎统计学家的原因。

问:刚才您提到了样本,许多教师对样本这个概念总是感到费解。

史教授:是的,这个概念很难把握。样本实质上就是数据,但是,统计学中涉及的数据往往是随机性的。还是

回到“学生的身高”这个问题上来。在抽样之前。我们可能并不知道具体数据的大小,这些数据对于我们是随机的。为了讨论出一个好的方法,我们假想能够得到这些数据,并且假想这些数据的出现是依据某种规律的,这种规律就是数据出现的可能性在小,我们称之为概率。比如,高年级学生出现大数据(高个子)的可能性要大于低年级学生,就是说,出现大数据的概率要大。但是,只有当抽样之后我们才能得到真实的数据;才能进行实质的计算与分析。这样,我们所要研究的数据既具有随机性又具有真实性。为了方便起见,我们称这样的数据为样本。

问:根据您的阐述,统计学怎么有一些哲学式的思考呢?

史教授:你们理解到了根本。这是统计学与中小学传统数学的最大区别。传统数学可以根据假设和规定的原则进行计算或者推理,但是统计学往往要问你所采用的方法是不是有道理,是不是还有更为合理的方法。不过,传统数学是统计学不可缺少的工具。

问:是不是因为统计学需要计算呢?

史教授:不仅仅如此,判断统计方法的好坏也是依赖传统数学的。

第6篇

【关键词】统计学DCOVA框架统计方法教学

一、引言

数据对于当今天的商务活动具有重大的意义。数据是关于这个世界的事实,它能够说明问题、提示事实、隐含规律。一些商业机构正是通过“挖掘”数据来发现事物之间的关联性,并从中获取利润。如果人们躲避数据,就可能由于盲目接受他人对数据的概括总结而上当受骗,也可能完全依赖“感觉”来做决策,从而不利于做出正确的决策。因此,作为一门研究如何处理和分析数据的课程——统计学越来越受到各方重视。在高校中,绝大部分商科专业把统计学或商务统计作为专业必修课列入到人才培养方案中。如何学好、用好统计学成为当前许多人需要迫切解决的一个问题。美国著名的统计学家莱文(Levine)等在其撰写的统计学教科书中首次提出了DCOVA框架,用于指导学生或相关从业者如何有效学习和使用统计学。

二、基本术语

统计学是把数据转化为信息用于决策的方法或工具。例如,为了研究青年人喜欢网上购物的主要原因,可以通过调查来收集原始数据,再制作总结表来整理数据从中获得数据中隐藏的有用信息(最主要的原因是网上购物价格便宜),最后根据所获得的信息进行决策,即网店价格要比实体店便宜才能吸引青年消费者。从调查数据到总表结,就是把数据转化为信息的方法。统计方法是把数据转化信息的方法,包括统计描述方法和统计推断方法。统计描述方法主要包括收集、整理、可视化和概括数据;统计推断方法是指用样本数据得出总体结论,包括对总体参数的置信区间估计和假设检验。为了学习和使用统计学的方法,可以应用DCOVA框架。DCOVA框架包括定义数据(D)、收集数据(C)、整理数据(O)、可视化数据(V)和分析数据(A)等5个阶段(图1)。例如,为了研究一所高校学生的努力学习程度,根据DCOVA框架,首要定义数据,即找什么样的数据能够代表学生的努力学习程度,为此需要对努力学习程度开发一个可操作定义,比如用每天平均学习时长(小时)来代表一个学生的努力学习程度。其次要收集数据,可以通过问卷调查的形式收集数据。再次是整理和可视化数据,比如制作频数分布表来整理数据,从而可以查看学习时长的分布情况,制作直方图来可视化学习时长数据,从而直观形象地显现数据的分布特征,从中判断学习时长是否服从正态分布等。最后是分析数据,比如可以分析不同专业、不同性别、不同年级的学生每天学习时长均值的差异,或者估计全校学生每天平均学习时长等。DCOVA框架较好地囊括了统计学教学中主要的知识体系。

三、定义数据(D)

定义数据主要是解释收集什么数据的问题,它与一项研究的目的及其所涉及的变量相关。研究目标决定研究中所涉及的变量,相关变量决定需要收集的数据(图2)。在上述的例子中,研究目标是“研究一所高校学生的努力学习程度”,其中“努力学习程度”就是研究中需要涉及的变量。由于该变量没有直接的数据对应,需要开发一个相应的可操作定义——如每天平均学习时长,最后去收集学生每天平均学习时长的数据。

可操作定义指对所有与该分析相关的人而言很显明是普遍接受的定义,是对某个抽象变量的一种清晰、精确的表述,是对该变量意义的共同理解。努力学习程度是一个抽象变量,在收集數据时会遇到麻烦,因此需要一个可操作定义。每天平均学习时长可以作为努力学习程度的一个可操作定义,因为大家普遍认为一名学生在学习上花费的时间越多,说明该生学生越努力,并有每天平均学习时长是一种清晰、精确的表述,从而方便研究者收集相关的数据。

定义数据还包括确定所需数据的类型。数据是变量的取值,变量类型与其所对的数据类型一致。变量可以分为属性变量(如性别)和数值变量,数值变量又进一步区分为离散数值变量(如家庭人数)和连续数值变量(如身高)。相应的,数据可以分为属性数据(如男、女)和数值数据,数值数据又进一步区分为离散数值数据(如2人、3人)和连续数值数据(如1.75m、1.68m)。在SPSS中,变量的测量尺度(类型)分为名义(图标为三个小圈)和有序(图标为阶梯),这两类都属于属性数据;还有一类为标度(图标为尺子),这类属于数值数据。

四、收集数据(C)

在明确了需要什么数据的前提下,就需要进入收集数据阶段。收集数据(C)主要是解决数据的来源问题。数据的来源有原始数据来源和二手数据来源。原始数据来源主要通过调查、观察和实验获得数据;二手数据来源主要是指其他组织或个人已公布的数据。由于获得原始数据比较麻烦,所以二手数据是首选的数据来源。

在经济管理研究领域,原始数据来源主要依靠调查。由普查涉及面广、成本高、耗时长和难度大,所以一般不常用,对许多研究者来说,主要通过抽样调查来获得原始数据。因此,如何抽样就成了一个无法逃避的问题。调查数据的质量直接影响研究的价值,如果数据本身严重存在错误、偏见,不管采用什么数据分析方法,都很难得出可信的分析结果。为了从一种总体中找到一个样本,并对样本采集数据,首先要做的工作是抽样。不同的抽样方法生成不同的样本类型,如简单随机抽样方法生产简单随机样本,抽样方法与形成的样本类型一致。抽样方法分为非概率抽样和概率抽样两大类。非概率抽样包括便利抽样和判断抽样,其优点是便利、快速、低成本,可以用于前期或试探性分析,其缺点是样本的代表性一般较差,不能用于统计推断。概率抽样包括简单随机抽样、系统抽样、分层抽样和群抽样,其中简单随机抽样和系统抽样的优点是简单易行,但无法保证样本的代表性;分层抽样过程比较繁琐,但能够确保样本的代表性,并能对每个层进行分析,得出每层的结果;群抽样的优点是调查成本低,但有效性相对较差,需要增加样本容量才能达到其他抽样方法的效果。

五、整理数据(O)和可视化数据(V)

有了数据之后,就可以进入数据的整理和可视化阶段了。不同的数据类型分别有不同的整理和可视化方法。整理数据主要用到表格,可视化数据主要是用图形。对于属性数据,可以用总结表、交叉表进行整理,用条形图、饼图、帕累托图、对比条形图等工具进行可视化。对于数值数据,可以用频数分布表进行整理,用茎叶图、直方图、折线图、箱线图、散点图等工具进行可视化。从对数据的整理和可视化的工作中,可以获得数据的描述性信息。

第7篇

关键词:大数据;应用统计学;教学改革

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)43-0101-03

一、研究背景

自2002年桂林理工大学在广西开办了第一个统计学本科专业以来,针对当时理学学位的统计学专业培养的学生虽然数理基础相对扎实,但普遍统计思想不够,实际应用能力较弱的现状和特点,对统计学专业进行了全方位的改革研究,确立了"数学与统计学相融,从培养学生扎实的数理基础和极强的统计分析应用能力有机相结合的理念出发,构建了新的课程体系和教学内容,取得了系列研究成果。2009年研究成果开创“应用性、实验性、案例性”一体化的统计学专业课程体系和教学模式,获得广西高等教育自治区级教学成果二等奖[1],并在其后分别把统计学学科建成广西重点学科和广西高等学校优势特色专业,以及把应用统计实验室建成广西高等学校重点实验室。

虽然我校统计学专业的教学改革和建设取得了许多成果,但近几年,我们也逐渐感觉到在大数据新形势下,我校应用统计学专业的教学体系还有一些不适应的地方,且某些问题还有日益凸显的趋势,我们原来的某些研究成果已不再适应新时代的要求,这就迫使我们继续进行改革研究,探讨在大数据背景的新形势下,如何培养统计学专业复合型和应用型人才,如何准确把握统计学的发展方向与发展形势,如何调整人才培养模式,如何调整相关课程和课程内容,以培养适应大数据背景下社会经济发展需要的统计学专业人才。

许多国家越来越重视数据在大数据时代重要作用,我国也不例外,2012年9月,国家统计局第7次局务会提出,尽快开展在政府统计中应用大数据的研究。2013年可以看作是我国政府统计之大数据元年。2015年9月《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)[2]颁布,标志着我国正逐步进入大数据建设的新时代,为此,国家统计局积极推动大数据在各方面的应用与实践。而大数据的核心是数据,应用统计学学科是与数据分析处理联系最为紧密的应用性学科,因此,应用统计学专业的教学体系应顺应大数据发展的趋势。在大数据背景下,应用统计学专业在继承传统数据分析技术的基础上,对所需的数据处理技能提出的需求更高了。这就是说,大数据对应用统计学的培养目标,以及教学内容等的冲击无疑是最大且不可避免的,这给应用统计学专业带来了巨大的挑战,同时也为应用统计学学科的发展带来了前所未有的机遇。

大数据逼迫人们改变分析、处理数据的手段、思维和理念,这就逼迫应用统计学专业改革必须引入新手段、新思维和新理念。培养应用统计学人才必须与时俱进,才能不断适应大数据新时代的要求,这关系到应用统计学专业培养的人才能否适应和满足社会的需求,因此,这一研究是十分必要、十分迫切且有着重要的理论和实际应用意义。

二、大数据背景下应用统计学专业的改革探讨

第8篇

在统计学上,自由度的概念十分广泛,在对自由度的概念进行界定时,狭义上,在对总体的参数进行估计时,在样本中,能自由变化,或者自变量的个数能独立,我们称之为统计量的自由度。在社会经济的统计实践中,房地产价格变化和居民消费情况的统计等社会调查都是建立在统计抽样的基础上完成的,这种方法的优点在于只要通过样本的信息,就能够推测出总体的情况。自由度的概念涉及范围很广泛,样本的参数估计、系统的推断和统计的检验工作都会涉及到,但是当前我国对自由度产生的背景、性质和原因在教材上并没有给出充分的解释,对自由度的概念也没有规范化的诠释。

关键词:

经济统计;自由度概念;背景和应用

一、自由度概念的产生

自由度概念的产生与与人们进行抽样调查密不可分,抽样调查是一种非全面调查,它能够解决全面调查无法解决或者较难解决的问题,在抽样调查时,先确定好研究地对象,然后对研究对象进行调查,最后再抽选相应的对象进行调查,从总体上来看,抽样调查的这种方式是对全面调查的补充和完善。抽样调查的简单快捷是全面调查力所不及的,全面调查在调查过程中,人力、物力和财力的浪费现象较为严重。节约大量的调查时间。抽样调查的特点较多,抽样调查进行时不受其他因素的影响,时效性极强;在抽样调查中,能够根据调查的要求随机进行选择,这显示出了抽样调查的灵活性;在抽样调查后针对获得的数据进行详细的计算,最后所得数据准确性极高。虽然在许多定律和假设条件中受到限制,为了降低判断失误和调查不全面的情况,采取提高总体样本和抽样样本之间的相关性措施,在抽样样本数据的形成上必须慎重对待。于是自由度在这样的要求下应运而生。基于满足总体和样本之间的约束原因,通过对部分变量和元素的调整以达到实现抽样调查的准确性的目的,因此自由度概念产生的主要原因就是样本在选择过程中的为满足相关条件进行的优化。

二、自由度概念的界定

自由度是可以自由变换的,对于在自由度中不同的较为显著性的实验,其计算方法也是不一样的,样本自由度的正确选择是显著性实验的基础。有专家认为,自由度是可以随意变化信息的数量,其前提是没有违背总体和样本之间的约束条件。如果仅仅只从社会经济的角度来看,在统计中,统计工作质量的主要方面受到样本统计过程的科学性、样本的代表性和统计检验的合理性以及统计结果的真实性的影响,而统计工作的质量主要取决于统计工作的着重点,即统计样本。自由度的确定和选择,在形成统计样本的时候是十分重要的。在统计学上,界定自由度主要从把握样本与总体的关系来进行,总体样本与抽样样本的关系只是基于统计的目的,在统计方法、统计主体、统计性质和统计数量的不同而有所不同。在经济统计学中,统计学中自由度n-1的由来。

三、自由度在经济统计学中应用分析

自由度在经济统计学中的运用作用极其重要,其中,在抽样调查中的应用尤其常见,在抽样调查中,自由度的使用能使抽样调查结果更为精确。在统计上,自由度的运用也及其常见。

(一)统计上的自由度在统计中,对总体的方差进行估算时,离差平方和的使用是最为常见的,方差的确定由n-1的个数决定,这其中的原理是:当均值确定后,n-1个数的值也得到确定,第n个数的值便会得到确定,在统计计算中,均值是n-1的限制条件,基于这样的限制条件,在对总体方差进行最后的估计时,自由度便为n-1.在数学中,自由度是指变量的个数可以随意进行取值,举例说明:假设有4个变量,分别为x、y、z和w,其中x+y+z+w=20,因此可以得知它的自由度等于3.自由度在统计上的运用较为频繁,在热力学中,什么是分子运动的自由度?在确立了分子的空间位置时,这个位置所需要的自由坐标的数量就叫做自由度;在理论上的力学中,质点在空间上进行随意运动时,质点的位置只要三个坐标就能够得到确定,由此可知,质点在进行运动的时候,其拥有三个自由度。当然,在物体受到限制时,其自由度便会减少,如果让质点只在一个平面上运动,它的自由度便为两个,在曲面上也是如此;但是,如果让质点在一条曲线上运动,或者在一条直线上运动,它的自由度就只有一个。

(二)经济学中自由度的运用举例为证,实验者对某一公司产品的年销售量进行调查研究,该公司预计销售10万份产品,利用随机抽样的方式对前半年的月销售量进行调查,在调查中,被调查产品的月销售量的平均数是总体的参数,这是较为精确和客观的。通过对公司相关负责人的问卷调查和随机抽样取得的数据获得前半年的产品月销售量数据,样本的平均值是在调查中取得的数据,通过计算获得的,理论上来说,调查的参数与统计量在数据的内容要求一致,由此可以看出这前半年的数据和是能够得到确定的。当前5月的数据被确定,剩下一个月的数据的精确度便十分精准。所以,在上述例子中,被研究产品年销售的情况是:在统计量中求得平均数后,其自由度为:k=6-1=5.这个解释可以归结为:将前半年的月数视作6,样本便为x=6,它的平均值假设为7,即为y=7,由于受到y=7的限制,在自由确定了6、3、7后,第6个数据只能为13,否则的话,y不等于7。因此,这里的自由度为k=x-1=3,由此推算,在所有统计量中,自由度都为k=x-y。

四、结束语

在日常社会生活中,人们或多或少都会用到统计量,自由度存在于统计量的计算公式中,但不少人会产生疑惑,同样是计算标准差,为什么在总体中,标准差的自由度为n,但是样本中的标准的自由度却为n-1,其他公式中,自由度的界定为n-2或者n-3?我们知道,自由度的概念不仅仅存在于统计学中,但是在经济统计中,自由度的运用是较为全面的。例如对产品的销售数量在市场上进行的调研、人口的统计调查以及居民的月用电量等等。自由度的概念广泛存在于统计的计算公式中,

[参考文献]

[1]袁卫.从“人口革命”到重构统计教育体系———戴世光教授的学术贡献[J].中国人民大学学报,2012,01:146-152.

[2]钟无涯,颜玮.自由度概念在经济统计中产生的背景及其应用[J].统计与决策,2012,19:8-10.

[3]徐强.用户友好型《国民经济统计学》教材建设问题研究[J].经济研究导刊,2013,09:251-252.

第9篇

教材是教师教学和学生学习的主要依据,是体现教学内容和教学要求的知识载体,贯穿整个教学过程。国内现有《生物统计学》及相关教材有20余种,每本教材都有自己的特点和针对领域,有的还附有相关统计软件知识的介绍和应用[2~4]。河南师范大学生命科学学院是较早开设生物统计学课程的高校之一。开设之初是选修课,没有固定的教材,教师将主要讲授内容以讲义的形式发给学生,重点介绍常用的统计学原理和生物统计学的方法,所选案例亦是生物学试验中常见的。随着培养方案的完善和专业设置的调整,1997年该课程调整为全院必修课。目前,是我院生物科学专业的专业必修课,是生物技术专业和水产养殖专业的专业限选课。在多年的教学过程中,随着生物学的发展和统计软件的应用,该课程的教材也从讲义到科学出版社四版《生物统计学》及其配套的《生物统计学学习指导》[1,5~8]。笔者就四版教材建设中的体会与实践进行分析。

1《生物统计学》(第一版)

统计学是以概率论为基础的,因而生物统计学必然与抽象复杂的数学知识相联系。生物统计学的理论性和实践性均较强,而且涉及的内容、公式和抽象概念较多,需要一定的数学基础和较强的逻辑推理能力,但由于生物学科的特点,生物统计学相对应于概率论与数理统计是“拿来主义”,一般不过多讨论其数学原理,而是在简单介绍统计原理的基础上重点介绍具体分析方法的应用。教学组在多年教学实践工作的基础上,1997年在科学出版社出版的《生物统计学》[5]就充分体现了这个特点。书中内容主要侧重于各种统计方法的应用,在统计原理方面,一般只作概念上的介绍和公式的简单推导,对有些较复杂的统计公式则只给出公式,其目的主要是为让读者不但对统计学原理有较全面的了解,更重要的是结合实例了解和掌握各种常用统计方法。在内容的编排上,全书共分十二章,概括起来主要有五个方面:第一章至第三章介绍统计和概率的基础知识,包括生物统计学的概念和内容、数据的搜集与整理、平均数和变异数的计算、概率和概率分布等;第四章、第五章介绍统计推断,包括样本平均数的检验、样本频数的检验、方差同质性检验、非参数检验和检验;第六章至第九章介绍统计分析方法,主要内容有方差分析、直线回归与相关分析、可直线化的曲线回归分析、多元回归与相关分析、逐步回归分析、多项式回归、协方差分析;第十章、第十一章介绍抽样与试验设计,主要包括抽样误差估计、抽样方法、抽样方案制订及常见的试验设计如对比设计、随机区组设计、正交设计及其相应的统计分析方法;第十二章对多元统计分析进行了简单介绍。每章都附有一定数量的思考练习题,供读者参考。

2《生物统计学》(第二版)

根据教学安排和生物统计学应用的需要,在教材使用反馈意见的基础上《生物统计学》(第二版)[6]于2000年在科学出版社出版。与第一版相比,各章节做了大幅度调整,将全书分为十四章,补充了拉丁方设计和裂区设计两种试验设计方法,将抽样原理和方法、常用试验设计及其统计分析放在了可直线化的非线性回归分析之后进行介绍,使章节编排体系更符合读者学习的要求。第一章至第三章分是基础理论,包括概论、试验资料的整理与特征数的计算及概率与概率分布。第四章至第六章介绍了具体的统计分析方法,分别是统计推断、检验和方差分析。第七章、第八章主要介绍试验设计的相关内容,包括抽样原理与方法、常用试验设计及统计分析。前面所涉及的统计分析内容主要是针对一个变量而言,之后的章节则主要介绍两个及多个变量的分析方法,第九章、第十章是关于一元回归和相关的内容,分别是直线回归与相关分析、可直线化的非线性回归分析。第十一章至第十四章介绍了协方差分析、多元回归与多元相关分析、多项式回归分析和多元统计分析简介。书中增加了对全文关键词汇和术语的索引,并在书后附上了各章部分思考练习题的答案。在例题上进行了重新编排,以使所选例题更能反映本章的内容且便于读者的学习和理解。

3《生物统计学》(第三版)

为适应21世纪生命科学发展和生物学人才培养的要示,在第一版、第二版的基础上,对教材内容重新进行了编排、审核并增加了部分内容,于2005年在科学出版社出版《生物统计学》(第三版)[7],并被列为21世纪高等院校生物科学系列教材。与之前相比,此版教材突出了以下3个特点:(1)内容丰富:增加了平衡不完全区组设计、倒数函数曲线、通径分析等内容;(2)编排科学:全书分解为十六章,各章节的安排更加注重了内容的循序渐进,并在每章之首增加了本章提要,总结该章节的主要内容,并列出了难点和重点;(3)针对性强:内容突出了本教材主要作为生物学专业教材这个重点,所选例题均为均为生物学试验中的案例。另外,随着计算机统计软件的发展和应用,统计软件是在统计学研究中必不可少的应用工具。目前的统计学软件,相关的统计分析方法及术语多以英文形式给出,只有掌握了相关术语的英文表达,才能更好地应用软件,否则只会导致统计分析的误用。在此版的修订中,对主要概念和术语增加了英文标注,并重新编排了中英文对照索引,以便于学习和检索。此版还对统计分析中学生易引起歧义的内容进行了修订,例如,方差分析是统计学常用的分析方法之一,对方差分析基本原理的理解是正确运用方差分析的前提。在教学中,要求学生正确理解方差分析中的处理数和组内重复数的含义和统计学意义。原来的教材中,例题中的处理数k和每处理下的重复数n的数量值是一样的,这样学生学习起来容易产生混淆,在这次修订中对例题进行了更换,以使学生很容易掌握n、k的含义及特征。

4《生物统计学》(第四版)

为适应21世纪生命科学发展和生物学人才培养对生物统计学教材的要求,在本书前三版的基础上,按照“强化基础、突出重点、注重应用、通俗易懂”的原则对全书内容重新进行了精简和编排,于2008年出版《生物统计学》(第四版)[1],并被教育部列为普通高等教育“十一五”国家级规划教材。与前三版相比,本书具有以下特点:(1)突出以本科教学为重点,注重与多数高校生物类专业目前生物统计教学要求的适应,精简了多元统计分析等部分较深的内容和平衡不完全区组设计、拉丁方设计、非参数检验等不常用的内容,将全书缩编为十四章。教材内容更侧重于各种统计方法的应用,而对复杂的统计原理只做概念上的介绍和公式的简单推导,目的是让读者在全面了解统计学原理的基础上,结合实例了解和掌握各种常用统计方法。(2)根据生命科学研究的发展和要求不断进行补充和调整教材内容,在内容结构安排方面,对全书各章节进行了部分调整,将直线回归与相关分析、可直线性的非线性回归分析放在抽样原理与方法和试验设计的前面,以使本书更加系统,便于本课程基本内容的教学。生物统计学分为统计分析和试验设计两大部分内容。此版教材在介绍统计学的基本理论之后,全面介绍各种常用的统计分析方法,然后是试验设计的内容。各章节安排循序渐进,具有一定的深度和广度。(3)更换和调整了部分例题和习题,对部分表达不甚清晰的部分进行了修订。在选用例题时,选择生物学各个分支典型例子,并着重突出生物专业及相关专业教材的重点。同时在各章后附上重新编排思考练习题,教材最后附上中英对照索引,以便于学习和检索。(4)为了进一步帮助读者理解和学习此版教材的内容,提高学生自学能力,配合本书编写了《生物统计学学习指导》一书,以利于学生加强课后实践练习,实现《生物统计学》教材的立体化。

5《生物统计学学习指导》

生物统计学是一门实用性很强的工具性课程。学习生物统计学需要举一反三,既要对生物统计学的基本概念、基本内容有较熟悉的理解和掌握,也要通过例题学习了解不同统计问题的解题思路和解题方法,更要通过习题练习来熟练掌握这些方法。因此,编写一本与《生物统计学》教材配套的学习指导书就显得十分必要。由于课时的限制,课堂讲授仅限于基本的统计问题和部分扩展性知识,用于介绍和解析各种统计方法的例题也只能选择少部分经典例,这就不可避免地会使一些问题得不到细致分析,部分内容的叙述和公式推导也不够深入。此外,前版教材虽然在书后附有各章习题的答案,但也仅是简单的参考答案,而没有详细的解题分析和解题过程。

第10篇

关键词 抽样调查 无回答抽样 误差调整

中图分类号:G642 文献标识码:A

所谓无回答抽样误差,是指抽样调查中, 在按随机原则从总体抽取出样本后, 由于样本中的某些被调查单位拒绝提供资料, 或抽样框不全面造成被调查单位不能进入样本, 只能根据调查到的部分样本单位的结果来估计总体指标时所产生的偏差, 这种偏差称为无回答抽样误差。

一、无回答抽样误差的来源

(1)不完善的抽样框所产生的调查单位遗漏以及客观因素的影响。表现在被调查单位未能进入样本, 或对进入样本的单位调查时, 由于气候和交通条件的限制, 在调查期间内不能对其实施调查。(2)调查项目的设计和被调查者的素质。如果调查表中调查项目的设计不合理或措词不当, 被调查者的素质低下, 会使得被调查者无法提供所需的资料, 或没有能力提供资料。(3)被调查者拒绝提供资料。当抽样调查的目的是为了研究一些敏感性问题时,将会产生无回答抽样误差。

二、无回答误差的调整

1、样本替代法。替换过程要遵守以下基本原则:替代者与被替代者应属于同一类型的,他们具有某些相同的或相似的特征;替代的程序应当在调查实施前就确定,而不能在发生无回答时按调查员主观愿望或方便而任意择取。

2、二重抽样法。主要思想是先从总体中抽取一个较大的样本,采用比较便宜但无回答率可能较高的调查方法,然后在无回答单元中再抽一个子样本进行面访调查,取得无回答单元的信息,最后把这两部分调查结果结合起来对总体作出推断估计。

设总体单元数为N,先抽取样本量为n1的简单随机样本,是回答的单元数,其样本均值为yn1,n2是无回答单元数,n=n1+n2,然后再从n2中抽取一个子样本n'2,样本均值为yn2,总体无回答率为R2,则二重抽样总体均值的估计量为:y= 抽样方差为:V(y)=()s2+R2/n*()s22 ,其中,s2是样本方差,s22是无回答层的方差。可以看出,总体方差的前一项受第一重样本n大小的影响,后一项不仅受n的影响,还受无回答者中第二重样本抽样比的影响,当f为1时,方差的后一项为0,就是对整个样本n进行调查,并且收集到全部数据的方差,它相当于样本量为n的简单随机抽样。

3、扩大有效样本。为了达到规定的精度,需要根据预计的回答率调整样本量的大小公式为n=,n'为根据样本量公式计算得到的初始样本量。

4、比率或回归插补。比率或回归插补是使用辅助信息及其它记录中的有效回答建立一个比率或回归模型,该模型表明了两个或多个变量之间的关系。比率插补所使用的模型为:yi=Rxi+ i,其中yi是变量y的第i个单元值;xi是与变量y相关的变量x的第i个单元值;R是通过原点的直线的斜率(xi每变动一个单位,yi平均变动的数值); i是模型的随机误差项,均值为0,方差为R2。这时yi,的插补值按如下公式计算:yi=式中:yi是变量y第i个记录的插补值;x是插补类中记录的x值的均值;y是插补类中记录的y值的均值。如果将模型改为yi=a+bxi+ i,也即一般的线性回归模型,相应的插补即为回归插补。

5、加权调整法。加权调整法是通过给每个回答数据赋以不同的权数然后再进行数据处理,以此来调整由于无回答引起的偏差。假设从总体N中随机抽取样本容量为n的样本,总量估计量为:=,为样本单位的权数,若假设单位的入样概率为,回答概率为,若全部单位都回答,则=-1,它反映了样本中第i个单位在估计中的作用。当无回答出现时,由于n1

由以上分析可以看出,无回答的估算方法有很多,这些方法或多或少对项目无回答会有好的作用,在实际应用中要结合调查的具体内容和条件,分析各种方法的长处和短处,有针对性得作出决定。然而任何估算方法都只是一种补救措施, 解决问题最好的方法是在一开始就予以重视,通过各种方法避免无回答的出现。

(作者:王旭,兰州商学院统计学院,统计学专业,研三;魏永博,兰州商学院统计学院统计学专业)

参考文献:

[1]冯士雍.抽样调查理论与方法.中国统计出版社,1998.

[2]金勇进. 抽样技术. 中国人民大学出版社,2002.

第11篇

【关键词】 龋齿;牙龈出血;牙石;流行病学研究;儿童

【中图分类号】 R 179 R 78 R 780.1 【文献标识码】 A 【文章编号】 1000-9817(2008)12-1129-02

为了解河南省人群口腔健康状况和口腔疾病的发病趋势,监测和评价《河南省牙防中期规划目标(1999-2005)》的实施情况,根据卫生部疾病控制司批准开展的第三次全国口腔健康流行病学抽样调查方案的要求,2005年对河南省城乡人群的口腔疾病患病状况及口腔健康行为进行了流行病学抽样调查。笔者对12岁年龄组人群的调查结果进行了分析,报道如下。

1 对象与方法

1.1 对象 根据第三次全国口腔健康流行病学抽样调查方案的要求,采用多阶段分层等容量随机抽样方法,利用国家统计局公布的2000年全国人口普查资料,由第三次全国口腔健康流行病学抽样小组随机抽取区(县)级单位以及街道(乡镇)级单位。在此基础上,省流调组从每个街道(乡镇)抽取2个居委会(行政村),然后从被抽中的居委会(行政村)所有适龄人群中随机抽取各年龄组的被调查个体。选取河南省郑州市中原区、平顶山市湛河区、项城市、汝州市、濮阳县、唐河县12岁年龄组儿童共784人,其中城市391人,农村393人;男生390人,女生394人。

1.2 方法 调查项目包括牙列状况(只检查冠龋)、牙周状况(全口牙齿)、牙龈出血和牙结石、氟牙症。参加口腔检查人员全省共 3人,均具备口腔专业本科以上学历,从事口腔内科临床工作3年以上。调查工作开始前,均经过卫生部组织的培训,获得第三次全国口腔健康流行病学抽样调查口腔检查资格证书。在调查过程中,全国第三次口腔健康流调技术指导组进行2次质量检查,每个口腔检查人员的Kappa值均在0.8以上。检查龋病、牙周疾病使用WHO推荐、上海市齿科器材厂生产的CPI牙周探针及平面口镜。调查数据全国统一录入,数据的统计处理采用SPSS 12.0统计软件包完成。

2 结果

2.1 恒牙龋齿患病情况 学生恒牙龋齿的患病率为19.13%。城乡差异无统计学意义(χ2=0.89,P>0.05),男、女生差异有统计学意义(χ2=5.25,P<0.05);恒牙龋均(DMFT)为0.29,城乡差异亦无统计学意义(t=-0.54,P>0.05),男、女生差异无统计学意义(t=-0.76,P>0.05),见表1。

2.2 其他口腔健康状况 在受检儿童中,检出有恒牙外伤的儿童19人,占2.42%,男、女生差异无统计学意义(χ2=1.40,P>0.05),城乡学生差异无统计学意义(χ2=0.50,P>0.05)。第二恒磨牙未萌的儿童占51.28%,男、女生差异有统计学意义(χ2=18.41,P<0.01),城、乡学生差异无统计学意义(χ2=0.42,P>0.05)。牙龈出血的儿童占29.61%,男、女生差异无统计学意义(χ2=0.42,P>0.05),城、乡差异有统计学意义(χ2=143.70,P<0.01)。平均每个儿童有1.06个牙位出血,男生牙龈出血的平均数为1.20个牙位,女生为0.93个牙位;城市儿童牙龈出血的平均数为0.22个牙位,农村为1.90个牙位。有牙结石的儿童占48.85%,男、女生差异无统计学意义(χ2=3.44,P>0.05),城、乡学生差异有统计学意义(χ2=51.96,P<0.01)。平均每个儿童有2.63个牙位有结石,男生牙结石的平均数为2.80个牙位,女生为2.46个牙位;城市儿童牙结石的平均数为1.20个牙位,农村为4.06个牙位。有不同程度氟牙症的儿童占19.05%,城、乡学生差异有统计学意义(χ2=5.87,P<0.05)。见表2。

3 讨论

调查显示,河南省12岁儿童恒牙龋患率和龋均分别为19.13%和0.29。按照世界卫生组织龋病等级评价标准[1],河南省12岁年龄组儿童少年的龋齿患病处于较低水平;与2002年河南省第二次口腔流调的结果(23.3%)比较,呈下降趋势。分析其原因主要有2方面,一是2次调查龋病诊断标准不同,2005年龋病诊断采用的是WHO口腔健康调查基本方法第4版的标准;新标准要求必须有明显的龋洞或明显的釉质下破坏才可以诊断记录为“龋”,当可疑龋时不能记录为龋。二是河南省自1996年成立牙病防治领导小组以来,在牙病防治健康教育和儿童青少年龋病防治方面做了大量工作,儿童龋病的患病率得到了一定的控制。

河南省12岁儿童恒牙龋齿充填率为4.0%,低于1995年全国流调的平均水平(11.05%),与北京、上海等经济发达城市差距更大(1995年北京市恒龋充填率为18.45%,上海市为41.3%)。发达国家学生龋患率虽高,但龋齿的充填率一般都在75%以上。所以真正衡量一个国家口腔保健水平的指标不是龋患率,而是DMF构成比中的充填率(龋补率)[2]。

从调查结果还可以看出,河南省12岁城乡儿童牙龈出血及牙结石检出率农村高于城市,牙齿健康(无龋齿、牙龈出血和结石)儿童的检出率城市高于农村。因此,在河南省今后的牙病防治工作中,农村和农村青少年仍是重点。

建议进一步加强口腔健康教育和健康促进,大力推广窝沟封闭、早期充填等适宜技术,不断强化和促进儿童青少年的口腔保健意识及口腔健康行为,做到早发现、早治疗,提高儿童青少年的口腔健康水平。

4 参考文献

[1] 中华人民共和国卫生部.全国学生龋病、牙周疾病流行病学抽样调查.北京:人民卫生出版社,1987:16.

第12篇

关键词: 统计学 教学 职业技术教育

当前是市场经济和信息经济的时代,社会各个方面的发展都需要对信息进行收集、分析和整理,这一系列的工作都依赖统计,统计工作已经渗透到社会发展的各个方面。作为一名从教工作者,我深知要培养出高素质的统计学人才,统计学教学显得尤为重要。

一、统计学的概述及其原理

1.统计学的概述

统计学[1]是应用数学的一个分支,主要通过利用概率论建立数学模型,搜集观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛地应用在各门学科之上,从物理和社会科学到人文科学,甚至被用在工商业和政府的情报决策之上。统计学主要分为描述统计学和推断统计学。

2.统计学的原理

统计学原理包括:统计学的研究对象和方法、统计学的基本范畴、统计组织和管理、统计调查的意义和种类、统计调查方案、统计调查方法、统计整理的意义和内容、统计分组、统计分布、统计表、总量指标、相对指标、平均指标、变异指标、综合指标的应用、抽样推断的意义和内容、抽样误差、抽样估计的方法、抽样组织的设计、假设检验的意义与假设命题、假设检验方法、符合检验与秩和检验、相关的意义和种类、相关图表和相关系数、回归分析、指数的意义和种类、综合指数和平均指数、因素分析、指数数列。

二、统计学教材的创新

教材是提供知识的载体,教材的质量直接影响着教学质量,当前的统计学教材由于更新不及时,教材内容往往注重理论,而且抽象难懂,缺少案例分析和对学生实践操作的培养[2]。因此,要对统计学教材重新编写,从而更加适合当前统计学的发展。统计学的目的旨在为学生通过学习统计理论知识,掌握数据资料的分析方法,对数据资料能够进行整理、分析,做出正确的决策。统计学教材必须在对统计理路知识掌握的前提下,穿插对实际案例的分析,使统计学教材更加科学、更加实用。统计学的内容应当与统计软件有机结合起来。在对实际问题进行分析时,手工操作已经不能适应当前社会统计的需要,运用统计软件不仅可以缩短计算时间,而且使统计出来的数据更加明了,更加准确。

三、以就业为导向

统计学是理论和实际相结合的学科,不仅要掌握统计理论知识、统计方法,而且要能够进行实际操作。在统计学的教学过程中,必须理论和实践相结合[3],充分展现统计学的实践性、应用性等特点,从而培养学生独立分析和解决实际问题的能力。教师应注重加强统计学教学和运用统计软件的有机结合。在教授学生理论知识的同时,必须加强对学生的上机操作,通过对实际数据资料进行搜集、整理、分析,从而得出结论,提高学生的动手能力和实际操作能力。在教学工作之余,还应当对学生进行就业指导,在就业的选择中,不要好高骛远,更不要急功近利,要正确认识自己的经验和能力,选择能体现自身价值和发挥自己特长的岗位,认清现实。社会处在不断地变化和发展之中,要想在竞争激烈的社会中有一席之地,就必须居安思危,不能盲目自大,不断加强自己的业务能力,从而使自己适应不断发展的经济社会。

四、教学方法的改革

1.案例教学法

案例教学法[4]就是指教师通过在教学的过程中,穿插一些实际案例进行分析,调动学生的积极性和主动性,让学生相互讨论,对案例进行分析。这样不仅能更好地掌握所学的理论知识,而且可以培养学生分析问题、解决问题的能力。在对案例的选择上:一要与当前所讲述的理论知识相关联;二要所选的案例必须是在现实社会中真实发生的,不能是虚构的事件,案例最好是最近发生的,这样更有说服力,产生的效果也更加明显。

2.多媒体教学

多媒体教学是指在教学过程中,根据教学目标和教学对象的特点,通过教学设计,合理选择和运用现代教学媒体,并与传统教学手段有机组合,共同参与教学全过程,以多种媒体信息作用于学生,形成合理的教学过程结构,达到最优化的教学效果。多媒体教学取代了传统的黑板教学模式,更加能调动学生的积极性,可以把过去在教学中不能展现的事物表现出来,对于统计学来说,可以更加深入理解和掌握统计方法在实际中的运用。在对课件的制作上,为了达到更好的教学效果,教师应当熟练运用PowerPoint,调动学生学习的积极性。由于采用多媒体教学,课程进度往往会比传统的黑板教学快,为避免学生不能很好地掌握的情况,可以让学生在课后拷贝课件,便于对所学的课程进行巩固和复习。

五、加强实践操作

统计学是需要理论和实践相结合的学科,由于统计学的理论性很强,学生觉得比较难学,主要在于统计学中的概念比较严谨、复杂、计算推导公式也比较繁多。在学习统计学的过程中,就必须理论联系实际,把有关的概念、方法原理和实际生活中联系起来,通过实例进行清晰、明确地诠释。可让学生参加一些实践活动,比如可以在校内开展一些调查,像学生每月生活费调查、业余活动调查等,让学生通过所学的理论知识对其进行设计、调查、分析、整理,最后写出报告,这样不但可以巩固所学的理论知识,做到学以致用,而且可以提高学生的实际操作技能。学校还可以联系一些实习单位,让学生真正体验在现实操作,把所学的知识和实际工作更好地融合,在实际操作中逐步提高自己的水平。

六、统计学在教学中的应用

统计学是对客观现象的数量方面进行搜集、整理、归纳和分析,以便从中作出正确推断的认识方法论科学。由于统计定量研究具有客观、精确和可检验的特点,因此统计方法就成为实验研究的最重要方法,广泛应用于自然、社会、经济、科学技术各个领域的研究。统计软件的开发和使用大大节省了统计成本,促进了统计学的发展和应用,使之应用的领域更加广泛。社会科学统计软件包(statistical package for the socialscience,SPSS)是世界著名的统计分析软件之一,自开发应用至今已有40余年,软件功能已能满足通信、医疗、银行、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。SPSS具有很强的数据管理和统计分析功能,又可进行图表分析和输出管理等。其过程包括描述性统计、均值比较、一般线形模型、相关分析、回归分析、对数线形模型、聚类分数据简化、时间序列分析、因子分析等,涉及统计学的所有过程。将SPSS引入统计学的教学,统计中的数据处理和数值计算会变得轻而易举,使得教师可以集中精力讲清概率统计问题的思想方法。

参考文献:

[1]http://baike.省略/view/1734428.htm.

[2]黄金梅.高职院校统计课程教学改革的探讨[J].闽西职业大学学报,2004.2.

第13篇

前言

统计学是一门应用性的学科,是大学经济管理专业的一门核心专业基础课。作为一种社会实践活动已有悠久的历史。统计学是一门收集数据、整理数据、展示数据、分析数据、解释数据的科学,它的目的是为了更有效地做出决策。由于在自然科学和社会科学领域中,都需要通过数据分析来分析解决实际问题,因而,统计方法的应用几乎扩展到了所有的科学研究领域。对于本科专业的统计学教学来说,主要注重于理论教学,而对于高职高专的专业则主要是注重学生实践能力的培养和提高,使学生具备利用统计工具获取信息、处理信息、分析信息、利用信息的能力,只有这样才能实现高职高专培养高等技术应用性专业人才的目标,才能适应社会发展的需要,运用所学的统计学知识,对企业对社会提供的数据进行分析,提出具体的意见和解决问题的方法。因此对于高职高专经济管理类专业类学生来说应用统计学的教学显得非常重要。笔者多年来从事应用统计学的教学工作,本文试对应用统计学的教学从以下几个方面加以探讨。本文由收集整理

1 教学内容的选择

教材是知识的载体,教学内容的选择直接影响到教学效果。2002年全国职业教育工作会议做出了《国务院关于大力推进职业教育改革与发展的决定》(国发[2002]16号),加强了对职业教育工作的领导和支持,以就业为导向改革与发展职业教育逐步成为社会共识,职业教育规模进一步扩大。但从总体上看,职业教育仍然是我国教育事业的薄弱环节,发展不平衡,投入不足,办学条件比较差,办学机制以及人才培养的规模、结构、质量还不能适应经济社会发展的需要。Www.133229.cOM2005年国务院做出《关于大力发展职业教育的决定》,进一步深化教育教学改革。根据市场和社会需要,不断更新教学内容,改进教学方法。加强职业院校学生实践能力和职业技能的培养。

因此,高职高专统计学的教学内容应该根据职业教育的特点以及专业目标来决定。既要符合专业培养目标的要求,又要培养学生的 实践能力和技能,具有分析问题和解决问题的 能力。二十世纪90年代末我国开始发展职业教育以来,很多院校开始编写符合职业教育特点的统计学教材,目前关于高职高专的统计学教材种类繁多,但大多是在原有的本科教材的基础上进行删改,内容陈旧,理论多,案例少,没有紧跟社会经济发展的步伐,不利于对学生实际操作技能的培养。所以笔者认为,对高职高专教材的重新编写是目前教学内容改革的重点,对教学内容做适当的取舍。

笔者采用的课本编排的内容为:概述、数据的描述、简单线性回归与相关、统计方法、概率论基础、离散概率分布、正态分布、抽样分布、估计、假设检验等十章。在教学过程中笔者认为有些内容已在中学学习过了,比如在统计方法这章中的平均数、中位数、众数以及标准方差等,还有概率论基础这些内容都是文理科高考的必考内容,这些内容可以删除。另外,抽样分布以及假设检验等对于高职高专学生来说是比较难的,而且不是很实用,所以建议删除。适当增加实用的内容,如根据社会经济的发展,可以增加静态指数的分析,包括总量指标、相对指标、平均指标、标志变异指标等;增加动态指数的分析,包括动态数列水平指标、动态数列速度指数指标;常用的经济指数,如工业生产指数、消费者价格指数、零售物价指数、股票价格指数、农副产品收购价格指数、产品成本指数等实用的内容。这样才能让学生较为完整地掌握统计知识,为后续课程的学习打下坚实的基础。另外当今人们的学习、生活与工作越来越离不开电脑,统计学作为一门应用型学科,也应该让学生学会使用比较常用的统计分析软件,提高学生分析问题解决问题的能力。

2 综合应用各种教学方法

不同的教学方法与教学手段,可以获得不同的教学效果。学生的主观能动性的发挥、学生创造性思维的激发,单靠传统的教学方法是不够的。传统的教学方法是“填鸭式”的或称为单向灌输式的,这样的方法有其优越性:以教师为主导,教师按照学生认识活动的规律,有计划有目的地组织和控制教学过程,目的在于使学生掌握系统的基础知识和基本技能。

学生对所学内容从感知、理解到巩固,都是在教师领导下进行的,教师完全控制课堂,掌握教学进度,可以充分发挥主导作用和正面教育的作用,一个教师可以教授众多学生,学生能在单位时间内掌握较多的系统的信息。但这种方法也有缺点:教师只注重如何“教”,而不注重学生如何“学”,只注重知识的灌输,不注重能力的培养,考试主要靠死记硬背,不利于调动学生的学习积极性,不利于具有创新思维与创新能力的创造性人才的成长。因此,除了传统的教学方法外还应结合以下方法进行教学:

2.1 互动参与式教学法

它是指以提高实践能力为核心,充分调动学生的主观能动性,使之参与到教学过程中去。它的特征在于教学过程中的“沟通”与“对话”,注重于教学过程中“教了什么”和“学会了什么”,是一种提倡师生交流的教学指导思想,强调师生及学生互相之间开展讨论、交流和沟通;是一种是多向的、互动的;学生在教学活动中从单纯接受者的角色转变为学习过程的主体,从“要我学”到“我要学”,从接受式学习改变为发现学习、探究学习,激发学生的创新观念和创新欲望,提升学生的创新兴趣,培养学生产生新认识、新思想和创新事物的创新能力。总之,互动式教学反映了教学过程中教与学的交互、反馈和融合,使得教学过程成为一个协调的整体,是一个对话的过程,理解的过程,创新能力形成的过程。

比如在讲到抽样方法的内容时,如何理解系统抽样。大家知道当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。但如何进行系统抽样学生还是一知半解。这时我们可以让学生参与教学过程,设计如下的问题:采用系统抽样方法调查本班学生的每月消费情况。每班选取两名学生参与调查。通过让学生亲身体验、亲自参与、亲自动手,从而使学生真正领会统计学的思想。

转贴于

2.2 社会实践教学

统计实践是统计理论知识的加深和延续,通过社会实践,在实践中来分析问题、解决问题,将从书本所学的理论知识进一步巩固和深化。实践活动可以分为校内和校外。校内实践活动可以以小组为单位按照设计的课题,运用所学的理论知识,确定统计研究的目的,制定实践活动方案;可以以教师或学生为调查对象,如大学生的消费结构调查、大学生对某一课程的满意度调查、大学生上网时间与学习成绩之间的关系调查等。对统计方案的设计、统计问卷的设计、统计资料的搜集、数据整理、分析知识的巩固,提高学生的动手能力和创新能力,同时可以让学生把学过的专业知识更灵活地应用到实践中。校外实践活动主要是指让学生到企业或某一单位进行校外实习,如暑假的社会实践活动,学校规定的工厂实习等。学生可以实地调查,使用不同的调查方法收集调查资料,对资料进行汇总整理,然后进行深入细致的分析研究,分析问题产生的原因,提出解决问题的具体措施。通过实践活动让学生在真实的环境下,获得第一手感性知识。也正因为这样,学生才能将所学的理论知识运用到实践的工作中,从而激发学生的学习兴趣。

2.3 案例教学

案例教学法属于实践活动的真实模拟,一方面它可以将理论与实际密切联系起来,让学生在课堂上就能够接触到各式各样大量的实际问题,训练学生综合运用知识去解决实际问题的能力;另一方面,由于案例的解决方案不是惟一确定的,具有一定的挑战性,也有利于调动学生学习的主动性和积极性。

案例应该选择与实际活紧密相连的,或反映国家经济发展的有代表性的以及全球热点问题,案例的选取还要结合专业的特色,比如对经济类专业来说,就可以选取恩格尔系数来说明结构相对数。这样经过精心准备的案例让学生对那些众多枯燥乏味的公式、概念产生深刻的认识,感到统计数字与政治、经济、社会生活息息相关,从而产生对统计科学的浓厚兴趣。目前可以采用的统计学案例很多,教师也可以自编案例。

3 考核方法

第14篇

【关键词】医院档案;管理;统计学;病例档案;应用;医院建设

近年来,医院档案收集整理工作日益加重,借阅数量也呈上升趋势。因此,做好各类档案的登记与统计,及时发现、分析、总结其规律,是促进档案开发利用的重要一环,而且统计学应用效果关系到医院档案工作的效率和质量。统计学是一门综合性学科,是应用数学的重要组成部分,通过使用数学概率论等来建立数学模型,收集被测系统的数据,对数据进行量化分析、总结,进而作为医院管理决策的有效依据。

一、统计学在医院档案管理中的作用

统计学在医院的日常管理工作中有着不可或缺的作用,医院档案管理过程中运用统计学方法,能够如实体现医院各部门的客观情况,较为全面地为医院档案的登记、保管、借阅、使用等提供更加客观有效的数据。

(一)运用档案统计为医院管理者和决策者提供了重要统计数据信息,有助于做出正确发展决策。借助统计手段,可对医院某一阶段的发展效果和工作开展情况统计数据化,进而分析管理效果,不断改进管理方法。(二)有助于促进医院的人事行政管理的高效化。合理运用统计学方法,更清晰地分析医院人员现有情况,量化掌控人事运行,实现医院人事招聘、医务人员的管理等有序高效进行。

(三)促进医院的临床门诊等管理的信息化、科学化和高效化。通过对医院的门诊人次、住院人次、患者满意度、病床周转情况以及诊断治疗有效率、病死率等的统计,尤其是病历档案的病种统计,进而分析医院医疗服务工作水平如何,更明确掌握医院的质量控制工作,有利于不断改进和提升医疗水平和服务质量。(四)有效提升医院管理的规范化、信息化、科学化、高效化。统计档案一方面为医院提供系统、全面的医疗统计信息,另一方面能及时、准确地从统计档案中提取各种统计资料,提升医院发展水平。

二、统计学在医院档案管理中的应用

统计学在医院各个部门管理工作中皆有涉及,本文主要浅析统计学在医院人事档案、病历档案等几方面中的应用。

(一)统计学在医院人事档案管理中的应用。在医院的实际人事管理中,对医院人员的基本情况进行收集、整理,并在计算机人事管理系统中输入,形成人力资源管理的基础数据,对医院的人员变动以及职称、学历等改变予以及时准确的记录和统计,使用这些统计数据,形成一定的统计表格和台账,便于深入了解医院所有的医务人员的学历水平、医院的整体学历结构、科室的科研水平能力、继续教育状况以及业务水平等情况,从而形成科室的和个人的业绩数据库,便于奖惩制度的实施。同时,医院管理者借助人员信息统计报表,可清楚掌握医院的每学科的技术结构和能力,从而合理调整各专业的人员设置和用人计划,借助人员学历、职称、年龄等结构统计报表以及工资收入统计台账,有效实施医院医务人员的队伍建设,优化医院人才结构和知识结构,进而提升医院的学科建设水平和医疗服务质量。

(二)统计学在医院病历档案管理中的应用。病历档案医院管理的一种特殊档案形式,病历档案是医务人员对疾病的诊疗过程加以记录,从而形成有效的文献,记录患者发病、治疗过程中病情诊断以及护理和治疗,对患者发病治疗全过程予以系统记录,进而做出准确的治疗和护理质量评价,医院科研教学、临床诊治以及管理活动都不可缺少病历档案。医院工作实践中,可利用统计档案资料编制各类型的统计图表。比如,医院年份卫生统计资料汇编、年度住院患者病因分析表等;住院患者疾病分类报表、住院患者地区分布表,还可借助统计台账编制医疗质量统计表以及医技科室统计表等,还可根据医院实际开展相应的患者满意度调查,形成统计表,直观反映医院患者对医院的满意度和医院医疗水平状况。整理医疗质量分析表,如各临床科室的医疗质量分析、工作效率和效益对比台账,以及医院单病种费用统计等信息统计表,便于对各科室进行考核。同时,各科室结合住院患者人数、病床使用率、周转率、手术台次等统计信息,分析科室工作的效率和不足之处,从而做出调整和改进科室医疗水平。近年来社会上对档案的借阅频次也呈增长趋势,利用统计手段,将医院档案分类管理,条目清晰,形成年份、地区或者病种相应的档案卷,并借助现代化的查阅电子信息化系统,更好地服务于社会查阅。统计抽样方法在病历档案管理中应用广泛,即把研究对象视作总体,从中抽取部分个体,并开展调查研究,结合研究结果对总体特性予以评估推断。首先,入馆前抽样。病例档案在入馆前,采取非概率抽样鉴定法从大范围文件系列中择取最有价值文件;采用概率抽样鉴定法从某一个大文件中择取小部分文件。然而,工作量太大,实际操作复杂。比如医院每年肺炎感染患者资料的筛选,需要结合文件是否具有价值其而定,病历档案工作人员可以客观判断加上主观推断择取保留档案。对于诸如病例相似的手足口病患者的档案就不必全部保留,可结合需要抽取样本。这样既能抽取反映大文件重要特征的小部分文件,还能提升档案库房管理效率。其次,库房的抽样检查。对库房所藏案卷状况予以定期检查,掌握案卷使用、贮藏、保管等情况是否正常。由于库房盘点工作量大、病历档案多,运用统计学抽样方法可达到事半功倍效果。比如,医院库房一般按照年份和档案类别排架。那么年度排架可将同一年份中的档案排列,进而年份内依各部门或档案类型划分类目。根据档案类型排架则可以把同类别档案集中排列,进而依据部门或年份予以分类。这样便于后期的分层抽样等工作的开展,只需简单推断、使用合理的统计方法便可清楚得出案卷使用、贮藏、保管等情况。

(三)统计学在医院其他部门档案管理中的应用。对于医院的后勤服务同样离不开统计学方法,后勤部用统计数据和台账,可将洗衣房清洗工作服、被褥以及该科室相关信息统归成后勤工作表格,予以详细分类,便于提取各种数据、后勤服务质量的分析和评价,有条不紊地开展工作。同时,医院统计人员可运用统计数据向医院管理者清晰展示医院的财务报表,准确掌握医院的经济效益,进而调整提升医院的经营计划。然而,在医院档案管理中的统计学应用还存在不少问题:医院管理者对统计学在医院档案管理中的应用价值不够重视;工作人员专业技能和素质参差不齐;档案管理统计系统落后,等等。总之,合理应用统计学手段,可有效对医院人、财、物流动进行控制和分配,合理配置资源,提升医院工作质量和服务水平。在管理实践中重视其价值,加强统计工作人员的业务技能培训,提升专业水平,发挥档案管理系统的应有作用,确保医院档案管理工作的有效开展,促进医院的可持续健康发展。

【参考文献】

[1]马树才.统计抽样调查原理与方法[M].辽宁:辽宁大学出版社,1994(1).

[2]李素梅.医院人事统计及统计数据开发利用的探析[J].医学信息旬刊,2011,24(8):2187.

[3]王燕青.统计学在医院人力资源管理中的应用分析[J].中国外资,2014(10).

[4]王阳.电子病历是医院档案管理的发展趋势[J].中国卫生统计,2007,24(2):173.

[5]许杰,刘洪栋.加强医院统计档案管理的必要性[J].中国卫生统计,1990(5).

[6]杨伟,陈晓燕,金宪华等.统计档案在医院管理中的应用[J].中国医院统计,1999(3).

第15篇

1.1对象

选择截至调查时在虹口区居住满6个月及以上的15岁及以上常住居民为调查对象,排除聋哑人、妊娠期妇女和存在影响调查的认知障碍者。采取多阶段分层整群抽样的方法,以各街道居民数为比例进行PPS抽样,随机抽取4个街道,每个街道按照与人口规模成比例采用PPS法随机抽取4个居委会,对抽中的居委会按照地理位置划分为若干个户数大致相同(100户左右)的居民小组,采取整群随机抽样法抽取其中2个居民小组,每个被抽中的居民小组采用简单随机抽样法随机抽取27户作为调查户,被抽中的调查户用KISH表法确定1名15岁及以上常住居民进行调查。经过核对原始问卷,清洗整理并修正逻辑错误后,本次调查共收到有效问卷864份。

1.2方法

采取集中和入户相结合的方式对调查对象进行问卷调查、身体测量和血样采集。问卷由经过统一培训的调查员采取面对面询问方式收集信息。调查问卷内容包括吸烟、饮酒、饮食、身体活动、体重、血压、血糖、血脂、健康状况和主要慢性病患病情况等内容。采用统一的工具和方法进行身高、体重、腰围和血压测量,采集血样进行血糖、血脂及其他指标检测。

1.3诊断标准和定义

(1)超重/肥胖:按照《中国成年人超重和肥胖症预防控制指南》[3]标准,24kg/m2≤体重指数(BMI)<28kg/m2为超重,BMI≥28kg/m2为肥胖;中心型肥胖分为轻度组(男性85cm≤腰围(WC)<95cm,女性:80cm≤WC<90cm)和重度组(男性:WC≥95cm,女性:WC≥90cm);(2)高血压:根据《中国高血压防治指南2010》[4],收缩压(SBP)/舒张压(DBP)≥140/90mmHg(1mmHg=0.133kPa),或自报高血压患者;(3)糖尿病:根据《中国2型糖尿病防治指南(2010年版)》[5],空腹血糖≥7.0mmol/L,或餐后2小时血糖≥11.1mmol/L,或自报糖尿病患者;(4)血脂异常:根据《中国成人血脂异常防治指南》[6],总胆固醇(TC)≥6.22mmol/L,或甘油三酯(TG)≥2.26mmol/L,或高密度脂蛋白(HDL-C)<1.04mmol/L,或低密度脂蛋白(LDL-C)≥4.14mmol/L,或自报血脂异常者;(5)心脑血管疾病危险因素聚集:高血压、糖尿病和血脂异常同时存在2种或以上者。

1.4统计学分析

采取SPSS20.0软件进行数据清洗和分析。对样本进行抽样权重和事后分层权重调整,在复杂抽样模块下进行统计分析。连续变量的均值和标准差(x±s)采用复杂抽样模块的描述分析,分类变量的率及95%可信区间(95%CI)采用复杂抽样模块的频率分析,不同人群均值比较采用复杂抽样模块的一般线性模型,不同人群率的比较采用复杂抽样模块的交叉表χ2检验。

2结果

2.1调查对象基本情况

调查对象平均年龄(46.05±3.82)岁,男性和女性之间无统计学差异(P>0.05)。男性BMI、WC平均水平均高于女性,且差异具有统计学意义(P<0.05)。男性高血压和糖尿病患病率均高于女性,差异具有统计学意义(P<0.05),女性血脂异常患病率略高于男性,但未见统计学差异(P>0.05),见表1.

2.2超重与肥胖情况

调查对象超重率为35.45%,男性超重率高于女性(P<0.05);调查对象肥胖率为11.94%,男女性肥胖率无统计学差异(P>0.05);轻度中心性肥胖患病率为32.02%,男女性差异无统计学意义(P>0.05);重度中心性肥胖患病率为17.63%,男女性差异无统计学意义(P>0.05)。超重率、肥胖率、轻度中心性肥胖率及重度中心性肥胖率均随着教育程度提高呈下降趋势,但无统计学差异,见表2。BMI正常人群中仍有20.22%患有轻度和重度中心性肥胖,超重人群中有25.69%已经患有重度中心性肥胖,见表3。

2.3不同体重人群心脑血管病危险因素聚集情况

在超重/肥胖和中心性肥胖人群中,高血压、糖尿病及血脂异常患病比例明显增加。其中超重和肥胖人群同时具有3种危险因素的比例分别是正常BMI人群的2.97倍和3.17倍,轻、重度中心性肥胖人群同时具有3个危险因素的比例是非中心性肥胖人群的4.00倍和7.22倍。

2.4多因素分析

调整年龄、性别后,超重组和肥胖组同时聚集2种及以上危险因素的风险分别是BMI正常组的2.73倍和3.22倍,其中同时聚集3种危险因素(即同时患有高血压、糖尿病和血脂异常)的风险分别是BMI正常组的2.49倍和2.35倍;轻度中心性肥胖和重度中心型肥胖同时聚集2种及以上危险因素的风险分别是非中心性肥胖组的2.78倍和7.43倍,其中同时聚集3种危险因素的风险分别是非中心性肥胖组的2.82倍和3.89倍,见表4。

3讨论