美章网 精品范文 统计学抽样方法范文

统计学抽样方法范文

前言:我们精心挑选了数篇优质统计学抽样方法文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

统计学抽样方法

第1篇

关键词:高中数学;数学统计学;现代经济

统计学是发现社会数量关系的一项重要数学工具,不管是对现代经济的发展还是对高中数学的学习都要依靠通过统计学计算出科学的信息数据。统计学在现代经济发展中涉及到许多方面:预测、评估、分类等相关领域。同时,在现代经济的发展中,也对统计方法、统计分析提出了相关要求。不管是为了自身提高学习成绩,还是为了促进现代经济的发展,高中阶段的统计学学习尤为重要[1]。

一、统计学对现代经济发展的益处

高中统计学对现代经济的益处主要体现在以下几个点:第一,解决经济学问题,高中数学统计学对现代经济发展其至关重要的作用,对于一些实际经济问题通过建立数学模型、运用高中数学统计方法、分析计算、最后得出结论。这些结论不仅可以预测现代经济的未来走向,还可以为相应的经济类工程项目提供参考。在现代经济发展中统计学的应用及其广泛,人们对于经济活动的评估方式也由定性向定量转变。高中数学统计学的应用,可以使現代经济科学化、合理化。应用高中数学统计学可以让经济的风险控制在一个合理范围内。

二、高中数学统计学的应用

统计学是高中数学必修课。通过对高中数学统计学的学习,可以让高中生的数学逻辑思维更加敏捷,思考问题的方式更加严谨,让学生达到全面发展。一方面,通过统计学的学习,为高中生未来的工作、生活提供了诸多便利;另一方面,可为日后的现代经济发展做出贡献。高中数学统计学的应用,可以通过以下两个方法来进行。

(一)抽样

抽样法由系统抽样、分层抽样等方面构成。系统抽样,在抽样的过程中,需要将总体分成若干部分,从每一小部分中进行抽取。例如,某学校要了解高中生的身高状况,依据1∶20的比例抽取样本,把高中生看作一个整体,依据1∶20的比例抽取样本,则要将所有高中生按整体分为20个部分,这样的分法符合系统抽样的应用条件,进而使用系统抽样法来解决生活中在校调查学生身高的问题。分层抽样,例如,某学校高一学生总数500人,高二学生人数总计400人,高三学生人数总350人,要调查3个年级学生对学校规章制度的看法,依据1∶9的比例抽取样本,这些学生是3个不同的年级,可划分为3个部分,依据既定比例抽取,各年级学生对应抽取的人数也会不同,这问题要求与分层抽样法的理念基本一致,因而对于这类问题要用分层抽样的方法来解决。

(二)样本估计

样本估计是统计学中最常见的,对样本估计的学习最主要的是提高对样本数量的认识,样本数量与估计值准确率相互关联,即样本数量越多,则估计值越准确。例如:某一整体可划分为60个个体,将各个个体进行1~60的编号,同时将它们划分为6个小组,组号分别为1~6,如果运用系统抽样抽取容量为6的样本,首次抽取个体号码为A,在第B次抽取时,个体号码个位数与A+B个位相一致,请问若A=3时,第5组号码为多少?经分析可得出,在A=3时,第B次抽取的个体号码个位数为A+B,由此表明第5组号码的个位数为3,再结合样本估计知识,便可得出具体的号码数字。由此可见,利用统计学解决生活中的实际问题无处不在,只有牢记相关的概念、方法,才能准确无误地解决问题。

第2篇

关键词:大数据;统计学;数据分析;抽样理论;理论

重构随着信息科学技术的高速度发展,当代获取和储存数据信息的能力不断增强而成本不断下降,这为大数据的应用提供了必要的技术环境和可能.应用大数据技术的优势愈来愈明显,它的应用能够帮助人类获取真正有价值的数据信息.近年来,专家学者有关大数据技术问题进行了大量的研究工作[1],很多领域也都受到了大数据分析的影响.这个时代将大数据称为未来的石油,它必将对这个时代和未来的社会经济以及科学技术的发展产生深远的意义和影响.目前对于大数据概念,主要是从数据来源和数据的处理工具与处理难度方面考虑,但国内外专家学者各有各的观点,并没有给出一致的精确定义.麦肯锡全球数据分析研究所指出大数据是数据集的大小超越了典型数据库工具集合、存储、管理和分析能力的数据集,大数据被Gartner定义为极端信息管理和处理一个或多个维度的传统信息技术问题[23].目前得到专家们认可的一种观点,即:“超大规模”是GB级数据,“海量”是TB级数据,而“大数据”是PB及其以上级别数据[2].

一些研究学者把大数据特征进行概括,称其具有数据规模巨大、类型多样、可利用价值密度低和处理速度快等特征,同时特别强调大数据区别于其他概念的最重要特征是快速动态变化的数据和形成流式数据.大数据技术发展所面临的问题是数据存储、数据处理和数据分析、数据显示和数据安全等.大数据的数据量大、多样性、复杂性及实时性等特点,使得数据存储环境有了很大变化[45],而大部分传统的统计方法只适合分析单个计算机存储的数据,这些问题无疑增加了数据处理和整合的困难.数据分析是大数据处理的核心过程,同时它也给传统统计学带来了巨大的挑战[6].产生大数据的数据源通常情况下具有高速度性和实时性,所以要求数据处理和分析系统也要有快速度和实时性特点,而传统统计分析方法通常不具备快速和实时等特点.基于大数据的特点,传统的数据统计理论已经不能适应大数据分析与研究的范畴,传统统计学面临着巨大的机遇与挑战,然而为了适应大数据这一新的研究对象,传统统计学必须进行改进,以继续和更好的服务于人类.目前国内外将大数据和统计学相结合的研究文献并不多.本文对大数据时代这一特定环境背景,统计学的抽样理论和总体理论的存在价值、统计方法的重构及统计结果的评价标准的重建等问题进行分析与研究.

1传统意义下的统计学

广泛的统计学包括三个类型的统计方法:①处理大量随机现象的统计方法,比如概率论与数理统计方法.②处理非随机非概率的描述统计方法,如指数编制、社会调查等方法.③处理和特定学科相关联的特殊方法,如经济统计方法、环境科学统计方法等[7].受收集、处理数据的工具和能力的限制,人们几乎不可能收集到全部的数据信息,因此传统的统计学理论和方法基本上都是在样本上进行的.或者即使能够得到所有数据,但从实际角度出发,因所需成本过大,也会放弃搜集全部数据.然而,选择最佳的抽样方法和统计分析方法,也只能最大程度还原总体一个特定方面或某些方面的特征.事实上我们所察觉到的数据特征也只是总体大量特征中的一小部分,更多的其他特征尚待发掘.总之,传统统计学是建立在抽样理论基础上,以点带面的统计分析方法,强调因果关系的统计分析结果,推断所测对象的总体本质的一门科学,是通过搜集、整理和分析研究数据从而探索数据内部存在规律的一门科学.

2统计学是大数据分析的核心

数的产生基于三个要素,分别是数、量和计量单位.在用数来表示事物的特征并采用了科学的计量单位后,就产生了真正意义上的数据,即有根据的数.科学数据是基于科学设计,通过使用观察和测量获得的数据,认知自然现象和社会现象的变化规律,或者用来检验已经存在的理论假设,由此得到了具有实际意义和理论意义的数据.从数据中获得科学数据的理论,即统计学理论.科学数据是通过统计学理论获得的,而统计学理论是为获得科学数据而产生的一门科学.若说数据是传达事物特征的精确语言,进行科学研究的必备条件,认知世界的重要工具,那么大数据分析就是让数据最大限度地发挥功能,充分表达并有效满足不同需求的基本要求.基于统计学的发展史及在数据分析中的作用,完成将数据转化为知识、挖掘数据内在规律、通过数据发现并解决实际问题、预测可能发生的结果等是研究大数据的任务,而这必然离不开统计学.以大数据为研究对象,通过数据挖掘、提取、分析等手段探索现象内在本质的数据科学必须在继承或改进统计学理论的基础上产生.

统计数据的发展变化经历了一系列过程,从只能收集到少量的数据到尽量多地收集数据,到科学利用样本数据,再到综合利用各类数据,以至于发展到今天的选择使用大数据的过程.而统计分析为了适应数据可观察集的不断增大,也经历了相应的各个不同阶段,产生了统计分组法、大量观察法、归纳推断法、综合指标法、模型方程法和数据挖掘法等分析方法,并且借助计算机以及其他软件的程度也越来越深.300多年来,随着数据量以指数速度的不断增长,统计学围绕如何搜集、整理和分析数据而展开,合理构建了应用方法体系,帮助各个学科解决了许多复杂问题.现在进入了大数据时代,统计学依旧是数据分析的灵魂,大数据分析是数据科学赋予统计学的新任务.对于统计学而言,来自新时代的数据科学挑战有可能促使新思想、新方法和新技术产生,这一挑战也意味着对于统计学理论将面临巨大的机遇.

3统计学在大数据时代下必须改革

传统统计学是通过对总体进行抽样来搜索数据,对样本数据进行整理、分析、描述等,从而推断所测对象的总体本质,甚至预测总体未来的一门综合性学科.从研究对象到统计结果的评判标准都是离不开样本的抽取,完全不能适应大数据的4V特点,所以统计学为适应大数据技术的发展,必须进行改革.从学科发展角度出发,大数据对海量数据进行存储、整合、处理和分析,可以看成是一种新的数据分析方法.数据关系的内在本质决定了大数据和统计学之间必然存在联系,大数据对统计学的发展提出了挑战,体现在大样本标准的调整、样本选取标准和形式的重新确定、统计软件有待升级和开发及实质性统计方法的大数据化.但是也提供了一个机遇,体现在统计质量的提高、统计成本的下降、统计学作用领域的扩大、统计学科体系的延伸以及统计学家地位的提升[7].

3.1大数据时代抽样和总体理论存在价值

传统统计学中的样本数据来自总体,而总体是客观存在的全体,可以通过观测到的或经过抽样而得到的数据来认知总体.但是在大数据时代,不再是随机样本,而是全部的数据,还需要假定一个看不见摸不着的总体吗?如果将大数据看成一个高维度的大样本集合,针对样本大的问题,按照传统统计学的方法,可以采用抽样的方法来减少样本容量,并且可以达到需要的精度;对于维度高的问题,可以采取对变量进行选择、降维、压缩、分解等方法来降低数据的复杂程度.但实际上很难做得到,大数据涵盖多学科领域、多源、混合的数据,各学科之间的数据融合,学科边界模糊,各范畴的数据集互相重叠,合成一体,而且大数据涉及到各种数据类型.因此想要通过抽样而使数据量达到传统统计学的统计分析能力范围是一件相当困难或是一件不可能的事.大量的结构数据和非结构数据交织在一起,系统首先要认清哪个是有价值的信息,哪个是噪声,以及哪些不同类型的数据信息来自于同一个地址的数据源,等等,传统的统计学是无法做到的.在大数据时代下,是否需要打破传统意义的抽样理论、总体及样本等概念和关系,是假设“样本=总体”,还是“样本趋近于总体”,还是不再使用总体和样本这两个概念,而重新定义一个更合适的概念,等等.人们该怎样“安排”抽样、总体及样本等理论,或人们该怎样修正抽样、总体、样本的“公理化”定义,这个问题是大数据时代下,传统统计学面临改进的首要问题.

3.2统计方法在大数据时代下的重构问题

在大数据时代下,传统的高维度表达、结构描述和群体行为分析方法已经不能精确表达大数据在异构性、交互性、时效性、突发性等方面的特点,传统的“假设-模型-检验”的统计方法受到了质疑,而且从“数据”到“数据”的统计模式还没有真正建立,急切需要一个新的理论体系来指引,从而建立新的分析模型.去除数据噪声、筛选有价值的数据、整合不同类型的数据、快速对数据做出分析并得出分析结果等一系列问题都有待于研究.大数据分析涉及到三个维度,即时间维度、空间维度和数据本身的维度,怎样才能全面、深入地分析大数据的复杂性与特性,掌握大数据的不确定性,构建高效的大数据计算模型,变成了大数据分析的突破口.科学数据的演变是一个从简单到复杂的各种形式不断丰富、相互包容的过程,是一个循序渐进的过程,而不是简单的由一种形式取代另一种形式.研究科学数据的统计学理论也是一样,也是由简单到复杂的各种形式相互包容、不断丰富的发展过程,而绝不是完全否定一种理论、由另一种理论形式所代替.大数据时代的到来统计学理论必须要进行不断的完善和发展,以适应呈指数增长的数据量的大数据分析的需要.

3.3如何构建大数据时代下统计结果的评价标准框架

大数据时代下,统计分析评价的标准又该如何变化?传统统计分析的评价标准有两个方面,一是可靠性评价,二是有效性评价,然而这两种评价标准都因抽样而生.可靠性评价是指用样本去推断总体有多大的把握程度,一般用概率来衡量.可靠性评价有时表现为置信水平,有时表现为显著性水平[8].怎么确定显著性水平一直是个存在争议的问题,特别是在模型拟合度评价和假设检验中,因为各自参照的分布类型不一样,其统计量就不一样,显著性评价的临界值也就不一样,可是临界值又与显著性水平的高低直接相关.而大数据在一定程度上是全体数据,因此不存在以样本推断总体的问题,那么在这种情况下,置信水平、可靠性问题怎么确定?依据是什么?有效性评价指的是真实性,即为误差的大小,它与准确性、精确性有关.通常准确性是指观察值与真实值的吻合程度,一般是无法衡量的,而精确性用抽样分布的标准差来衡量.显然,精确性是针对样本数据而言的,也就是说样本数据有精确性问题,同时也有准确性问题.抽样误差和非抽样误差都可能存在于样本数据中,抽样误差可以计算和控制,但是非抽样误差只能通过各种方式加以识别或判断[910].大多数情况下,对于样本量不是太大的样本,非抽样误差可以得到较好的防范,然而对于大数据的全体数据而言,没有抽样误差问题,只有非抽样误差问题,也就是说大数据的真实性只表现为准确性.但是由于大数据特有的种种特性,使得大数据的非抽样误差很难进行防范、控制,也很难对其进行准确性评价.总之,对于大数据分析来说,有些统计分析理论是否还有意义,确切说有哪些统计学中的理论可以适用于大数据分析,而哪些统计学中的理论需要改进,哪些统计学中的理论已不再适用于大数据统计研究,等等,都有待于研究.所以大数据时代的统计学必是在继承中求改进,改进中求发展,重构适应大数据时代的新统计学理论.

4结论

来自于社会各种数据源的数据量呈指数增长,大数据对社会发展的推动力呈指数效应,大数据已是生命活动的主要承载者.一个新事物的出现,必然导致传统观念和传统技术的变革.对传统统计学来说,大数据时代的到来无疑是一个挑战,虽然传统统计学必须做出改变,但是占据主导地位的依然会是统计学,它会引领人类合理分析利用大数据资源.大数据给统计学带来了机遇和挑战,统计学家们应该积极学习新事物,适应新环境,努力为大数据时代创造出新的统计方法,扩大统计学的应用范围.

参考文献:

[1]陈冬玲,曾文.频繁模式挖掘中基于CFP的应用模型[J]沈阳大学学报(自然科学版),2015,27(4):296300.

[3]卞友江.“大数据”概念考辨[J].新闻研究导刊,2013,35(5):2528.

[5]靳小龙,王元卓,程学旗.大数据的研究体系与现状[J].信息通信技术,2013(6):3543.

[6]覃雄派,王会举,杜小勇,等.大数据分析:Rdbms与Mapreduce的竞争与共生[J].软件学报,2012,23(1):32-45.

[7]游士兵,张佩,姚雪梅.大数据对统计学的挑战和机遇[J].珞珈管理评论,2013(2):165171.

[8]李金昌.大数据与统计新思维[J].统计研究,2014,31(1):1017.

第3篇

一、国内文献综述

笔者通过对一些高校统计学课程调查及知网搜集资料,发现很多讲授统计学的教师认为传统统计学教学内容、方法很难适应现代社会的需求。通过资料搜集和文献查找,如何更好的编排统计的教学内容和运用更好的教学方法主要体现在以下几方面:石秀丽(2011)学者认为根据经管类学生的特点应把统计方法、数量分析作为教学内容的重点,李慧敏(2016)等学者认为对经管类统计学的教学应激发学生的学习兴趣,大量的引入现实生活中的典型案例进行教学;宋继华(2013)等学者认为采用项目驱动方法教学能引导学生的思维,从而提高学生的积极性和应用能力。这些专家学者对统计学的教学内容都提出了创新性的研究,尤其是高职高专对经管类学生的统计学教学很多高校都采用了项目驱动的模式。

二、教学内容和教学方法创新

我国经济快速发展,很多决策都需要数据来支撑,统计方法及数据分析应用越来越广泛,并应用于管理、金融等领域,而今天又处于大数据时代,因此,掌握统计方法和数量分析的专业人才成为时下的新宠。所以,在经管类统计学教学中,我们必须大刀阔斧地改革传统统计学的教学内容、教学方法成为高校经管类统计学改革的重要课题。

1.教学内容编排上增加统计实务部分。统计学原理的内容主要包括总论、统计调查、统计整理、综合指标、动态数列分析、指数分析、抽样推断、相关分析等内容,这些内容主要是基本理论知识,针对当前社会需求和统计变化的特点,应该加大统计实务部分的内容,可以适当增加企业统计标准(常用统计标准)、主要统计指标(采购经理指数、消费信心指数等)、企业主要统计报表(生产活动统计)、国民经济核算体系、统计报告撰写(统计报告写作要求、原则、流程)等内容。

2.教学过程中引入实验教学。统计学教学过程中运用到大量的公式,主要是定量的分析,在传统教学中比较侧重这些公式的推导、计算。但在信息技术高速发达的今天,计算机统计软件的广泛应用,使计算变得更加简单、准确。因此,在统计教学过程中,统计计算技术已经不是教学的重点。由于大量复杂的计算可以交给计算机去完成,统计学教学应从数据技巧教学转向数据整理分析的训练,统计教学中适当增加实验教学,把统计方法与计算机的应用紧密结合,实现统计学教材的内容与EXCEL的应用全面结合。在一些章节可以专门增加一节内容,介绍如何用EXCEL实现本章数据处理问题,例如:在讲解统计整理、总量指标与相对指标、动态数列、统计指数、抽样调查、相关和回归分析时都可以借助于EXCEL来进行数据处理、分析。还可以利用计算机SPSS软件对回归分析和相关分析进行分析,利用计算机对平均数和标准差中等内容进行处理。通过实验教学可以在一定程度上改变学生统计思想,同时帮助其掌握一定的软件应用技能,如EXCEL、SPSS、SAS等。

3.引入综合案例教学法。案例教学在国外课程教学中运用较多,因为案例来源于生活,更能引起学生的学习兴趣,在传统统计学教学中也引入了一些案例,但这些案例大都是孤立的只是为了学习某个知识点而设定,这些案例并不是真实的案例,而且缺乏前后因果,与实际生活脱钩,学生学起来就没有深刻的记忆和兴趣。针对这种情况,在统计学课程教学中可以引入现实生活中实际发生的案例,将统计计算方法与数据分析方法用到解决实际管理问题中去,这样可以使教学效果事半功倍。例如:在综合指标这部分内容就可以设定某个企业的实际案例,通过这个案例可以解决总量指标、相对指标和平均指标的计算应用。

4.图表归纳教学法。统计学第一章内容是学习整个统计学的基础,只有把统计学的一些基本概念学懂了,才能更好的学习以后的内容,可是很多学生学了第一章以后对这些概念之间的关系还是模糊,为了解决这些问题设疑解惑,不断启疑思导,经过苦心孤诣,可以把这些基本概念编成如图1。

通过框图,可以把这些抽象的名称联系在一起,然后层次加以剖析,提纲挈领地板书这些名词的特点与作用,用形象生动的比喻语言说明各概念之间的联系和异同。采用这样直观清晰的框图教学,让学生一目了然,分析清楚这些概念之间的区别与联系,便于学生的理解与记忆。在讲完第四、五、六章后也总结归纳如图2。