前言:我们精心挑选了数篇优质大数据时代的数据分析文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词:大数据;数据分析;数据挖掘;体系建设
引言
进入21世纪以来,随着高新科技的迅猛发展和经济全球化发展的趋势,我国国民经济迅速增长,各行业、领域的发展也颇为迅猛,人们生活水平与日俱增,在物质生活得到极大满足的前提下,更加追求精神层面以及视觉上的享受,这就涉及到数据信息方面的内容。在经济全球化、科技一体化、文化多元化的时代,数据信息的作用和地位是不可小觑的,处理和归类数据信息是达到信息传递的基础条件,是发展各学科科技交融的前提。
然而,世界上的一切事物都包含着两个方面,这两个方面既相互对立,又相互统一。矛盾即对立统一。矛盾具有斗争性和同一性两种基本属性,我们必须用一分为二的观点、全面的观点看问题。同时要积极创造条件,促进矛盾双方的相互转变。数据信息在带给人们生产生活极大便利的同时,还会被诸多社会数据信息所困扰。为了使广大人民群众的日常生活更加便捷,需要其客观、正确地使用、处理数据信息,完善和健全数据分析技术和数据挖掘手段,通过各种切实可行的数据分析方法科学合理地分析大数据时代下的数据,做好数据挖掘技术工作。
1 实施数据分析的方法
在经济社会快速发展的背景下,我国在科学信息技术领域取得长足进步。科技信息的发展在极大程度上促进了各行各业的繁荣发展和长久进步,使其发展更加全面化、科学化、专业化,切实提升了我国经济的迅猛发展,从而形成了一个最佳的良性循环,我国也由此进入了大数据时代。对于大数据时代而言,数据分析环节是必不可少的组成部分,只有科学准确地对信息量极大的数据进行处理、筛选,才能使其更好地服务于社会,服务于广大人民群众。正确处理数据进行分析过程是大数据时代下数据分析的至关重要的环节。众所周知,大数据具有明显的优势,在信息处理的过程中,需要对大容量数据、分析速率,以及多格式的数据三大问题进行详细的分析和掌握。
1.1 Hadoop HDFS
HDFS,即分布式文件系统,主要由客户端模块、元数据管理模块、数据存储服务模块等模块组成,其优势是储存容量较大的文件,通常情况下被用于商业化硬件的群体中。相比于低端的硬件群体,商业化的硬件群体发生问题的几率较低,在储存大容量数据方面备受欢迎和推崇。Hadoop,即是分布式计算,是一个用于运行应用程序在大型集群的廉价硬件设备上的框架,为应用程序的透明化的提供了一组具有稳定性以及可靠性的接口和数据运动,可以不用在价格较高、可信度较高的硬件上应用。一般情况下,面对出现问题概率较高的群体,分布式文件系统是处理问题的首选,它采用继续运用的手法进行处理,而且还不会使用户产生明显的运用间断问题,这是分布式计算的优势所在,而且还在一定程度上减少了机器设备的维修和维护费用,特别是针对于机器设备量庞大的用户来说,不仅降低了运行成本,而且还有效提高了经济效益。
1.2 Hadoop的优点与不足
随着移动通信系统发展速度的不断加快,信息安全是人们关注的重点问题。因此,为了切实有效地解决信息数据安全问题,就需要对大量的数据进行数据分析,不断优化数据信息,使数据信息更加准确,安全。在进行数据信息的过程中,Hadoop是最常用的解决问题的软件构架之一,它可以对众多数据实行分布型模式解决,在处理的过程中,主要依据一条具有可信性、有效性、可伸缩性的途径进行数据信息处理,这是Hadoop特有的优势。但是世界上一切事物都处在永不停息地变化发展之中,都有其产生、发展和灭亡的历史,发展的实质是事物的前进和上升,是新事物的产生和旧事物的灭亡,因此,要用科学发展的眼光看待问题。Hadoop同其他数据信息处理软件一样,也具有一定的缺点和不足。主要表现在以下几个方面。
首先,就现阶段而言,在企业内部和外部的信息维护以及保护效用方面还存在一定的不足和匮乏,在处理这种数据信息的过程中,需要相关工作人员以手动的方式设置数据,这是Hadoop所具有的明显缺陷。因为在数据设置的过程中,相关数据信息的准确性完全是依靠工作人员而实现的,而这种方式的在无形中会浪费大量的时间,并且在设置的过程中出现失误的几率也会大大增加。一旦在数据信息处理过程中的某一环节出现失误,就会导致整个数据信息处理过程失效,浪费了大量的人力、物力,以及财力。
其次,Hadoop需求社会具备投资构建的且专用的计算集群,在构建的过程中,会出现很多难题,比如形成单个储存、计算数据信息和储存,或者中央处理器应用的难题。不仅如此,即使将这种储存形式应用于其他项目的上,也会出现兼容性难的问题。
2 实施数据挖掘的方法
随着科学技术的不断发展以及我国社会经济体系的不断完善,数据信息处理逐渐成为相关部门和人们重视的内容,并且越来越受到社会各界的广泛关注和重视,并使数据信息分析和挖掘成为热点话题。在现阶段的大数据时代下,实施数据挖掘项目的方法有很多,且不同的方法适用的挖掘方向不同。基于此,在实际进行数据挖掘的过程中,需要根据数据挖掘项目的具体情况选择相应的数据挖掘方法。数据挖掘方法有分类法、回归分析法、Web数据挖掘法,以及关系规则法等等。文章主要介绍了分类法、回归分析法、Web数据挖掘法对数据挖掘过程进行分析。
2.1 分类法
随着通信行业快速发展,基站建设加快,网络覆盖多元化,数据信息对人们的生产生活影响越来越显著。计算机技术等应用与发展在很大程度上促进了经济的进步,提高了人们的生活水平,推动了人类文明的历史进程。在此背景下,数据分析与挖掘成为保障信息安全的基础和前提。为了使得数据挖掘过程更好地进行,需要不断探索科学合理的方法进行分析,以此确保大数据时代的数据挖掘进程更具准确性和可靠性。分类法是数据挖掘中常使用的方法之一,主要用于在数据规模较大的数据库中寻找特质相同的数据,并将大量的数据依照不同的划分形式区分种类。对数据库中的数据进行分类的主要目的是将数据项目放置在特定的、规定的类型中,这样做可以在极大程度上为用户减轻工作量,使其工作内容更加清晰,便于后续时间的内容查找。另外,数据挖掘的分类还可以为用户提高经济效益。
2.2 回归分析法
除了分类法之外,回顾分析法也是数据挖掘经常采用的方法。不同于分类法中对相同特质的数据进行分类,回归分析法主要是对数据库中具有独特性质的数据进行展现,并通过利用函数关系来展现数据之间的联系和区别,进而分析相关数据信息特质的依赖程度。就目前而言,回归分析法通常被用于数据序列的预计和测量,以及探索数据之间存在的联系。特别是在市场营销方面,实施回归分析法可以在营销的每一个环节中都有所体现,能够很好地进行数据信息的挖掘,进而为市场营销的可行性奠定数据基础。
2.3 Web数据挖掘法
通讯网络极度发达的现今时代,大大地丰富了人们的日常生活,使人们的生活更具科技性和便捷性,这是通过大规模的数据信息传输和处理而实现的。为了将庞大的数据信息有目的性地进行分析和挖掘,就需要通过合适的数据挖掘方法进行处理。Web数据挖掘法主要是针对网络式数据的综合性科技,到目前为止,在全球范围内较为常用的Web数据挖掘算法的种类主要有三种,且这三种算法涉及的用户都较为笼统,并没有明显的界限可以对用户进行明确、严谨的划分。随着高新科技的迅猛发展,也给Web数据挖掘法带来了一定的挑战和困难,尤其是在用户分类层面、网站公布内容的有效层面,以及用户停留页面时间长短的层面。因此,在大力推广和宣传Web技术的大数据时代,数据分析技术人员要不断完善Web数据挖掘法的内容,不断创新数据挖掘方法,以期更好地利用Web数据挖掘法服务于社会,服务于人们。
3 大数据分析挖掘体系建设的原则
随着改革开放进程的加快,我国社会经济得到明显提升,人们物质生活和精神文化生活大大满足,特别是二十一世纪以来,科学信息技术的发展,更是提升了人们的生活水平,改善了生活质量,计算机、手机等先进的通讯设备比比皆是,传统的生产关系式和生活方式已经落伍,并逐渐被淘汰,新的产业生态和生产方式喷薄而出,人们开始进入了大数据时代。因此,为了更好地收集、分析、利用数据信息,并从庞大的数据信息中精准、合理地选择正确的数据信息,进而更加迅速地为有需要的人们传递信息,就需要建设大数据分析与挖掘体系,并在建设过程中始终遵循以下几个原则。
3.1 平台建设与探索实践相互促进
经济全球化在对全球经济发展产生巨大推力的同时,还使得全球技术竞争更加激烈。为了实现大数据分析挖掘体系良好建设的目的,需要满足平台建设与探索实践相互促进,根据体系建设实际逐渐摸索分析数据挖掘的完整流程,不断积累经验,积极引进人才,打造一支具有专业数据分析与挖掘水准的队伍,在实际的体系建设过程中吸取失败经验,并适当借鉴发达国家的先进数据平台建设经验,取其精华,促进平台建设,以此构建并不断完善数据分析挖掘体系。
3.2 技术创新与价值创造深度结合
从宏观意义上讲,创新是民族进步的灵魂,是国家兴旺发达的不竭动力。而对于数据分析挖掘体系建设而言,创新同样具有重要意义和作用。创新是大数据的灵魂,在建设大数据分析挖掘体系过程中,要将技术创新与价值创造深度结合,并将价值创造作为目标,辅以技术创新手段,只有这样,才能达到大数据分析挖掘体系建设社会效益与经济效益的双重目的。
3.3 人才培养与能力提升良性循环
意识对物质具有反作用,正确反映客观事物及其发展规律的意识,能够指导人们有效地开展实践活动,促进客观事物的发展。歪曲反映客观事物及其发展规律的意识,则会把人的活动引向歧途,阻碍客观事物的发展。由此可以看出意识正确与否对于大数据分析挖掘体系平台建设的重要意义。基于此,要培养具有大数据技术能力和创新能力的数据分析人才,并定期组织教育学习培训,不断提高他们的数据分析能力,不断进行交流和沟通,培养数据分析意识,提高数据挖掘能力,实现科学的数据挖掘流程与高效的数据挖掘执行,从而提升数据分析挖掘体系平台建设的良性循环。
4 结束语
通过文章的综合论述可知,在经济全球化趋势迅速普及的同时,科学技术不断创新与完善,人们的生活水平和品质都有了质的提升,先进的计算机软件等设备迅速得到应用和推广。人们实现信息传递的过程是通过对大规模的数据信息进行处理和计算形成的,而信息传输和处理等过程均离不开数据信息的分析与挖掘。可以说,我国由此进入了大数据时代。然而,就我国目前数据信息处理技术来看,相关数据技术还处于发展阶段,与发达国家的先进数据分析技术还存在一定的差距和不足。所以,相关数据分析人员要根据我国的基本国情和标准需求对数据分析技术进行完善,提高思想意识,不断提出切实可行的方案进行数据分析技术的创新,加大建设大数据分析挖掘体系的建设,搭建可供进行数据信息处理、划分的平台,为大数据时代的数据分析和挖掘提供更加科学、专业的技术,从而为提高我国的科技信息能力提供基本的保障和前提。
参考文献
[1]唐东波.基于神经网络集成的电信客户流失预测建模及应用[J].大众商务,2010(06).
[2]刘蓉,陈晓红.基于数据挖掘的移动通信客户消费行为分析[J].计算机应用与软件,2006(02).
[3]魏娟,梁静国.基于数据挖掘技术的企业客户关系管理(CRM)[J].商业研究,2005(07).
[4]田苗苗.数据挖掘之决策树方法概述[J].长春大学学报,2004(06).
[5]王晓佳,杨善林,陈志强.大数据时代下的情报分析与挖掘技术研究――电信客户流失情况分析[J].情报学报,2013.
[6]刘京臣.大数据时代的古典文学研究――以数据分析、数据挖掘与图像检索为中心[J].文学遗产,2015.
关键词:大数据时代 数据分析 理念 辨析
中图分类号:C8 文献标识码:A 文章编号:1674-098X(2017)01(c)-0136-02
近年来,对大数据的研究和应用已经受到我国各界人士的广泛关注,国家统计局已经把信息处理技术列为关键性的创新技术工程之一。随着我国大型计算机的迅速发展,处理大规模的复杂数据的能力逐渐提升,从这些大数据中提取有效信息的能力也逐步加强,毫无疑问,我国进入大数据时代的脚步将会进一步加快,人们将会感受到大数据时代下给其带来的生活、工作上的便利。
1 大数据和大数据时代简介
1.1 大数据
大数据是指远大于一般数据的巨量资料,需要人们通过全新的处理模式才能获取其中有价值的数据信息。“大数据”这一概念最早由维克托在《大数据时代》一书中引用得来,最开始对其定义为:不通过传统的随机分析方法直接对所有数据进行分析处理,主要有大量、高速、多样和价值4个特征。
大数据可以分为大数据技术、大数据工程、大数据科学和大数据应用等领域。目前受到最多应用的是大数据技术和大数据应用。人们通过收集数据,提取有效信息就可以为企业发展或者社会活动提供最有效的实施途径。因此,可以这样说,在大数据的王国里,最成功的企业就是那些善于运用机遇的公司。
1.2 大数据时代
大数据时代是建立在信息时代的基础上,通过互联网、物联网等渠道广泛搜集海量数据资源并对其进行存储、提取和展示。在大数据时代,几乎所有人都能够享受从任一数据中获得所需要的信息,大数据时代也具有社会性、广泛性、公开性和动态性4个特征。大数据时代的发展将会引领社会众多领域和行业的变革,对人类的生产、生活方式产生深远影响。
在大数据时代下,传统的数据分析思想已经不再适用,应该做出改变。首先,应该转变抽样思想,大数据时代下的样本即总体,已经不再依靠少量样本分析事物的相关规律;其次,要转变数据精确测量的思想,大数据时代要学会接受繁冗复杂的多样性数据;最后要转变探究事物的因果关系思想,转为研究事物的相关规律。以上思想的转变,均与统计学有关,因此,下面将分析大数据对统计学带来的具体影响。
2 大数据对统计学研究工作的影响
2.1 大稻莘岣涣送臣蒲У难芯慷韵
大数据影响的领域范围非常广泛,在大数据时代,不仅能够对以结构数据为度量单位的客观主体,还可以对不能用数据衡量关系的文本、图片、音像等非结构数据进行分析,大大扩展了传统统计学的研究范畴。
2.2 大数据影响统计学的工作进程
统计学是对所搜集的数据进行整理和归纳的方法论学科。大数据时代的资料十分丰富,分析数据已经不再需要抽取样本了,因为数据总体即是样本。此时,传统的统计学抽取样本分析的工作方法已经不再适用,而是被现代化通过传感器自动采集数据的方法所取代。
3 大数据时代下数据分析理念辨析
3.1 数据分析理念
传统的数据分析是指用统计学方法将收集的数据资料进行系列分析,以便最大化地开发数据中的功能,从中提取有价值的数据,再和未经处理的数据进行对比,发挥数据的作用。大数据时代下的数据分析,由于数据量非常大,数据本身的动态特性使人们要研究的数据难度加大,因此,大数据时代的数据分析一般利用统计学的理念,采用更广泛的方法统计和分析数据,以此摆脱对数据样本的依赖,也可以避免数据的流动性给分析结果带来的不确定性。大数据时代更加注重数据的增值分析工作,研究数据的未来走向,使其中有价值的数据可以增值,将有效数据有机整合,能够及时发现问题和解决问题。
3.2 数据分析的主要程序
3.2.1 数据整理
统计数据的整理主要分为4个步骤:审核统计资料、对资料进行分组、汇总和编制统计表格或图表、保管和公布。当统计对象为数据资料庞大、类型复杂、要求处理速度快的大数据时,这些步骤就显得繁冗了,尤其是图表的绘制是没办法实现的,因此,只需要对资料进行审核和存储。大数据的审核和存储不同于传统意义上的数据审核和保存,大数据时代利用先进的现代化工具进行数据的审核和保存。
3.2.2 数据的开发
传统数据的样本量较小,目的主要着眼于解决问题,数据的时效性较强,数据的使用价值会随时间流逝而降低。而大数据的流动性很强,随着时间的推移会越来越壮大,而且具有推陈出新、价值重塑的可能,因此,在大数据时代,数据是会不断增值的,开发大数据,是一项有重要意义的工作。
3.2.3 数据的应用
其中分别对教育、运输、消费品、电力、石油与天然气、医疗护理、消费金融等进行分析和预测。根据这些行业的特点,可以总结出大数据挖掘商业价值的基本方法为:客户群体细分,为每个群体量定特别的服务;模拟现实环境,发掘新的需求的同时提高投资的回报率;降低部门联系,提高整条管理链条和产业链条的效率;降低服务成本,发现隐藏线索产品和服务的创新。从图1中可以看出,大数据的应用群体十分广泛,能否对获取的数据及时、迅速处理,对该行业的发展具有重要意义。
4 结语
该文主要对大数据时代下数据分析理念进行了相关的分析和研究。首先对大数据及大数据时代的概念做了简要阐述,接着分析了大数据对统计学的两点影响,最后分析了大数据时代下的数据分析理念。总而言之,在现代社会,大数据的应用已经成为时代新的特征,能否从海量数据中提取有价值的信息做出相应的预测,对于企业或者个人的发展具有重要意义。
参考文献
关键词:大数据时代;大数据;统计学;数据分析
引言:
目前阶段,在计算机处理技术不断发展的背景下,在对规模较大并且较为复杂的数据进行处理过程中,人们已经逐渐掌握了方法与技能,并且能够在大规模的数据中找出具有一定价值的信息,所以,大数据时代已经来临。在数据时代中,在人文社科与人类自然科学技术等方面都会有较大的发展,同时也会一定程度上改变人们的生活与工作方式。除此之外,大数据时代也同样为统计学提供了良好的发展机会,但也存在一定的挑战。
一、大数据时代的概念
大数据时代的提出者是麦肯锡,他认为数据已经逐渐进入到各个行业与各业务职能的领域中,并且逐渐成为了主要的生产因素[1]。因此,人们在对大规模数据进行挖掘与应用的过程,也就意味着新的生产率增长的来临。虽然“大数据”在众多行业被广泛应用,但是,特别是在信息与互联网的领域中应用突出。
二、怎样理解大数据
(一)大数据概念界定与构成
大数据,即由于日常产生的数据量快速增长,使得数据库无法利用相应的管理工具对其进行管理与收集,最终导致在进行搜索、分析、存取、共享数据时具有较大的困难。
大数据的构成包括四部分,并将其总结为4V,即Volume,Variety,Value,Velocity[2]。第一部分是价值密度低,将视频作为具体实例来说,实现连续并且不间断的监控,其中有价值的数据信息只有一两秒。第二部分是数据体量极大,已经从TB实现了PB的跃升。第三部分是数据类型众多,主要包括视频、图片、网络日志以及地理信息等。第四部分是处理的速度超快,可以用一秒定律来解释。
(二)海量数据带来哪些挑战
第一,数据存储。由于大数据的数据规模是PB级别,所以,存储的系统也需要进行等级的拓展,并且可以通过磁盘柜或者是增加模块实现容量的增加。然而,目前阶段,数据的增长速度惊人,所以系统资源的消耗也不断增加,导致系统的运行效率有所下降[3]。因为对海量数据始终停留在分布式的存储阶段,所以,对于爆炸式的数据增长,原有的存储方案已经无法满足现有的数据变化需求。
第二,处理技术。由于海量数据的分布性与数据量与以往存在较大的差异,所以,原有的数据管理技术已经处于落后状态。
第三,数据安全。在互联网规模逐渐扩大的情况下,数据的应用已经出现指数级别的增长,所以,对于数据安全的保护与监控来说具有一定的难度。
(三)大数据相关应用与实践
第一,体育赛事应用。以2014年的世界杯为例,在充分发挥记者与编辑敏锐度的基础上,腾讯也利用对大数据的分析以及云计算等方式来为为其提供移动与社交的数据。与此同时,腾讯与IBM进行合作,并通过文化、赛事与球迷三方面来对世界杯球迷的关注重点进行信息的挖掘,进而实现新栏目的创作,并且在短时间内赢得了广大球迷的认可与关注。
第二,产品推荐应用。产品推荐的应用比较广泛,可以对客户信息、交易历史、购买过程等数据进行全面的分析,并进行有价值信息的挖掘。同时,针对同一产品的不同客户访问信息也可以进行挖掘。最终,通过对客户行为的分析,来确定消费者的共,这样就可以更好的为客户推荐产品。
除此之外,在产品推荐中,可以在对客户社交行为进行信息挖掘与分析的基础上来进行社区的营销。对客户微信微博以及社区活动中的偏好数据进行分析,并为其提供符合客户兴趣爱好的产品。
图一
三、如何分析大数据
(一)如何挖掘数据中价值
以匹配广告为具体事例进行分析,主要有两种数据。第一种是广告库,其中包括广告库以及广告的客户信息[4]。但是这种数据信息比较适合在传统数据库中应用。第二种是用户在观看广告后的行为。可以把以上两种数据进行有效的结合,并通过相应的算法来体现价值。在实践应用过程中,可以充分体会到第二种信息的重要作用。可以为用户提供其所需的信息,并通过群体智能以及群体行为对之前用户使用的效果进行分析,最终通过具体的反馈机制,将最优质的信息提供给用户,还可以进行搜索或者是查询信息。
(二)如何做处理与分析
第一,更新抽样调查的工作理念。由于大数据时代的数据样本是以往资料综合,所以,可以对相关事务的数据信息进行分析,进一步对总体进行了解,还可以更好的了解局部。同时需要解决以下问题:抽样框架不稳定,调查目的设定不合理、样本量受限[5]。第二,积极改变对于数据精确度的标准。在大数据时代的背景下,数据的来源比较广泛,并且对数据进行处理的技术也有所提高,所以,可以允许数据存在不准确的情况。大数据时代需要吸收多种数据,但并需要一味的要求数据精准。第三,合理转变数据关系的分析重点。由于大数据时代的数据规模比较大,而且结构也十分复杂,变量的关系也比较繁杂。所以,在对数据进行分析的过程中,不应该对因果关系进行仔细的分析,而重要的是对事物相关的关系进行分析。需要转换思路,对事物关系的形式与目的进行详细的分析。
四、 大数据对统计学科和统计研究工作的影响
(一) 拓展统计学研究领域
因为大数据时代的到来,所以会对各个领域产生一定的影响,同样给统计学带来影响。在统计学中,其主要的研究对象就是其所要认识的客体,是客观存在事物自身的数量特征与关系。其中,统计学研究对象最主要的特点就是数量性。然而,在传统的统计学当中,数据主要是试验与调查的数值。在大数据时代中,统计研究的对象不仅包括以结构数据度量的数量,此外,还可以包括一些无法用数量关系进行衡量的半结构与非结构数据,其中可以包括动画、图片、声音、文本等等[6]。所以,可以说,在大数据时代背景下,统计学的研究对象领域有所扩大。
(二) 对统计计算规范产生影响
在传统的统计学当中,一般是使用方差、平均数以及相对数等数据计算规范来真实反映事物量特征的,同时还可以反映事物量的关系与界限,能够通过数据计算规范来计算出具体的数值。但是,半结构与非结构的数据是无法通过传统数据计算规范进行计算的[7]。所以,在大数据时代的背景下,传统的数据计算规范也同样遇到了难题。
(三) 对统计研究工作的过程产生影响
1. 数据整理和分析
第一,数据审核。原有的数据审核主要的目的就是对数据准确性和完整性进行严格的检查。但是,在大数据的时代中,对数据的审核就必须要确保数据处理的速度以及预测的准确程度,同时还需要对数处理的规模进行准确的确定,也就是数据量级别的确定。除此之外,因为大数据自身具有不稳定性,并且十分混乱。但是,即使是这样,大数据也能够挖掘出信息内部存在的隐蔽关系以及有价值的知识。所以,大数据所反映的研究对象存在准确与不准确两种,但是,任何一种的数据都具有一定的价值,通常情况下是不需要进行替换或者是删除的[8]。
第二,数据存储。在以往的数据存储中,审核、汇总以及编制的图表等资料是重点资料,并且需要进行保存起来的。然而,大数据保存最主要的目的就是对存储的成本进行有效的控制,同时需要根据相应的法规计划来确定数据存储的规模。
2. 数据积累、开发与应用
第一,数据积累。传统统计工作主要是根据所制定的研究目的来对数据进行汇总与分类,并进行保存,这样可以更好的为后期数据的分析与查询提供有利的条件。但是,在大数据的积累中,具有价值的信息需要对大数据进行处理后才可以发现。不容置疑,大数据具有一定的复杂性,所以,在积累的过程中,不可以进行简单的处理。因为大数据的规模大,结构也比较复杂,无法实现简单的分类,而且,在对大数据进行简单整理时非常容易使其混乱,对其真实性产生影响,可能会丢失具有价值的信息。
第二,数据开发。大数据时代下的数据流动性极强,所以,其自身的价值有再生性。因此,大数据时代的数据不会贬值,反而会增值。为了能够对所研究的对象进行更深入的了解,就需要对其整合。
第三,数据应用。对数据的传统应用主要是为了对现象进行解释与预测。但是,在大数据时代,数据应用的核心就是在相关关系前提下的预测。
结语
综上所述,现阶段我国社会正处于大数据时代,并且对于社会未来的发展具有重要的意义。文章对大数据时代的概念与定义以及构成进行了阐述与分析,同时,对大数据的实际应用与实践进行了探讨。针对大数据价值的挖掘与分析处理进行了研究,最后列举了大数据对统计学科以及统计研究工作的影响,进而对今后大数据的数据分析工作提供了有价值的理论依据,并积极的推动了大数据时代的发展,进一步促进了社会的进步。(作者单位:中国人民大学)
参考文献:
[1]朱建平,章贵军,刘晓葳等.大数据时代下数据分析理念的辨析[J].统计研究,2014,31(2):10-19.
[2]张学敏.大数据时代的数据分析[J].电子世界,2014(16):5-5,6.
[3]李祥歌,王奇奇,郭轶博等.基于大数据时代的数据挖掘及分析[J].电子制作,2015(3):81-81.
[4]刘江娜.大数据时代:为什么数据分析能让你的企业脱颖而出[J].环球市场信息导报,2014(36):92-93.
[5]郭华庚,向礼花.大数据时代网络信息归档的元数据分析[J].贵州师范学院学报,2015,31(3):24-28.
[6]高书国.大数据时代的数据困惑――教育研究的数据困境[J].教育科学研究,2015(1):24-30.