美章网 精品范文 数据分析方向范文

数据分析方向范文

前言:我们精心挑选了数篇优质数据分析方向文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

数据分析方向

第1篇

关键词:大数据 统计专业 核心

中图分类号:G632 文献标识码:A 文章编号:1674-2117(2014)10-0008-02

1 大数据的统计涵义

通常来说,凡是数据量超过一定大小,导致常规软件无法在一个可接受的时间范围内完成对其进行抓取、管理和处理工作的数据即可称为大数据。业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征:数据体量巨大、数据类型繁多、价值密度低、处理速度快。

大数据潮流让我们获得了海量的数据,数据已经成为相关行业创造价值的重要资源。因此,许多IT企业和互联网企业都已将业务范围延伸至大数据产业,探索大数据驱动的业务模式。2012年,美国政府投资2亿美元启动的“大数据研究和发展计划”,更是将大数据的研究上升到国家战略层面。然而,大数据的真正意义不在于数据量的巨大,而在于对数据信息进行专业化的处理,核心是对数据进行分析。面对大数据,越来越多的领域都开始运用数学特别是统计学的工具,挖掘大数据中真正蕴藏的价值。正如西内启在《看穿一切数字的统计学》书中所指出的,“从数据中得出有意义的结果,关键在于控制和减少误差,得出因果关系,单纯收集数据并加以全部量化分析在很多情况下会得出谬误结果,”而科学的统计学方法是得出因果关系的最佳方法。

从统计学角度看,一方面,大数据具有类型繁多、结构复杂、体量巨大等特点,海量数据以分布式方式进行存储,特别是图片、音频、视频等非结构化数据的广泛存在,传统的统计方法和统计分析工具已无法满足大数据分析的需要,亟需统计方法的革新。另一方面,数据分析结果需要用生动、直观、容易被接受的方式展示给读者,可视化分析能够直观地呈现大数据的特点,阐释数据与数据之间的联系。因此,统计学要挺立大数据潮头,创新统计分析工具、可视化分析方法,以大数据的挖掘和应用为核心,将传统文本、图像的统计、分析向数据分析转变,以适应大数据时代的发展及其对统计学带来的挑战。

2 大数据时代统计学教育面临的挑战与应对

据互联网数据中心(Internet Data Center)预测,中国大数据技术与服务市场将会从2011年的7760万美元快速增长到2016年的6.16亿美元,而据业界专家估算,中国大数据市场的人才需求量至少为100万人,其中统计人才、技术更是捉襟见肘。传统数据收集和分析技术的知识结构已不能满足大数据时代对“数据科学家”的要求,多家企业在面对大数据发展时遭遇人才瓶颈。大数据相关人才供给不足将会成为影响大数据市场发展的一个重要因素。

当前,全世界范围内已有数百个高校开设了大数据分析专业。卡内基梅隆大学和新泽西州立大学在培养目标和课程设置上项目设置偏重于计算机方向。课程设置偏重统计学与运筹学(包括决策科学)的典型学校有田纳西大学和约克大学。2013年,北京航空航天大学与慧科教育合作开办了国内首个“大数据技术与应用”软件工程硕士项目研究生班,这是目前国内唯一一个培养大数据行业专业型人才的项目,但其培养目标、知识体系是面向计算机领域,而立足统计学基础的大数据分析人才培养项目,在国内可谓是凤毛麟角。

知者随事而制。高等院校统计学专业要通过有效利用和整合人才培养资源,承担大学人才培养的责任,驾驭大数据的浪潮,占领大数据发展人才培养的制高点,体现高等院校向社会、企业提供智力支撑,输送企业亟需的复合型、实用性大数据分析人才的载体作用,确保产业科学、持续、高速的发展。一是教育资源的整合,走在前列的首都经济贸易大学、北京大学、中国人民大学、中国科学院大学、中央财经大学五所应用统计专业硕士培养单位在北京成立了“中国大数据教育协同创新体”,在高校之间实现学科融合、优势互补、强强联合,通过共享优质资源平台、共同建立课程体系、共同建设案例资源库、联合搭建实践实训平台等多种形式,创新人才培养体制机制。二是高等院校教育资源与业界资源的整合,通过与国有超大型企业、互联网翘楚的协同培养,立足应用统计专业硕士教育,建立人才培养基地,进行协同创新,探索构建应用统计(大数据分析)专业硕士人才协同培养模式。以缓解当前大数据人才供需矛盾为目的,建立“校校协同、校企协同、院系协同”的大数据分析方向人才协同培养模式,最终实现协同培养“数据科学家”的目标。[5]

3 面向大数据分析方向的应用统计专业硕士培养模式的构建

本研究认为,可以将大数据分析及相关的案例教学模式融入应用统计专业硕士学位研究生的培养过程,进而打破统计学传统的以阐述统计理论、公式推导、数学计算为主的教学模式。以情境浸润为基础,为学生呈现统计学在大数据领域应用为核心的教学模式,可以培养学生对大数据的挖掘、整合、分析价值的能力,以期更好、更快地适应企业对数据分析师、数据科学家的需求。

3.1 科学构建课程体系,突出大数据分析特点

大数据具有强烈的行业特点,在充分借鉴国外大学成功经验的基础上,大数据分析专业硕士的课程设置,强化数据分析能力和数据挖掘能力,注重上述技术在金融等领域的应用。必修课在讲授统计基础理论(描述、多元、时序、空间、可视化等)课程的基础上,为增强学生的大规模分布式计算技能,引入主流的大数据计算平台,如Hadoop分布式平台、MapReduce并行编程算法。与此同时,为提高学生动手能力,构建数据模型思维,开设《大数据分析案例》等多门课程。选修课方面,考虑到学生二次开发的需要,设置大数据开发基础课程,如C++、Java等。为突出应用统计专业硕士侧重应用的特点,开设面向数据的编程语言,如R、SAS、Python等课程。这些课程模块的设置并非体现某一学科知识的纵深发展,而是将相关学科的知识融合,有利于突出大数据分析的特点。

3.2 创新教学培养模式,注重培用结合

以“编组”方式开展教学活动。授课教师和学生均采用团队编组模式,多名教师协同工作,共同完成一门课程的授课任务。打破原有学科思维、教材的束缚。采用导师指导与集体培养相结合的方式。教师不可照搬旧有的教学大纲、课程内容,要学习和熟悉大数据相关知识体系与技术新进展,充分结合大数据分析需求和实际案例,使课程内容紧贴实际需求,注重培养学生对模型的理解,对数据的想象力,真正实现学以致用、培用结合。

采取“订制化”培养模式,突出培养与应用相结合的特点,力争做到人、岗的高度匹配。“订制化”培养模式打破了目前应用统计专业硕士统一培养、与市场需求脱节的模式壁垒,教学实践以市场需求为导向,依照企业的岗位标准、用人要求,强调以岗位需求制定培养方案,更好地满足用人单位对大数据分析人才的需求。

3.3 开展校企协同培养,构建问题导向、项目牵引的实践教学模式

根据国务院学位委员会的规定,应用统计学专业硕士学位研究生教育的目的是培养具有良好的统计学背景,系统掌握数据采集、处理、分析和开发的知识与技能,具备熟练应用计算机处理和分析数据的能力,能够并适应行业或职业实际工作需要的应用型高层次人才。因此,要摒弃普遍存在的重理论轻实践、重知识轻技能的教学方式。

协同创新培养在实践教学中建立了以问题为导向,以项目为牵引的运作机制,强调实践教学内容的呈现方式要面向企业需求,让学生参与到企业的项目运行过程中,引导学生建立业务建模能力,培养学生的数据资源整合能力,激发学生参与项目的积极性和自觉性。学生不拘泥于学校的实验实训基地和各类实验室,在第二学年中安排一定时间走出校门,进入到企业的实际环境中,参与企业的项目组织、实施过程,在实践过程中提升自我认知能力,在实践过程应用知识和理论研究实际问题的能力,培养和锻炼数据资源整合能力、沟通协调能力、IT支撑能力、业务建模能力,真正实现面向能力培养的目的。指导教师方面,在案例教学和实习阶段引进业务素质高、项目经验丰富、对大数据发展有敏锐洞察力的企业高级数据分析人员,指导学生在实习实践中提出问题、建立模型、解决问题的能力。

4 结语

应用统计(大数据分析)专业硕士人才协同培养模式,是一项可持续发展的应用统计专业硕士人才培养的新模式,是专业硕士教学实践的创新举措,也是在全国率先建立起来的立足统计学,在大数据分析人才层面建立的校校协同、校企系统办学体。体现了面向能力培养、面向社会需求培养、面向人才价值培养的“三个面向”的培养目标,着重培养学生分析数据、处理数据、展示数据的能力,对于培养“高层次、实用性、复合型、国际化”大数据分析人才意义重大,同时也是顺应大数据技术革命的浪潮,必将对大数据等新兴技术产业的发展注入活力。

(首都经济贸易大学,北京 100070)

参考文献:

[1]刘军.Hodoop大数据处理[M].人民邮电出版社,2013.

[2]大数据的四个典型特征[N].中国电子报、电子信息产业网,2012(12).

[3]CCF大数据专家委员会.2014年大数据发展趋势预测[J].中国计算机学会通讯,2014(1):32-36.

第2篇

[关键词]新媒体营销;企业转型升级;市场营销模式

1引言

新媒体营销是随着互联网技术不断发展而衍生的重要产物,它是以移动平台为载体,以信息技术为桥梁而实现的企业网络市场竞争的过程。这种模式的出现意味着企业与现代科学技术的接轨,是企业智能化数据化发展的鲜明体现。企业在新媒体平台和技术的指导下,能够依靠各类先进技术,转变自身的发展方式。其中最为突出的应用便在于企业对数据分析的引进。

2分析数据,确立市场受众群体

企业要想在众多新媒体平台营销中脱颖而出,就必须掌握符合自身市场定位的消费群体,要让自身生产的产品能够有广泛的接受度,要取得属于自身独有的市场信任感和公信力。这也就意味着企业要主动出击,积极地吸引消费者群体的关注和重视。如果一个企业发展自身新媒体营销的方法,仅仅是通过水军或者是买来的粉丝,或者是通过转发抽奖等,那么这个企业只会在短时间内取得一定的爆发式关注,无法取得长远的市场利益,也没有办法真正的给消费者留下深刻的印象,自然也不能根据消费者的喜好和兴趣制订出针对性的市场营销方案。这就需要企业通过数据分析的方法来明确自身的受众群体。[1]首先,企业要用数据分析的方法,对自身已有的市场发展基础进行系统的分析和总结,整理出自身的市场定位和发展特点,包括品牌形象、竞争优势、产品性质等。在此基础上,大致地规划消费者的群体范围,制订相应的宣传方案和宣传规划,同时也要注意把握时间的限制,要尽可能地寻求时间和效益之间的平衡。在这一过程中,企业要按照消费者的点击喜好和频率,来制定有针对性的宣传模式,这样可以更为有效地吸引消费者的关注。其次,企业要重视用户之间的传播和转发,企业要在吸引一批粉丝的基础上适当地进行转发和抽奖活动,扩大自身的市场影响力。最后,企业也要在这一过程中精确自身的市场定位,要动态地观察宣传的成果和绩效,要寻找大众的认同感。这便要求企业要借助数据分析和检索的平台,搜索与自身宣传相关的信息确立关键词和重点语句,并分析大众对于自身的评价和看法,更好地改进营销中存在的缺陷和不足。同时要在此基础上,让自身的宣传内容更加量化和准确,更好地提升在用户之间的口碑。

3分析数据,确立市场营销载体

根据上文所述,企业在新媒体营销中所进行的宣传是离不开固定的平台和载体的,移动平台是企业信息和展现自身形象的基础与保障。因此,企业要十分重视自身新媒体营销工具的选择,要运用数据分析的方法精准地统筹和管理市场营销的信息,推动网络营销能够适应自身发展的特点和规律。同时,数据分析方法还可以把企业自身经营的特点与不同的新媒体平台进行融合,对比其结合后的实际效益和成果,同时也可以与事先的市场规划设计相比较,在此基础上选择最为合适的企业新媒体营销载体。[2]之所以运用数据分析的方法来选择企业新媒体营销载体,是因为现阶段网络企业的发展形式多种多样,不同的企业也有自身不同的市场定位和产品特点,彼此之间相互独立,但是也紧密联系。这也就意味着,各类企业在共同运用新媒体网络平台这一方法进行市场营销的同时,也要根据自身的发展特点来选择适合自己的宣传载体和工具,只有这样才可以促进宣传内容的有效传播。当下企业利用新媒体进行宣传的主要形式包括纪录片、文字和图像等,也可以是多种表现形式的结合。尽管在宣传方式上具有多样性,但是否能真正的起到吸引用户的作用还需要依靠用户的主观能动性。这就要求企业在选择好自身营销载体的基础上,利用后台运行接收数据信息的方法,分析用户点击频率最多的板块和内容,总结出现阶段自身市场发展应当跟随的主流趋势,以及分析当下营销平台运行的成果。例如当下的微博小程序,就是企业依靠文字推送或者视频的方式,与用户建立线上的交流和沟通,在此基础上根据用户的点击频率来制订出更有针对性的市场营销方案。

4分析数据,确立信息展示模式

现阶段,有许多企业建立了自身运营的自媒体平台,有相当一部分是需要用户下载相应的软件,并注册账号才可以获得相关的信息。用户在注册之后,便可以通过在移动端登录的方法来完成后续操作。[3]但也正是因为这种登录方法的存在,用户会获得比其他平台更多的市场信息。这就在一定程度上激发了用户的厌烦心理,有相当一部分用户会由于时间的限制,直接略过企业所的信息。同时,也有一部分企业将自身的信息运用网页链接或者是二维码的方式展现出来,用户必须要在登录网站的基础上再一次点开网页链接,这就会让用户觉得浏览信息是一件非常烦琐的事情。因此,企业要重视自身信息展现形式的转变,企业要尽可能地选择简洁明了的形式突出自身信息的重点,要让用户可以看到自身营销的优势和特点。企业可以用数据分析的方法,统计出用户容易接受的信息展现形式,并按照类别进行划分。当下,用户容易接纳的是企业图文并茂的信息展现形式,可以是图片和文字链接的结合,也可以是视频和文字链接的结合,或者是将链接安置在图片上。企业就可以根据用户的喜好,将自身内容展现的形式进行改革和优化,例如企业可以将市场经营的方向和产品的性能,利用形象化的图片展示出来。让用户可以一眼就看到自身的品牌特色,提高自身的吸引力。在这一过程中企业要意识到信息真实准确表达的重要性,企业可以在原有的基础上进行适当地渲染和润色,但是不能虚假信息,不能夸大其词,不能让用户接受错误且夸张的市场营销数据。

5分析数据,确定市场发展价值

企业运用数据分析的重点不仅是要打造更为针对性的市场营销方案,更是要在数据信息的分析过程中审视自身的市场经营价值,分析自身的发展建设前景,评估现阶段自身方案的质量和效益,并以此来为未来的长远发展打下坚定的基础。因此企业要用数据分析的方法,对自身新媒体运营平台进行阶段性和周期性的监督,分析现阶段自身在市场竞争中的地位。[4]监督的内容主要包括平台粉丝的浏览量和点击率、粉丝的转发量、粉丝总量的增减、除粉丝之外的市场其他用户点击率,以及现阶段市场营销的经济利润和收益等。这样就可以在很大程度上帮助企业确定自身营销平台选择的正确性,分析自身市场发展定位的准确性。

第3篇

为了进一步了解馆藏图书的利用情况,现从社科类、自科类及综合类的角度对2008年—2012年5年数据进行结构划分,其中社科类包含《中图法(第四版)》中的A-K类,自科类包含N-X类,综合类指Z类。综合类每年的购置量很少,此次在表2中体现,仅供参考,重点将社科与自科类图书进行分析。从馆藏册数方面,由表2的数据统计得知自科类图书占据主导地位,分别占到55%,54.5%,56%,54.5%,56.2%,这与图书馆每年制定的自科社科6:4的图书入藏比例基本相符,也表明了图书馆的馆藏结构符合学校以工为主的办学特色。流通比例是指图书的借阅量与总的借阅量的比例,可以从很多方面进行划分,时间段内读者对各类图书的整体需求比例,从类别结构划分流通比例就可以客观的反映出来。由表2的数据统计得知,2008年—2012年,社科类的流通比例每年都高于自科类,分别占到了56%,58%,60%,57%,66%。

入藏比例与流通比例的分析比对

取自科与社科的入藏比例和流通比例的差值Z,以数值0为分界点,分为正负两个区间,如果Z值落在同区间内,则表示馆藏图书与读者需求在整体上保持一致,反之,若Z值落在不同的区间,则表示馆藏图书与读者需求存在矛盾。计算公式Z=X-YX:入藏比例Y:流通比例如图1所示,图书馆5年内的Z值均分布于两个不同的区间,从而说明,入藏的图书与读者的需求存在出入,没有达到一致。那么,为了使图书更好的被利用,是应该继续按照图书馆原有的采购比例继续采购,还是要改变采购方向迎合读者的需求,就要进一步的了解利用率较高的几大类图书。

文献的利用率衰减对文献采购的影响

1图书利用率的分类排名

通过统计,借阅率排名前10位的有文学(I)、哲学(B)、艺术(J)、语言、文字(H)、社科总论(C)、历史、地理(K)、经济(F)、工业技术(T)、政治法律(D)、数理科学和化学(O)。以2008年入藏的中文图书作为统计对象,以2008年—2012年5年作为5个借阅时间段,前10位的借阅率统计结果如表3。表3的统计结果清晰表明,在每年的借阅率排名前10类中,社科类占到了80%,而自科类只占到了20%,社科类中文学(I)的借阅率更是高居榜首,文学类图书受到读者的欢迎,在其他各个高校中的借阅率排名亦是居高不下。社科类更是占据了借阅率排行的前6位。自科类排名中T大类遥遥领先,这是由于工业技术本身就涵盖了TB、TD、TM等众多类别,受众面较为广泛,但与社科类的图书利用率进行比较,自科类的图书利用率还是有一定的差距。一个图书情报机构是为某一个或几个专业研究、教育培训服务,还是为一般参考咨询或娱乐欣赏服务,这是设计藏书结构的基本出发点和目标[2]。西安理工大学属于理工院校,以工为主亦应该在图书馆馆藏结构中得以体现。

2文献利用率的衰减分析

文献可看作是一种信息,信息有其时效性,文献的价值也会随着时间的流逝而逐渐降低(特种文献除外)[3],图书的利用率也符合这种规律逐年衰减。这一点可从表3的各类图书的年利用率中清晰看到。文学(I)从91.19%降至47.70%,其它各类图书都有不同程度的降低。如果用U来表示图书利用率的衰减程度,那么U就应该等于同样的入藏图书大类在不同时间段内的借阅率之差。U的值越大,说明该类图书利用率的衰减程度大,利用价值损耗大,反之,说明该类图书的利用价值时间长,采购图书时应加以考虑。2008年入藏的图书,在2008年的借阅率与2012年的借阅率之差结果如图2所示。其中U值较小的为T类与O类,I类排在第4位。自科类的图书利用率虽然较低,但是,随着时间的推移,自科类的图书利用率衰减值小,所以利用价值可持续的周期比较长,可供读者的参考价值也较高。社科类的图书借阅率较高,但是时效性低,而且衰减值高,图2中显示,J类,H类,C类,F类的借阅率之差相当,而且数值较高,I类图书借阅率最高,但是属于非专业图书,应控制采购比例。2008年入藏的图书,5年之后,2012年的利用率排名前3位的分别为文学(I)47.70%、哲学(B)47.62%、工业技术(T)40.90%。T与O大类的借阅率排名分别从第8位与第10位上升为第3位与第6位。这说明自科类的图书保值期比社科类图书时间长,例如2008年购置的自科类《电子线路CADProtel99SE》一书,在2008年流通量为6次,2012年仍然流通量4次,而社科类《经济学的分析方法》一书,2008年的流通量为11次,在2012年就只流通了1次。