美章网 精品范文 数据分析设计范文

数据分析设计范文

前言:我们精心挑选了数篇优质数据分析设计文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

数据分析设计

第1篇

关键词:习题设计;发展 ;数据分析观念

【中图分类号】G 【文献标识码】B 【文章编号】1008-1216(2016)12C-0029-02

简单的数据统计重在让学生经历数据的收集、整理和分析过程,掌握一些简单的数据处理技能,感受数据蕴含着的信息,培养初步的数据分析观念。在课堂教学中,这一核心知识受到教师的足够重视,然而我们的课堂时间有限,仅仅依靠教材提供的有限的统计活动还不足以发展学生的数据分析观念。如果能够依托统计教学的核心,灵活设计习题,从不同侧重点进行有针对性的训练,有意识地让学生运用数据分析解决问题,将能发展学生的数据分析观念,使习题成为教材的有益补充。

一、丰富统计素材,主动收集整理数据

培养数据分析观念的首要方面是引导学生有意识地从数据的角度思考有关问题,就是遇到有关问题时能够想到通过设计简单的数据收集计划收集所需数据,解决所求问题,从而体会到数据是有用的,数据中蕴含着我们想要的信息。教师在进行练习设计时,要考虑不同年龄学生生活经验和认知水平的差异,赋予习题鲜活的背景,激励学生主动收集整理数据。

在学习了简单的统计图表之后,我设计如下统计练习:

夏天到了,吃冰激凌成为很多孩子的爱好,学校门前的张老板想通过一个调查来了解哪种口味的冰激凌在我们学校最流行。

(1)小组讨论:要完成这项任务,你们需要做哪些工作?请在下面的表格中,圈出需要的选项。

1 确定调查时间,设计调查用的统计表。

2 以小组为单位,每班随机抽取15名学生,对他们最喜欢的冰激凌进行调查统计。

3 以小组为单位,对我校学生的年龄进行调查统计。

4 汇总统计表,绘制条形统计图。

(2)小组合理分工,展开调查统计。

(3)根据分析结果给张老板提出一些建议。对爱吃冰激凌的同学又会提出什么建议?

吃冰激凌是孩子们的最爱,与学生的生活密切相关,很容易引起他们的共鸣。学生意识到要想帮张老板解决这一问题,调查收集数据是必需的,有用的,激发学生热情投身学习活动。真实的统计数据,会帮助张老板解决现实的问题。而对爱吃冰激凌的同学提建议,又有意识地对学生进行健康常识教育。由扶到放的习题设计,帮助学生逐步提高开展实际调查的能力。

二、精心设计问题提高分析数据信息能力

从不同角度分析数据,以便从数据中获得尽可能多的信息,并发现蕴含其中的一些规律,是数据分析观念的基本内涵之一。练习中通过精心设计问题串,引导学生从不同角度理解和分析数据信息,感受数据分析方法的多样性,并为发现和提出更有意义的问题提供机会。

小明家每两个月交一次水费,每次用水的吨数如下表:

月份 1~2月 3~4月 5~6月 7~8月 9~10月 11~12月

用水量(吨) 8 5 6 16 7 6

根据上表回答以下问题:

(1)从上表中知道,用水量最多的是哪两个月份?最少呢?分别占全年总用水量的百分之几?

(2)全年平均每个月用水多少吨?

(3)根据生活常识,你能解释一下为什么7~8月份的用水量最多吗?

(4)如果想说明7~8月份的用水量比全年的1/4还多,选( )统计图表示最容易使人明白。

本题中前两题从一组数据的极值入手,大致了解数据的分布范围,对于家庭用水量有个初步了解。然后通过计算解决其中一个月份与全年之间的关系,并通过平均数分析用水情况,对于出现的极端情况,尝试利用生活常识进行解释,使学生体会极端数据出现的原因,最后通过选择统计图,加深对各种统计图的特征的把握,进一步增强学生根据解决问题需要灵活选择统计图分析数据的能力。

三、连贯使用数据提高收集整理数据意识

对于同样的数据,由于背景和目标不同可以有多种分析的方法,需要根据问题背景选择合适的方法。每年学校都会组织学生进行体检,我将学生的身高情况及时收集,保存。在解决“ 铁道部门规定,儿童身高在120厘米以下乘火车免票,120~150厘米之间享受半价。我们班有多少人乘火车可以享受免票?有多少人需要购买全价票?”这一习题时,我组织学生讨论并形成一些可行的收集学生身高的方法,将最近学生体检的身高数据及时呈现在大屏幕上,学生感到非常惊讶,感到老师真是个有心人,根据提供的数据学生很快列表整理信息,顺利解决问题,老师这种收集和整理重要数据的习惯,使学生也受到潜移默化的影响。这时,我进一步追问,看到这些身高的数据,它们还能帮助我们解决什么问题。学生想到可以了解自己身高在班级处于什么情况,学校可以根据身高给我们定做课桌椅,可以定做校服……这时我又呈现,定做校服时大号、中号、小号和特号相关的身高要求,然后让学生根据需要重新对刚才的数据进行分组整理。通过变换问题情境,使学生体验到同一数据由于要解决的问题不同,整理、分析的方法往往会不同。

到了五年级学习了折线统计图,我再一次将学生身高情况呈现给学生,不同的是这次我将每个同学1~5年级的身高情况都呈现出来,学生感到非常兴奋,“你能将自己这5年的身高情况绘制成折线统计图吗?”,学生绘制非常用心,在组内交流近5年身高增长情况时更是积极主动,分析得头头是道。这时我又引导学生根据自己身高增长情况对六年级的身高进行预测,并学习老师,做一个“数据收藏家”,记住自己的身高,到时看看自己预测得准不准。

等到六年级复习时,我再次呈现,学生将六年来的身高增长情况绘制完整,并检验自己的预测,同时对自己15岁时的身高情况再次进行预测,此时,给学生增加了我市近年来男、女生平均身高增长统计图,发现男女生13~15岁身高增长的一些规律,很多同学又调整了预测。同样的身高数据由于解决的问题不同,分析方法大不相同,对数据进行横向及纵向的比较,会使我们的判断和预测更准一些。

四、巧设矛盾冲突促进动手实验能力提升

游戏是激发学生主动参与统计活动的很好方式,在游戏实验活动中通过数据体会概率事件的随机性,在教学可能性时,我设计这样一题:

小明和小军两人玩游戏,袋子里放有2个和1个,每次任意从中摸出两个图形,摸完后放回,如果摸到的两个图形能拼成平行四边形为小明赢,如果能拼成小房子图形,则是小军赢。你认为这样的游戏公平吗?同桌的同学玩一玩,看看拼成哪种图形的人赢的次数多?想想为什么?

游戏中的三个图形中有两个是相同的,任意从中摸两个,结果只有2种情况,学生很容易认为游戏是公平的,实际上两种情况出现的可能性大小不同,极易引发学生争辩,促使学生主动通过实验活动求证结论。动手实验正是学生体会随机现象的最佳路径,通过学生的实验,认识到游戏的设计是不公平的,与原有猜测产生冲突,学生急于一探究竟,发现小军赢的可能性会大一些。当然,游戏试验中,也会出现拼成平行四边形的次数等于或超过小军的现象,这一非常规情形的出现也是体会随机现象的重要资源,使学生深刻体会小军赢的可能性大一些,游戏是不公平的,但是小军不会一定赢,更有利于学生感悟随机现象的特点。

五、适度综合运用,全面感受分析数据的意义

统计与概率的内容和其他数学领域的内容有着紧密的联系。这部分课程的教学,应为发展和运用比、分数、百分数、度量、图像等概念提供活动背景,为培养学生综合运用知识解决问题能力提供机会。

王阿姨在汽车销售公司上班,工资由基本工资和销售奖金组成,即每销售1辆汽车给予一定数量的奖金。下表显示王阿姨今年3~6月份销售汽车的辆数与工资情况:

销售汽车辆数 8 10 11 12

月工资(元) 3000 3300 3450 3600

根据上表提供的信息你能算出王阿姨的基本工资是多少,每销售1辆汽车的奖金是多少元吗?

本题紧密联系社会生活实际问题,学生需要在认真理解题意的基础上,借助计算分析题中的数量关系,发现不同信息之间的联系,从而得出正确的计算方法,提升学生数据分析能力,在综合解决问题的过程中全面感受分析数据的意义。

第2篇

商务平台商品数据分析系统集数据获取、数据统计和分析,系统设计有如下考虑:

1)商品ID号:根据上线商品的ID号直接获取商品的评论,并对评论进行等级评定;

2)评论平均分:计算评论平均分,据此可判断商品是否合格;

3)评论分分布:计算评论的合格数及其比例。等级评定时是多个操作人员同时对同一商品数据进行评论操作,评论评分定级是人工进行的,操作人员的主观对商品评论操作有一定影响。因此需要将所有操作人员的评论评分数据进行统计对比分析,以控制整个评定的有效性。

2系统设计

本系统根据MVC的三层框架,利用JSP技术制作动态网页,通过JDBC技术访问数据库,使用JSP作为服务器端应用程序处理客户端的请求并在Web服务器中进行业务逻辑处理并返回客户端请求的结果。在JSP里嵌套HTML以及CSS对WEB页面进行设计,引入Bootstrap封装的样式,达到系统数据呈现的设计要求。页面数据呈现与后台数据交互是整个系统的核心,对数据进行归纳计算和整理并呈现到用户界面上。用户只需获取到公司平台上线商品的ID号就可以通过系统抓取商品评论数据;同时对数据进行整理分析得到评论平均分、评论分数比例等数据;同时可以系统整理分析出整体上线商品的整体趋势,通过饼状图直观地看出商品的品质分布。

2.1系统功能结构设计

商务平台商品数据分析系统分为三个模块,八个基本功能,分别是管理员登陆、用户登陆、用户注册、商品评论抓取评分、商品评论数据的统计和分析、用户管理和修改密码等。

1)管理员登陆:管理员输入用户名和密码,数据经由UIServlet传递给ControllerServlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是字母,密码字母和数字皆可。管理员是系统指定的,不可以注册。

2)用户登录:普通用户输入用户名和密码,数据经由UIServlet传递给ControllerServlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是6-20位字母,密码是6-15位字母和数字组合皆可。若没有账号,可以在用户登录JSP页面点击注册,通过UIServlet跳转到注册页面。

3)用户注册:用户注册需要输入Email、用户名、密码等信息,Email有格式判断,必须输入正确的格式,用户名必须是6-20位字母,密码是6-15位的字母数字组合皆可。输入正确后可以成功申请新用户,随后跳转到普通用户登录界面登录系统。

4)商品评论抓取评分:普通用户与管理员皆可操作,在输入框中输入商品的id号,点击查询,就可获取到“淘宝网”中商品的前一百条评论,并且按照评论时间顺序进行呈现。其后的评分框,按照规定只能输入1-5的数值,同时点击保存,数据就会存入数据库中。

5)商品评论数据统计:此功能方便普通用户清楚的跟踪自己的工作进度,对于管理员可以掌控平台上线商品的商品质量,会显示出该操作人员所操作的所有商品的平均分、合格率,可以看出该操作人员操作的商品评分状态详情。

6)商品评论数据分析:此功能为管理者观察网站整体上线商品的质量分布,点击查询,会统计所有使用系统的普通用户操作过的所有商品数的评论数据。如此管理者可以通过这些数据对网站上线商品进行调整。以操作人为条件,区分每个人的操作数据,可以控制一定的主观误差,还有整体的上线商品的趋势。普通用户可以看出自己的主观意见和其他用户的差别。

7)用户管理:管理员可以对普通用户进行增加和删除,用户管理界面对普通用户不可见。管理员有权限重置普通用户的密码。

8)修改密码:管理员和普通用户都可以自行更改密码。

2.2系统数据库设计

数据库能够对商务平台商品数据分析系统的后台数据进行添加、删除、查询,修改。本系统采用MySQL数据库设计,分别是用户信息表、评论评分信息表、商品数据分析表和商品数据统计表。用户信息表主要保存管理员和普通用户的登录信息:用户的用户名、密码、级别还有Email。评论评分信息表主要保存评论内容、评论的时间、评论评分、商品id、操作人员、商品名称等。商品数据分析表主要保存操作人员、操作商品总数、平均四分以上的商品总数及其比例、合格率大于80%的商品总数及其占比、合格率大于60%的商品总数及其占比、不合格商品总数及其占比等内容。商品数据统计表主要保存商品id、操作人员、商品名称、评论平均分、评论合格率、评论不合格率等信息。

3结束语

第3篇

[关键词]数据分析;大数据;智慧校园;决策支持

1国内外研究开发现状和发展趋势

1.1现状与趋势

在当今大数据、云计算、物联网和移动互联网等新思路、新技术快速发展的又一历史时期,高等教育面临着前所未有的发展机遇,在经历了网络化、数字化、信息化管理阶段之后,“智慧校园”将是在“互联网+教育”趋势下最重要的发展思路。随着计算机技术的不断发展,各种系统结构化和非结构化数据以前所未有的惊人速度迅猛增长,“大数据”时代已经到来。大数据是指数据结构比较复杂、数据规模大的数据集合。其数据量已经远远超出了一般数据管理工具可以承受的处理时间以及数据处理及存储管理能力。在当今大数据环境下,高校管理系统的数据结构及数据量发生了巨大的变化。在数据存储、数据管理、数据分析及数据挖掘等方面面临着巨大的机遇和挑战。为了有效地利用大数据为高校决策分析提供更好的服务,必须基于大数据建立相应的数据分析系统。

1.2国内外研究与开发综述

随着大数据的发展和教育信息化的不断深入,基于大数据开展的高校校园数据分析与应用逐步受到重视。对大数据的定义始终没有形成统一的意见。维基百科对大数据(Bigdata)的定义是:所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。麦肯锡全球研究院将大数据定义为:无法在一定时间内使用传统数据库软件工具对其内容进行获取、管理和处理的数据集合。加特纳(Gartner)于2012年修改了对大数据的定义:大数据是大量、高速、多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与优化处理。而在高校学生数据的分析应用方面,国内外高校均有开展相关的研究。纽约州波基普西市玛丽斯特学院(MaristCollege)与商业数据分析公司Pentaho合作发起开源学术分析计划,旨在一门新课程开始的两周内预测哪些学生可能会无法顺利完成课程,它基于商业分析平台开发了一个分析模型,通过收集分析学生的学习习惯,包括线上阅读材料、论坛发言、完成作业时长等数据信息,来预测学生的学业情况,及时干预帮助问题学生,从而提升毕业率。上海财经大学基于校园信息化数据基础,开发了校务决策支持系统,面向人才培养、内部管理、科学研究和师生服务等方面开展决策分析;华东师范大学利用校园信息化基础数据,开展了校车人数与载客分布分析,提升了校车使用率;利用一卡通数据开展了贫困生的特征确定、潜在贫困生分析、后续跟踪验证,有效提升了帮困扶贫的工作效率。

2需求分析

结合西安欧亚学院信息化建设基础与海量的数据积累,建立“智慧校园”数据分析系统,通过此平台的建设和应用,运用数据挖掘和知识发现,从而在大数据中获取数据之间内在的相互联系,以及其中可能存在的某种规律,从而有效提升校园管理的决策效率,提升教学科研与管理服务的综合水平。通过调查走访各部门,了解教师、学生与行政管理人员的相关需求。主要包括四个方面:一是教学数据分析需求。包括各分院、招生办、教务处等部门对于招生、学生学习行为、教学质量、学科建设与学生就业等方面的分析。二是生活服务数据分析需求。包括图书馆、后勤等部门对于学生的消费行为即图书借阅、网络行为、资源利用等项目的分析。三是财务、人事、宣传等部门对于全校的资产、师资力量、宣传效果等项目的分析。四是研究发展部门对于全校科研项目与成果完成情况的分析(见图1)。

3系统方案设计

3.1框架设计

结合需求情况,开展系统的总体框架设计,初步将系统分为三大板块,包括数据监测、决策支持和查询定制(见图2)。

3.2系统方案

系统总体架构包括四个层次,分别是数据引擎、数据挖掘、数据库解决方案和交互平台。数据引擎部分将集成校园WIFI、固网、一卡通、教务系统等各类信息系统的数据,形成数据源,数据挖掘将通过分布式计算架构和数据分析平台对潜在数据进行分析与建模,通过数据库建立本系统的分析数据库,最终通过PC、手机等客户端向用户进行呈现(见图3)。

3.3典型应用研究内容

3.3.1教学质量评估教学质量评估属于高校定期必须完成的任务,教学评估的主要目的是更好地发掘出教学过程中存在的一些问题,从而及时地对教学方法进行调整,最终实现教学质量的提升。将大数据运用到高校教学评估系统之中,不但能够在很大程度上提高高校教学管理的科学性,同时还可以提高信息化教学的实用性。把基于大数据挖掘的算法运用在教学评估工作之中,找出教学效果、信息技术在教学中的应用、师生之间的沟通互动等因素之间的联系,从而给高校的教学部门带来非常科学的决策信息,同时让教师可以更加有效地开展教学工作,提高教学质量。

3.3.2教师教学能力分析以往的教学缺乏大量数据支撑,教学的质量高低主要靠教师自我度的把握。现在,可以通过在线课堂等技术,搜集大量课堂情况信息,比如学生对知识点的理解程度、教师课堂测试的成绩、学生课堂纪律等。通过这些数据的分析,了解教师熟悉教案的程度、课堂氛围等,改善教学水平。也可以通过深度分析学生在教学过程中教师的课堂表现,从而发现课程的闪光点以及不足,从而让教师能够进一步地对课程教学进行改善,提升教学质量。

3.3.3个性化课程分析个性化学习是高校教学改革的目标,过去的班级制教学中无法很好达到这一点,通过把大数据挖掘技术和学习内容结合起来,指导学习者规划学习发展方向,制订学习规划,实现个性化学习功能。通过评估个人情况,根据分析结果推荐可能取得优秀成绩的课程方案。首先获取学生以往的学习表现,然后从已毕业学生的成绩库中找到与之成绩相似的学生信息,分析前期成绩和待选课程结果之间的相关性,结合专业要求和学生能力进行分析,预测学生选择的课程中可能取得的成绩,最后综合权衡预测学生成绩和各门课程的重要性,为学生推荐一份专业课程清单。

3.3.4学习行为分析通过一卡通门禁信息、网络信息、课程信息、在线教育系统等相关数据,可以把学生到课堂时间、上课表现、作业完成情况、自习情况等学习信息记录下来,进行变量分析。当一些与学习行为有关的因素(如旷课、纪律问题、课堂表现)发生变化时,对学生提示并进行分析。通过这种系统分析,可以很好地规划学生的学习时间,提高学习效率。

4技术创新点

4.1大数据环境下提升数据挖掘范围

相比于传统常规环境下的数据获取渠道,大数据环境下,校园数据的获取更为广泛和准确。常规环境下的数据主要以经费收支、课程建设、问卷、访谈、课堂观察等来源,而在大数据环境下,通过对事件数据、舆情数据、一卡通、日志搜索等数据的抓取与分析,更能够准确地反映实际校情。

4.2可视化技术展现数据分析结果

利用大数据分析的数据挖掘与可视化分析,能够直观地呈现大数据特点,同时能够非常容易被使用者所接受,就如同看图说话一样简单明了。智慧校园中,结合学生学习、生活消费的各类数据,通过系统分析与图表展现,让用户只管了解数据分析的结果。

4.3数据质量管理提供重要支持

本项目结合大数据发展趋势,充分利用数据挖掘、建模与可视化展示技术,系统存储数据主要是从校内外各种数据源中获得最原始数据,并对该部分数据进行整合形成数据层,然后将数据层中的数据经过抽取、清洗、转换、装载进入数据仓库从而形成支撑层,在支撑层的基础上,可以根据需求对数据进行挖掘分析,从而构建决策层。

第4篇

关键词:数据分析;数据挖掘;大数据;云计算

0引言

商业银行作为经营信用、货币的企业,面向的客户是几乎全方位的,同时银行业的竞争也是异常残酷的[1]。从网点、ATM、POS、网银、手机银行乃至其他网络信息等各类渠道数据信息中,挖掘、分析出有效的数据,可以增加营销效率、加快产品创新,快人一步扩大业务发展空间和市场份额[2]。大数据可以使商业银行决策由经验依赖到数据依赖的转变,实时、深入地把握业务和市场动态,从而更加科学、有效地决策,让商业银行能够稳健、可持续发展[3]。大数据的挖掘、分析可以有效地提高商业银行精细化管理水平,在风险控制、成本核算、资本管理、绩效考核等各个方面发挥出巨大作用,让经营管理能力大幅提升,更理性、更高效、更精确[4]。

1大数据技术

1.1HadoopMapReduce技术

Hadoop是一种分布式系统的平台,通过它可以很轻松地搭建一个高效、高质量的分布系统[5]。Hadoop的最核心的设计思想:MapReduce是Hadoop的核心组件之一,Hadoop主要包括2部分:一是分布式文件系统HDFS,HDFS为海量的数据提供了存储;二是分布式计算框MapReduce,为海量的数据提供了计算。MapReduce是大规模数据计算的利器,Map和Reduce是它的主要思想,Map负责将数据打散,Reduce负责对数据进行聚集。Hadoop采用并行工作模式,同时维护多个工作数据副本,确保失败的节点能够重新分布处理,具有可靠、高效、可伸缩、低成本的优点。

1.2NOSQL数据库技术

NOSQL(NotOnlySQL)数据库是指非关系数据库。这是相对于传统关系数据库提出的概念,随着Web2.0网站的兴起,数据量越来越大,传统关系型数据在处理大数据、实时读写以及多表联查已经越来越力不从心,而NOSQL以键值对存储,机构不固定,每个元组可以根据需要增加、减少键值对,减少了时间和空间的开销,同时NOSQL可以处理大数据,能够良好地运行在廉价的PC服务器机器上,便于扩展[7]。

1.3内存分析技术

内存分析(In-memoryAnalytics)技术是在内存中直接获取分析数据。随着64位操作系统的普及,系统可用内存大幅度提升,同时由于工艺不断成熟,内存容量不断,价格不断下降。由于内存容量暴增,人们开始直接将数据预读到内存中,对内存中的数据进行分析加工,而不用如传统的那样将数据反复不断地读入内存、写入磁盘,从而极大地提升了数据分析效率。

2商业银行数据应用现状

目前,商业银行对于大数据的挖掘还处于起步阶段,没有一个在设计之初就目标明确的定位于大数据挖掘、分析的系统[8]。现有的几个与数据挖掘相关的管理信息系统有PCRM系统(个人优质客户系统)、RPTS系统(综合报表系统)、GDP系统(基础数据平台系统)等,这些系统在设计之初就具有先天的局限性,它们仅仅是针对某个或者某几个业务部门的应用开发的,远远还谈不上大数据分析。同时这些系统由于没有统一的规划设计,物理架构大致相同,一些重要数据,如定期、活期主档及明细表全部重复加工,造成人力、财力的浪费,效率较低[9]。在上面提到的几个管理信息系统中,GDP系统是相对比较典型的应用,现在对GDP系统物理架构和逻辑架构进行分析。如图1所示的GDP物理架构图,采用成熟的3层B/S架构,2台乃至多台PC服务器部署WEB前置服务,做表示层;由1台小型机部署应用服务程序,做逻辑层;1台小型机上运行数据库系统,做数据访问层。数据库由控制库和日终库组成,其中控制库使用SYBASEASE库,将不同的处理任务划分成一个个的作业链,作业链中包含不同的作业,通过对作业和作业链调度次序进行控制;日终库采用SYBASEIQ库,对日终数据进行高效处理。控制库与日终库可在同一台小型机上。2台PC服务器使用IBMWebSphere部署高可用集群,提供WEB服务,包含作业调度服务和前台展示。

3构建商业银行数据分析

系统模型商业银行作为传统金融企业,与新兴的互联网企业不同之处在于:行内的数据中含有许多机密、隐私的信息,同时无论媒体还是客户都关心银行数据的安全性。在数据挖掘、分析包括使用的时候,效率与安全的选择需要慎重考量。为了避免资源的浪费,本文在设计模型前,必须对现有数据进行详尽分析,剔除重复、无效的数据,将有效数据进行分类。商业银行数据应用中大致可以分为2种类型:一类是高可靠数据,以数据的准确性为主,需要提供给统计部门、核算部门及监管部门,对于这类数据我们必须在使用前进行数据清洗、筛选后,才能够真正使用;另一类则不需要很精确,只需要一个大致数量级或者一个大的方向,主要供决策层、管理经营层及产品研发、营销等部门使用,对于这类数据其实才是真正符合现今大数据的概念,无需对数据进行清洗,可以直接进行挖掘。针对侧重于安全可靠和快速高效这2种不同的需求,以及结合商业银行现有技术发展,本文设计出下面2种模型。

3.1高可靠模型

基于商业银行对数据的精度要求较高,在设计模型时首先考虑的是数据的完整性和安全性,其次才考虑效率等其他的问题。因此,本文对现有成熟和完备的商业银行GDP系统3层架构和业务定位深入分析的基础上,进行了一些改进,克服现有GDP系统3层结构的不足。

3.2高效率模型

对于商业银行精度要求不高,但是非常具有时效性和海量的数据,不需要考虑数据的完整性、安全性。为此,本文使用一些互联网的新技术以及开源的软件,抛弃原有3层架构,引入大数据挖掘新技术,实现大数据的挖掘需求。

4数据分析

当将海量的数据挖掘出来后,怎样使用这些数据?投入这么多人力、物力当然是希望它能带来更多的收益,怎样将数据变成收益?这就需要对数据进行分析,结合自身以及行业的现状进行分析。在传统的数据中,以少量的数据为依据,以数据的准确性为目标进行的统计工作,其实这样的统计是有偏差和片面的。而大数据则以海量数据为依托,强调数据的完整性、综合性和复杂性,通过答题轮廓,捕捉发展脉络,确定未来发展方向。从决策层出发,大数据可以为我们更快地找出未来银行的发展方向,最大限度地避免在决策方向上出现偏差。一直以来商业银行的决策是由个人或小团队进行的,但是在这些决策中往往有很多依靠过往的经验、主管判断的,这就带来决策缺少扎实的依据,很多决策适合一些地方,但在另外一些地方却未必很适合。特别是现在科技发展日新月异,对传统银行业带来了巨大的冲击,原来的很多经验不但不能带来帮助,甚至会制约决策层的思维,决策远远满足不了前瞻性、有效性和针对性的要求。

而大数据的分析则可以更准确、更快捷地帮助决策层把握脉络,从而做出具有前瞻性、及时的、精准的决策。从管理执行层来看,通过大数据的分析可以更快捷地推出精品产品,更有效地营销客户,更高效的使用行内各种资源,提高管理能力,创造更多利润。通过大数据的分析,管理层能够分析出哪些产品受哪些客户的喜好,分析各类客户都有什么需求,可以根据这些有针对性地开发一些受客户欢迎的产品。可以对一些高质量的VIP客户进行分析,对他们的资金利用进行跟踪,尽量将资金链锁定在行内,利用资金空闲时段进行中间业务的营销,可以对这些客户在贷款的利率上进行一定幅度的优惠等等。可以对基层行、网点人员效率进行分析、优化,对行内的电子设备,如ATM、POS机等进行分析,在使用量庞大的地方可以加大投放,收回一些效率低下的设备等等。从监管层来看,通过大数据的分析可以更加直观、有效地对商业银行的合规经营做出监管。可以从大数据中对各地的经营、营销费用、采购招标等需要进行监管的地方进行分析,一旦发现某个地方有异常情况,就可以进行重点关注、重点监管,而不是像以前那样无差别的监管,或者靠经验去进行监管,从而能够更快、更有效地进行监管,提前去发现问题,制止问题事件的扩大,为商业银行减少损失,更有效保障商业银行的利益。

5结语

大数据在商业银行决策、生产运行和经营管理中越来越重要,构建商业银行自身的大数据挖掘、分析系统已经迫在眉睫了,如何构建大数据分析系统、利用分析系统实现数据到价值、利润的转化,这需要不断的研究。本文通过深入分析商业银行的数据分析现状,总结其数据分析的优、缺点。并针对侧重于安全可靠和快速高效2种不同需求,以及结合商业银行现有技术发展,设计了商业银行数据分析系统,使商业银行从珍贵数据中分析、挖掘对其战略发展和业务经营有巨大推动作用的信息。

参考文献:

[1]薛良飞.云计算在新型信息化系统中的综合研究[D].济南:山东大学,2013.

[2]李斌,黄治国,彭星.利率市场化会降低城市商业银行投融资水平吗?——基于中国24家城市商业银行数据的实证研究[J].中南财经政法大学学报,2015(1):40-47.

[3]方先明,苏晓珺,孙利.我国商业银行竞争力水平研究——基于2010—2012年16家上市商业银行数据的分析[J].中央财经大学学报,2014(3):31-38.

[4]刘晓茜.云计算数据中心结构及其调度机制研究[D].北京:中国科学技术大学,2011.[5]陆嘉恒.Hadoop实战[M].北京:机械工业出版社,2012.

[6]张世明,徐和祥,钱冬明,等.云架构模式下“网络学习空间人人通”体系探析[J].华东师范大学学报(自然科学版),2014(2):30-39.

[7]江务学,张璟,王志明.云计算及其架构模式[J].辽宁工程技术大学学报(自然科学版),2011(4):575-579.

[8]韩浩.大数据技术在商业银行中的运用探讨[M].苏州:苏州大学,2014.

第5篇

关键词:大数据技术;智能交通;数据平台;组织优化

引言

与传统数据数量手段比较,大数据技术具有数据类型复杂、处理迅速、实效性强等优点,在智能交通领域运用大数据技术,可以采集海量的数据,这些数据内包含许多不可估量的价值,通过挖掘和分析能够快速得到所需的数据信息[1]。针对上述情况,本文提出基于大数据技术智能交通台数据平台各功能层设计情况,并提出其在交通数据诊断、路网延迟指数等方面的应用。

1智能交通数据平台功能需求

随着智能交通管控平台违法数据、道路信息增长速度日益加快,过去的关系型数据库在数据保存、处理等方面的性能已无法满足庞大的数据需求。关系型数据库在对智能交通转向场景的规律展开分析时,难以从多个维度数据类型间创建良好的相关性联系。大数据技术的应用就是为将这些结构或者半结构化的智能交通数据实施整合处理,因此,依托大数据技术设计的智能交通数据分析平台具有的处理功能如下:①过车数据:处在行使状态的车辆从卡口、电子警察等智能视频采集点通过时,能够准确记录该车辆的车牌号、颜色、车型等结构化的数据信息。②车辆违规行驶数据:前段配置的采集设备能从各路口采集车辆是否闯红灯、压线、违法掉头或停车等数据。同时,利用智能的视频采集点或固定源能够实时采集车辆行驶速度、车头间距等车流量信息。③运用大数据技术设计的智能交通数据分析平台能够与信号控制系统实现对接,及时获取信号控制系统的相位控制等信息。同时,智能交通数据分析平台还具备监控和智能交通管控平台,能够提供过车信息数据、路网信息、违法数据等。

2大数据背景下智能交通数据平台架构

2.1设计整体架构

智能交通数据分析平台是采用先进的计算机信息技术、通信技术、传感技术、人工智能等有效整合用于交通运输信息的管理和控制中,注重人、车与道路之间的协调,组成一种有利于改善环境、节约能源、保护安全的综合运输系统。智能交通数据分析平台运用层次化结构模型展开设计,并根据大数据建设要求,整个平台包含数据感知、资源层、应用层三个层次,数据感知层主要任务就是采集交通信息,资源层旨在管理交通领域的数据;应用层旨在负责实时调度智能交通资源。本次设计的智能交通数据平台系统能满足采集、存储、调度及处理数据等方面的需求,具体架构如图1所示。

2.2各模块层设计

2.2.1资源层从智能交通数据存储方面分析,运用数据仓库与挖掘技术实现大数据的存储和分析。其中,数据仓库技术能够满足智能交通数据平台处理海量数据的要求,该技术依托预设的存储模式,把交通领域中的异构数据根据数据结构数据实施提取、调用、处理等操作。同时,根据预设的仓储模型把数据存放在数据仓库内,借助数据仓库技术设计的智能交通数据平台下数据存储及挖掘架构见图2。

2.2.2应用层设计利用SOA实现智能交通数据平台系统应用层的设计,该层主要包含三个子模块:①应用实现模块:该模块旨在完成数据的调度,借助逻辑编程及时实现相应的功能;②应用流程模块:大数据调度流程依托专业的BPEL工具调度各种资源;③特殊调度模块:该模块的主要任务是把自定义调度流程转换成BPEL流程。依托SOA服务设计的应用层。

2.2.3数据表现层智能交通数据平台系统中的表现层是使用者直接参与的界面,用户可依托浏览器、平板、手机等终端设备浏览各种智能交通信息数据。该层主要任务是确保用户与整个系统的交互性,因此,配备简洁的外观、界面框架、各单元控件等。

3智能交通数据分析平台系统的应用

3.1智能交通数据共享及数据诊断

智能交通数据平台系统各功能的实现离不开各模块之间的信息整合与共享,因此,实现各模块信息融合的主要方式就是创建信息共享平台,这个平台能支持相关子模块功能提取所需的数据资源及信息共享服务。此外,一个完整的智能交通系统还必须配置智能交通信息中心、管理中心、智能交通基础设备等,它能满足城市交通信息规范化发展要求,包含各类信息性质、功能及传送方法,组成相应的信息流机制,对共享的数据进行存储和管理操作。依托大数据技术的相关功能,这些共享数据可以由日益变化的智能交通各数据信息提取出来,实现各地区、不同领域的数据库实施综合处理,将历史数据迁移至大数据平台下,还要保持数据的完整性及各种数据之间的关系可以理解。同时,可依据各模块不同需求及相关关系为客户提供各种数据信息服务,组织内部存储各类数据直接输出来,其他子系统保存相关数据从信息共享平台提供一系列的查询功能。此外,大数据平台可以及时统计并输出道路网络的拥堵、事故情况,并能归纳为利于用户决策的有用信息,例如:利用大数据分析,某个路口闯红灯数量明显少于平时,出现异常数据可以设置报警规则,提醒出现异常信息[2]。维护者对现场道路智能交通设施实施排查操作,判定是否存在设备故障。利用大数据技术直观展现道路不均指数,提供最佳的信号机配时/相位方案,便于决策人员制定科学的决策。

3.2道路网延迟指数分析

依托大数据技术对各个路口/路段历史流量进行统计,进一步分析路网的延迟指数。智能交通延迟指数求解方法是实际通过旅行时间与自由流通旅行时间相减,若所得数值为负数,则设定为0,表明并未发生延迟,并把这些数据映射至[0,10]数据区间之内。如果智能交通延迟指数较大,说明这个地点的拥堵情况更严重。左侧向使用者展现设定日期、特点等交通延迟指数改变情况,来回移动水平滚动条,能够及时查看不同时间段的延迟数据。左侧展现路口、道路等级、行政区划等各维度下相对应点的延迟指数和排名情况。通过综合分析道路延迟指数,能够为决策人员提供新建道路规划等决策提供支持。

3.3道路路口组织优化设计

进行组织优化过程中,必须收集相应的数据信息,包含交叉口现状图、事故数据、智能交通控制情况等。基于大数据技术展开分析,可以提供大量数据样本,进而输出相应的数据(空间及时间维度)。其中,时间维度主要包含小时、季度、每年、双休日、工作日等;空间维度由交叉口、行政区划、道路等。大数据技术对道路过车流量展现分析,进而获得城市各区域不同点一天的高峰表现及不同模式。依托大数据平台,根据历史数据明确早晚高峰期利用大量例数数据和智能算法,盘点各路段或交叉口早晚高峰出现时间,以此把控整体及局部智能交通分布状况,达到优化智能交通管理方案的目的。

第6篇

【关键词】医学;数据分析;信息管理系统

0.引言

21世纪以来,社会的各个方面,各行各业发生着日新月异的变化,计算机的普及与应用已经融入到了经济、政治、文化的各个领域,电子信息化的有效性使我们摆脱了繁重的文书工作,同时也增强了我们对于信息的利用性。医学信息管理系统的实现一方面充分体现了计算机强大的信息收集、数据处理功能,使医疗数据的利用率得到了提高,数据的保存和提取更加的快捷方便,保存时间也大大增长;另一方面,避免了繁琐的文书记录、数据分析统计工作,减轻了医疗工作者的工作负担,不仅提高了他们的工作效率,还使整体服务质量得到了改善,管理水平得到增强。

1.医学信息管理系统的必要性和可行性

医院整体系统的庞大,工作内容的繁杂,需要有一种技术可以对医学数据进行更好的整理和分析。在门诊挂号时需要进行的手续较多,采用手工记录书写的方式操作,则会使排队的人越来越多,不能使病人在最短的时间内得到治疗,同时大量的人群会增加医院工作人员的压力,更容易出现错误,长时间的等待和工作也增加了两者在交流过程中发生摩擦的几率;在门诊看病的过程中,采用记录病历的形式,并不能在患者再次看病时迅速的提取出原来的纪录,这在无形中增加了医生的压力和工作量,不方便医生对患者的病情进行更详细的分析,对患者们的研究更是需要大量的工作。另外医院的其他部门比如财务管理系统,人事管理系统,药品库存管理系统,门诊挂号系统,划价收费系统,综合查询系统等等都存在等待时间长,工作效率低的问题,而计算机技术的不断发展和应用,可以很好的满足这个需求,计算机管理系统的出现使得医疗数据的记录、查询、统计和分析消耗时间短,工作量小,工作效率高,保存时间长,满足了医院对数据系统整理的要求,具备了快速的响应能力和联机事务处理能力,使管理更加优秀和有效,可以使患者享受到更好的服务。

实现医院信息化管理需要的计算机技术并不复杂,医院中信息化管理主要处理文字和数据,基本不会用到多媒体数据的动态传递。从这方面来说,所需服务器的性能要求也不太高。因此,建立医院信息化管理所需投入不会太高,但是由此产生的效果却是明显的。

2.信息管理系统的设计

2.1系统的设计思想和特点

(1)本系统所构建的网络采用局域网的形式,医院内的计算机都可以登录到这个系统。

(2)完整的信息管理系统涉及医院的各个部门,将不同部门联系在一起,数据实现共享。

(3)该系统设有不同等级的管理人员和医务人员,其中一部分人可以对信息进行记录和修改,一部分只能对信息进行查看,保证信息的安全性和有效性。

(4)设计可以使系统进行修改和改革的程序,使系统保持先进性。

2.2系统运行环境

为了保证系统运行的效率和可靠性,应该保证系统服务器具有较高的软硬件配置,但对于客户端的要求不是很高,一般的客户端都可以满足要求。此应用程序可广泛运行于国际互联网即因特网,同时也可适用于内部的局域网。其硬件要求很小,运行要求较低,有利于广泛的使用。

2.3系统的总体结构设计

利用医院内部局域网将各个部门联系起来,各个计算机的数据可以进行共享。在系统管理方面,设定不同等级的管理人员和医务人员,医院最高等级的领导可以对系统进行最大程度的控制,系统设定密码,密码管理员可以添加医务人员并修改医务人员的密码。病历管理人员可以查看所有患者的治疗信息但不能进行修改,门诊则负责对病历的录入和修改。相关人员只能修改对应职位的信息。所有信息的查看在各个计算机上是互通的。

2.4基本设计概念以及相关技术介绍

本系统使用ASP技术框架和局域网数据库,程序在IIS服务器端运行,以大大加快了数据的处理速度和安全性。为了使数据库保持先进性,方便修整和改革,系统设计应采用模版方式,界面的修改完全不影响处理程序流程。设置数据库维护系统,方便对整个系统进行管理。根据每个不同类型的用户分别为其制作独立的管理或者是操作页面,以便区分和提高系统安全性。

ASP:全称是Active server pages,意为“动态服务器页面”,是微软公司开发的代替CGI脚本程序的一种应用,在这里可以生成和运行动态的、交互的、高性能的Web服务应用程序,是一种简单、方便的编程工具。ASP是一种服务器端脚本编写环境,可以用来创建和运行动态网页或Web应用程序。ASP网页可以包含HTML标记、普通文本、脚本命令以及COM组件等。利用ASP可以向网页中添加交互式内容(如在线表单),也可以创建使用HTML网页作为用户界面的web应用程序。它不仅仅是一种编程语言,更不仅仅是一种开发工具,他更是一种强大的技术框架和模型。

Javascript:是一种嵌入在HTML文件中的脚本语言,它是基于对象和事件驱动的,能对诸如鼠标单击、表单输入、页面浏览等用户事件做出反应并进行处理。

SQL(Structured Query Language): 结构化查询语言,是关系数据库的标准语言,通过几个命令,就可以实现定义、查询、更新和控制功能。在ASP 中对后台数据库进行查询、添加、删除和更新等操作所采用的就是SQL 语言。数据查询基本命令是SELECT,SELECT 语句用于对数据库进行查询并返回符合查询条件的数据。在查询语句中使用SQL库函数,可以实现在查询的过程中同时对某属性上的值进行统计分析。

这是主要涉及到的几种技术,除此之外还有其他便于使用的技术,通过对这些技术的应用,专业技术人员的设计就可以实现信息管理系统的实体化。

3.信息管理系统的设计分析

信息管理系统联系到了医院的各个部门,将收费、问诊、病历等结合在一起,为医院的信息化建设和科学化管理建立了一个很好的平台。该系统主要完成文本信息和医院各种数据的录入和整理,并使患者可以快速的查看的信息,同时各个部门之间信息的共享不仅可以使医院内部信息交流更加的及时和迅速。这不仅可以增加其他部门的监督的作用,使管理更加的公开透明,使得医生更加注重治疗技术的增强,并对患者的信息进行更好地掌握以供进一步的诊断,对于病人则更加的放心并对自己的花费、病情了如指掌。

4.总结

信息管理系统的设计和使用建立了完整性强、一致性高、数据安全可靠的数据库,简化了繁琐的文书操作,规范了整个医院的数据处理流程,系统中包含强大的数据处理功能,不仅可以清楚快速的查询信息,而且可以利用一些应用程序对数据进行统计分析,简明直观的了解到医院的各种信息,方便医院的管理,提高了医院各项工作服务的质量和效率,提高了患者的满意度,对于医务人员,大大减轻了他们的劳动强度,使他们有时间和精力来服务于病人,进一步的学习,这在一定程度上促进了医学科研和教学的进行。医院管理系统紧跟时代的潮流,采取新的形式改革管理体制,优化医疗服务,使医生患者可以更好的交流,为医疗领域增添了新的特色,随着计算机技术的不断发展,信息管理系统将会有更优秀的平台。

【参考文献】

第7篇

一、突出数据分析的意义

统计是研究“数据”的,“数据”和我们平时说的“数”不同,数据是有实际背景的。数据包括数,又不仅仅指数。史宁中教授指出,数据是信息的载体,这个载体包括数,也包括言语、信号、图像,凡是能够承载事物信息的东西,都构成数据。

人们进行统计活动都是有目的的,并不是为了统计而统计。通过对统计数据进行分析,帮助人们进行判断、预测或决策,从而让人们体会到数据中蕴含的信息,这就是数据分析的意义。

这节课中,教师精心安排与现实生活联系紧密的统计内容,呈现丰富的背景,让学生充分感受“数据”是说明问题的有力“证据”,充分感受数据分析不仅是有意思的,更是有意义的。

课堂教学伊始,教师没有平铺直叙,而是组织学生将对春季降水量的感受和经验与数学中的问题联系起来,从“春雨贵如油”“好雨知时节”引出他们对两张折线统计图的辨析。“春雨贵如油”,这是针对北方的春季降雨而言的,春天降水量不大,雨水显得很珍贵;而对于南方来说,春天的降水量要比北方大一些。学生利用经验想象数据,继而出示两张图,学生很自然地将表格中的图像等数据进行对比分析,即用数据来阐释经验,做出判断。

呈现6~18岁男女生平均身高统计图,贴近学生的生活,帮助学生发现数据中蕴含的信息,从数据角度了解学生时期身高变化的特点,有生活味又有数学味。通过对常州、悉尼各月平均气温统计图的分析,了解南半球、北半球的气温情况,判断暑假去澳大利亚旅游带什么样的衣服,问题既是现实的又是有趣的。学生提供建议,必须用数据“说话”。对不锈钢保温杯和陶瓷保温杯的保温效果做出判断,根据数据进行分析,判断是科学的、有说服力的。

全课呈现了不同的统计内容,有“大事”,有“小事”,但每一次的分析,都紧扣数据,感受数据分析的意义,体现统计活动的价值,从而激发学生学习统计知识的兴趣,发展他们的数据分析观念。

二、注重数据分析的方法

传统数学主要根据假设和规定的原则进行计算或推理,而数据分析的方法,却主要采用归纳来推理。著名数理统计学家陈希孺先生认为,统计方法是一种归纳性质的方法,统计推断是一种归纳推断。统计学的研究方法是基于归纳,而传统数学是基于演绎。我们要认识到,归纳推理得出的结论具有随机性,与代数、几何等通过演绎推理得到的结论不同。结论的随机性,并不说明数据分析的方法有问题,而这正是通过数据分析方法得到的统计结果的特性。

在这节课中,教师设计的统计内容,在由数据分析方法得到某些结论时,注意体现数据分析方法的特性。

如,我国男女生平均身高的统计图,这里呈现的数据是根据样本推断出来的,体现了局部推断整体的数据分析方法。把上课班级具体的学生身高与之对照,会有“出入”,教师在学生出现疑义时要给予适度引导:即从总的方面看有其规律性,但要承认例外个案的存在。

再如,暑假去澳大利亚旅游问题,教师首先呈现2002年常州、悉尼各月平均气温统计图,从中引导学生发现:悉尼的气温变化趋势和常州正好相反。教师追问:是因为2002年特别冷吗?再出示从1858年到2002年这145年间悉尼市各月平均气温统计图,学生在对照比较2002年与这145年的数据的过程中,深切体会到了“归纳”的思想,并认识到:对今年的气温情况做出预测,仅看去年的情况,是有一定的随机性和偶然性的,因为每年收集到的数据可能是不同的,所以要将过去的情况综合起来看。天气预报,在一定程度上就是基于对过去积累的气象数据的分析研读,发现数据中隐藏的规律,从而预测将来的天气变化情况。这里,学生对“归纳”的体验特别深刻,正是源自教师的精心设计。

又如,北京奥运会的举办时间,在考虑天气因素时,呈现2003、2004、2005、2006年8月份的降水量统计图,在数据的基础上形成预测与推论,让学生体会到数据分析的预测和决策作用。呈现第25~30届奥运会中国和美国获得金牌情况的统计表,通过分析近6届奥运会上中国与美国所获得金牌的数量,预测下一届奥运会上中国可能获得的金牌数量,这也很好地体现了数据分析方法的特性。即,不能简单地从中国前几届奥运会金牌数量总体呈上升趋势,就断定下一届奥运会金牌数还会上升。

从这节课的教学中,可以看到教师对数据分析方法准确而深刻的认识,进而在教学过程中精妙表达与清晰传递。统计教学“教什么”,是值得我们深入研究的。

三、经历数据分析的过程

数据分析观念,是一种需要在亲身经历的过程中培养出来的对一组数据的“领悟”,是由一组数据所想到的、所推测到的以及在此基础上对于统计独特的思维方法和应用价值的认识。经历数据分析的过程,要围绕“数据”做文章,遇到问题“想数据”,分析问题“用数据”,让学生在看数据时有需求、有目的、有过程、有体会。

哪幅图是北京各月降水量统计图?哪幅图是常州各月降水量统计图?学生并不是盲目地猜测,而是依据对俗语“春雨贵如油”“好雨知时节”的理解,并调度自己的经验,将春季的降水量与其他季节的降水量进行比较,把两张降水量统计图联系起来观察。由此,引导学生对两幅单式折线统计图的数据进行辨别、分析。辨别的过程,也就是对表格中的数据进行分析的过程。教师又通过呈现一连串的需要对单式折线统计图中的数据进行分析比较才能作答的问题,让学生在感到麻烦、困难的过程中体会到单式折线统计图的不足,他们会联系单式条形统计图与复式条形统计图的学习经历寻思“合并”单式折线统计图。这也就产生了学习复式折线统计图的需求,促进学生主动领悟复式折线统计图的特点,明确其使用的情境。

在分析6~12岁男女生平均身高统计图的基础上,让学生预测12岁之后男女生身高变化的情况。这里,教师关注的是让学生体会并理解后面的两条“折线”发生怎样的变化,需要再调查数据、分析数据才能做出判断。之后,对两条“折线”的比较与解读充分体现了复式折线统计图的特点,让学生体悟到数据有助于分析问题。

买哪一种保温杯,教师提出问题:不锈钢保温杯和陶瓷保温杯,哪一种保温效果好一些?教师先让学生联系自己的“经验”说一说,继而出示有关数据的统计表。在此基础上,呈现复式折线统计图,让学生更直观地“看出”哪种保温杯保温效果更好。

不同的统计对象,教师一次又一次让学生面临具体的问题,通过问题引领,运用数据去分析、解释。“数据”是学生发现、提出、分析、解决问题的好伙伴。数据分析观念,是在与数据接触的过程中培养出来的。

这节课,加强了对图、表的分析解读,适当淡化了有关统计图、表的制作,但也不是不要制作。在合并北京、常州各月降水量的统计图时,教师完整地演示复式折线统计图的制作过程,以第一幅图为标准,再描点、注数、连线,并在学生对图例、线条表示方法、统计图的名称等方面提出修改建议的过程中完善了他们对复式折线统计图的认识。而在呈现12~18岁男女生平均身高统计表之后,教师放手让学生根据统计表制作统计图。我们要认识到,制作统计图表,是整个统计活动的中间环节,是作为工具为最终的判断、预测、决策服务的。适当的画图,有助于学生认识图,读懂数据表达的信息。制作图表的过程,也是认识数据的过程。

我们已经形成这样的认识:统计教学应引导学生经历完整的收集、整理、描述和分析数据的过程,发展数据分析观念。我们还要辩证地认识到:让学生经历统计活动的全过程,并不是每一次统计活动都要让学生经历全过程,在统计知识与方法的学习过程中,我们可以组织学生有侧重地参与统计活动的某一个片段。如果在学习统计的过程中,都是让学生经历统计的全过程,并在其中的每一个环节平均着力,那教学也就变得牵强附会、形而上学。

第8篇

关键词:数据分析;设计思维;市场定位;精准营销

中图分类号:TS941 文献标志码:A

The Influence of Industry Big Data Analysis on New Models of Design Thinking

Abstract: Based on discussing big data analyzing technology as well as enterprise case studies and tracking surveys, the paper states that such data analyzing technology will facilitate the generation of new models of design thinking, which will more rely on Internet technology, and systematically reorganize complicated resources and information into data that can be further used as an important guidance for new product design. These data will help enterprises realize cooperation of various participants, information sharing and tier management in the process of product design and R&D and improve the efficiency and benefits of their design and R&D system.

Key words: data analysis; design thinking; market positioning; precision marketing

在全球服装纺织业格局中,中国还处于起步探索阶段,缺少真正有市场竞争力的自主设计品牌。企业们普遍缺乏高效务实的设计创新能力,成为了我国服装纺织行业的发展短板。面对国际品牌的激烈竞争,企业们需要建立自己的新型设计思维模式。更加适应市场需求的新设计思维将是一套有理有据、高效灵敏的产品设计与管理系统,这将有助于企业们更超前的把握市场发展动态,更精准的分析产品的优劣势,更合理的筹划销售策略,更敏锐的找到未来商业机会从而打造企业及品牌的市场竞争实力。

目前在经济发达国家的服装产业中,类似的研究已经进行到了比较成熟的阶段,如法国的Lectra(力克)公司,通过将其CAD/CAM 、三维技术与互联网技术的结合,进行最优化的数据传输,可以满足企业在整个生产过程中从服装系列设计到视觉化销售的所有环节的需求。力克公司的发展资料为本文的研究提供了非常有价值的可参考实例。

1 针对服装纺织产业大数据分析技术的研究

服装纺织产业大数据分析技术是基于互联网大数据分析的专业服装设计和生产管理辅助工具。该分析技术采用的是个性化分布式数据挖掘技术,通过对互联网海量真实的服装销售数据的分析,监控并分析网站,采用JAVA语言对网站中各种内容信息进行智能化的分析和挖掘,多维度、全方位对服装属性数据进行筛选,可甄别出不同时间段、不同地域、不同年龄层次、不同性别甚至不同消费习惯的服装购买者对服装颜色、款式、面料、尺寸等属性的偏好,并形成直观易懂的可视化报表,从而对设计和生产管理者形成指导,更加方便直接的形成“设计指导书”或者“生产指导书”。能够使产品更加符合品牌特征和市场需求,极大地提高设计生产效率,减少成本与避免试错风险。

在数据分析技术的层面上,它是基于html的个性化分布式数据挖掘系统。核心内容是监控并分析网站,生成Excel表格形式的报表,报表包含关键词和网站的链接地址。这种分析为采用Java语言对网站中的各种内容信息进行智能化的分析与挖掘。相当于目标网站名单读取模块,采用Excel表格存储目标网站列表和关键词,并且用Java语言读取信息,并利用web界面即时呈现监控结果。

2 服装纺织产业大数据分析技术对设计思维影响的实例研究

参与本次研究项目的北京相与文化发展有限公司,是一家由中法意等多国设计师和业内人士组成的专业服装纺织品品牌孵化和设计营销整合机构。

2014年公司开始进行自主开发和使用基于互联网的服装设计大数据分析系统,如图 1 所示,针对某款产品的数据分析结果,将对设计工作产生重要的引导作用。设计师们会根据数据分析结果来判断设计思路是否合理,改变了传统设计流程中过于强调设计师主观感受的不稳定性,将基于互联网的海量数据经过精准的筛选和整理,生成直观可视化的数据报表,并且形成多点共享和分级管理的平台化工具,将设计研发流程模块化,迅速找到针对市场切实有效的产品设计卖点和营销方式,可以极大地提高服装设计师和生产管理者的工作效率,降低了设计研发成本并有效减少了企业在新品设计研发方面的试错风险。

为了调研资料的充分性和客观性,本论文还调研了参与10家生产销售与男士T恤相关的服装企业。在男士T恤这个产品品类的设计开发之前,这些企业想去了解该产品的设计研发方向的需求集中体现在以下几个方面,如基础风格、花型图案、面料材质、款式细节和服饰工艺等;并且在这几个需求里面,关于花型图案的调研量最大,这个环节也就成为了企业们最为关注的问题所在,另外占比量22%位居其次的款式细节,也成了男士T恤的另一个设计重点。以上调研的数据比例图示(图2),充分证明了企业对产品的设计研发方向的设定,是有着比较明晰准确的需要点的,占比29%的企业都认为要将花型图案作为男士T恤的设计重点。如果通过产业数据分析技术,能比较清楚地告知这些企业,在服装设计研发的时候,是否要优先关注哪些方面以及如何把握这些方面的设计工作,这无疑对企业把控产品与市场需求的贴合度方面是有重要帮助的。

3 产业大数据分析技术对新型设计思维模式的影响

“积累、效率、协作、降本”―― 代表着新型设计思维模式核心要素的,将给产品的设计研发思维带来全新突破,将有力地帮助中国数以万家企业将设计真正转化为生产力并最终打造核心竞争能力,完善品牌体系并全面提升品牌价值。

将与产品相关的市场数据进行搜集整理和分析,在互联网大数据分析技术的帮助下,找到对企业的产品设计研发最具有参考价值的类比信息,不同于传统设计模式的主观化和分散化,新一代的设计思维模式需要将资源和信息模块化,形成支持系统;从而在企业的整体产品设计研发流程中实现多点协作、信息共享和分级管理,极大地提高了流程的效率,降低了错误判断市场导向带来的经营风险,节省了设计开发的时间和成本,同时新型设计思维模式又会强化对于流程中每个环节的工作指标的评估,从而达成有效良性的管理机制。

4 结语

第9篇

【关键词】正交设计;方差分析;极差分析;试验设计;工业应用

一、正交设计的应用类型

基本上有四种情况:有交互作用和无交互作用,重复试验和无重复试验。相应的对这四种情况所构造的正交表也有所区别具体情况如下:(1)无交互作用是指实验各因素之间是相互

独立的,只是单个因素的水平变化对指标有影响,因素间各水平的联合搭配对指标没有影响或影响可以忽略不计,这种情况对正交表的构造没有影响。(2)有交互作用是指在进行实验时,有时不仅因素的水平变化对指标有影响,而且有些因素间各水平的联合搭配对指标也产生影响,这种联合搭配作用称为交互作用。当出现了交互作用时,正交表的构造也要发生相应的变

二、方差分析在工业上的应用举例

下面以一个三因素、三水平的无重复实验,无交互作用的工业生产例子进行分析一下:例,某水泥厂为了提高水泥的强度,需要通过试验选择最好的生产方案,经研究有三个因素影响水泥的强度,这三个因素生料中矿化剂的用量,烧成温度,保温时间,每个因素都考虑3个水平,具体情况如表,试验的考察指标为28天的抗压强度(Mpa),分别为44.1,45.3,46.7,48.2,46.2,47.0,45.3,43.2,46.3。问:对这3个因素的3个水平如何安排,才能获得最高的水泥抗压强度?

上述例子中指标为抗压强度,影响指标的因素为A(矿化剂的用量),B(烧成温度),C(保温时间),例中只有三个因素,三个水平,L9(34)、L27(318)这两张表都至少有四个列。因此,都可以用来安排这个试验。我们要求尽量少做试验。

对上述例子应用SAS编程,只用输入主效应项,运行后的结果如下:

从输出结果中可以看出,在A(矿化剂的用量)的第二个水平下的均值最大,在B(烧成温度)的第三个水平下的均值最大,在C(保温时间)的第三个水平下的均值最大。根据实际因素,(抗压强度)越大越好,因此在A2B3C3的条件下,即在矿化剂的用量4%,烧成温度1450℃,保温时间40的条件下生产,抗压强度最大。

三、正交设计法的应用步骤

(1)定指标,挑因素,选水平;(2)选择正交表、排表头;(3)排试验方案表,做试验,填数据;(4)分析数据,选取合适的生产条件。通过验证试验,找出较稳定的较优生产条件,进行小批量考验,最后纳入技术文件,才算完成一项正交试验的全过程。

参 考 文 献

第10篇

关键词:大数据;数据挖掘;现代百货业;顾客细分

随着零售业信息技术的发展,如何有效地利用商场信息化带来的数据成为企业生存与发展新的利润增长点,这是现代百货业不得不考虑的问题。华地国际扬州万家福商城通过建立以客户为中心的管理信息系统,分析会员数据的同时可以指导营销,帮助挖掘顾客消费行为和规律, 设计出更加符合顾客需要的商品和服务,在近二十年的系统使用过程中,智能客户关系管理系统得到不断完善,真正做到实现顾客细分,精准营销,极大地增强了企业自身的竞争力。

一、万家福会员卡决策支持系统的设计思路

1.确定目标(理解业务):这是系统模型构建的关键一步,将现实问题转化为数据挖掘的算法,以会员消费数据为基础,最终实现顾客细分,从而达到有针对性对顾客一对一营销的目的。

2.关于数据:包括数据准备和数据理解。数据挖掘的前提是要求数据是真实的、大量的、有效的。在确定了目标之后,选择符合条件的大量数据,对数据进行预处理,包括数据的选择、整理、清理、异常值的处理、标准化处理过程等。

3.建立顾客细分模型:在研究零售业顾客细分模型及方法的基础上,总结出适合万家福商城比较理想的模式,主要功能是实现顾客细分,同时对顾客的细分结果进行分析,并提出相应的营销策略。

4.扩展功能:在实现顾客细分的基础上,进行深层次展望,有针对性地制定营销策略,为决策提供支持。

二、万家福会员卡决策支持系统的实践研究

1.会员资料库基础架构设计

⑴会员卡的静态数据, 如年龄、性别、职业、单位邮编、单位地址、手机号码、兴趣爱好、家庭成员等。

⑵会员卡的消费信息,如购物时间、购买品类、金额、频率等。

⑶会员卡的基础信息定义,包括卡种、卡类型、保管地点、年龄段、地区、职业等。

2.会员决策支持系统及大数据分析

在会员决策系统的大力支持下,管理层可以根据需要对按照不同的属性划分的会员卡进行分析,比如通过对卡的类型 ,持卡人的性别、年龄和居住地可以掌握顾客结构及有关变化的趋势数据,分析顾客的消费行为、寻找新的消费模式等等。

3.根据决策分析支持系统实施会员营销,发展、锁定会员

要想实施精准营销,关键在于目标顾客的筛选,品牌的顾客具备有哪些特征?顾客的购物行为特征是怎样的?等等,会员决策支持系统有对会员数据强大的智能分析功能,管理者可以通过系统平台进行判断、分类,从顾客购买的产品特征判定顾客的消费意识、性别、年龄、购物偏好、行为习惯、家庭情况等,并通过对顾客连续的购买记录进行分析并修正原有的判断。不同品类间的促销组合也可以用来做精准营销,通过会员决策支持系统的会员深度分析模块,可以对品类的关联度分析,当某个区域的商品出现滞销,但又苦于找不到目标群体时,那么就可以通过商品组合做捆绑销售,而这种商品组合经过系统的分析为开展营销活动提供了精准的数据,向顾客传达准确有效的营销信息。

4.深度分析及挖掘会员消费行为数据,案例解析

通过决策分析支持系统的查询和统计分析,我们的目标客户以白领和中产企业家为主,这部分群体具有明显的营销特点:收入较高且稳定、品牌粘性强,对价格不会敏感。维持和提升这部分客户的品牌忠诚度对上本的发展至关重要。

第一步,进行消费引导。借助短信功能平台首先向会员进行生日营销,告知当天购物享双倍积分并有礼品赠送。经过一段时间的短信发送,生日来店的会员明显增多,参与人数由开始的1、2个到后来的十多个至二十几个,逐渐增多。

第二步,开展有效的营销活动。比如,积分营销,分分礼,礼纷纷。会员持卡消费获得积分奖励,积分累计到一定分数将可获赠礼品。

同时,借助决策分析支持系统提供的强大会员筛选器,帮助客服部门多角度准确筛选营销群体,进行时点会员营销。系统提供刷卡赠送、消费实时赠送、累积后赠送等多种促销方式,以电子优惠券、短信的形式精准发送到会员手中。

三、结语

总体而言,基于数据挖掘技术的会员卡决策分析支持系统可以对零售业顾客群进行合理的细分,建立顾客细分模型,有针对性地对目标顾客进行一对一营销,有助于提高营销活动的针对性和有效性,有助于客户关系管理的良好实施。随着信息化的继续发展,必将在数据处理及资源整合,为企业提供决策支持等方面,发挥更大的作用。

参考文献:

[1](美)Michael J A Berry , Gordon SLinoff.数据挖掘技术:市场营销、销售与客户关系管理领域应用[M].机械工业出版社,2011.

[2]利.数据挖掘与商业智能完全解决方案[M].北京:电子工业出版社,2011.

[3]赵涛.商场经营管理:理论、案例、制度、实务――商业现代化与基础管理丛书[M].北京工业大学出版社,2009.

第11篇

【关键词】智慧仓储 物联网 大数据平台

大型供应链管理服务商通常具备多条成熟的运输线路以及遍布全国的货物仓库,企业日益扩大的交易规模和业务范围,各地仓储和物流运输每日可采集丰富的交易、物流、仓储、供应商等数据,单一的企业ERP系统只能完成资源管理,对于海量数据的分析和企业更高要求的数据分析能力有限,于是,企业智慧仓储大数据平台应运而生。

本文提出的智慧仓储运营支撑平台,运用了先进的RFID技术、视频分析技术及大数据分析技术,不仅解决了分散在各处的仓库智慧化管理,还可将仓库和物流各类运营及管理基础数据同步上传至大数据平台,实现仓库运营和管理信息资源的整合与共享,并依托各类基础信息库,为企业管理者提供智能决策支持。

1 智慧仓储运营支撑平台

智慧仓储运营支撑平台是一个功能完备的基础平台,系统架构如下图所示,分五层结构:感知层、传输层、数据层、服务层和应用层。

1.1 感知层

包括RFID读写器、激光雷达、视频终端、门禁对讲、温湿度传感器和警报器。

1.2 传输层

采用有线局域网或WIFI无线通信方式与支撑平台连接并传输数据。

1.3 数据层

包括设备信息库、业务信息库、监控信息库和人员信息库。

1.4 服务层

包括RFID中间件、ESB总线和第三方接口等模块,为整个系统的运行提供服务支撑。

1.5 应用层

包括仓库的业务管理、安防管理、人员管理、报表分析和系统管理等功能。

通过智慧仓储运营支撑平台可实现对货物入库、出库、移库、盘点等基本业务的智能化处理,其中,视频分析技术还可实现仓储的安防管理、人员管理等功能,不仅实现了对仓库的智能化管理,还能够收集物流和仓储的各个生产过程和任务执行中产生的运营数据,作为大数据分析平台数据源的重要组成部分,为企业实现智能分析提供了基础。

2 智慧仓储大数据应用

智慧仓储运营支撑平台将各地的仓储运营数据统一上传至企业大数据平台,进行分类和对分散及重复数据进行筛选、汇总、抽取、挖掘、分析形成物流与仓储有价值的大数据,便可应用于企业管控和管理全过程的协调、管理、协同、决策。大数据平台架构如下图所示,分为数据源、大数据获取、大数据处理、大数据服务四层。

数据源层主要实现采集前端各类感知设备以及各仓储运营平台数据。

大数据获取层实现结构化数据、非结构化数据、半结构化数据的导入导出。

大数据处理层实现数据的分布式存储和并行计算,并统一提供资源的调度服务、访问服务、管理监控服务和权限控制服务等。

大数据应用层实现物流运输调度、储位管理、可追溯管理、精准营销等各类智慧化应用。

2.1 运输调度

通过大数据优化任务发运计划,使运输任务最大程度地衔接起来,达到整个运输网络任务协调排程,合理组织运输工作和车辆调配,提高运输调度水平。

2.2 储位管理

通过对产品的进出货数据进行分析、整理、分类,深度挖掘不同类别之间的相关关系,再配合波次作业手段,优化拣货单,提高仓储工作效率。

2.3 可追溯管理

借助大数据平台智能分析及智慧仓储前端采集信息,建立产品档案,全面直观地展示品牌形象,借助供应链系统与电子商务交易平台,实时监督产品生产、交易和运输全过程。

2.4 精准营销

通过收集各个电子商务平台上同类产品的销售价格、数量、潜力,以及老客户的个人资料、交易行为、忠诚度等信息,同时深度挖掘潜在客户,制定一些优惠政策,激发购买的积极性,定向推送产品信息,实现精准营销。

3 结束语

基于大数据分析的智慧仓储运营支撑平台,适用于拥有多个分散仓库的大型企业,不仅使仓库管理者能够及时掌握仓库运行情况,更将大数据技术应用到物流领域,对于建设智能仓储体系,优化物流运作流程,提升物流仓储的自动化、智能化水平有着积极的推进作用。

参考文献

[1]肖建辉.浅谈仓储管理[J].物流工程与管理,2010,32(06):130-132.

[2]张仁彬,李玉民.基于物联网技术仓储管理系统研究[J].物流科技,2011(06):35-38.

[3]宫夏屹,李伯虎,柴旭东,等.大数据平台技术综述[J].系统仿真学报,2014, 26(03):489-496.

第12篇

论文关键词:版权期限,版权贸易,最优值,有限性

 

版权法又可以称为文学艺术产权法,它是一部形成一国社会文化的法律。版权属于知识产权体系,其保护的标的是思想的创造物,这就决定了版权必须赋予权利人一定的专有权利来达到和实现激励创作者尽心创作的目的。同时版权又兼具了增进知识和学习的宪法性目的,因此它需要通过设定一些公共领域促进一般的社会公众接触到创新的思想以达到传播作品提高社会公共利益的目的。可见,版权法从本质上就是要在创作者和使用者之间建立一种均衡关系。

保护期限的长短是调整作者与公众之间利益冲突的重要工具法律论文,也是实现版权法目的的一种手段论文范文。根据各国版权法的规定,一旦版权的法定保护期届满,作品将自动地进入公共领域,公众可以自由地复制或者作其他的使用。从这个角度而言,确定版权保护合适的期限是促进各国版权法改革的重要原因。本文运用计量分析方法,以56个国家和地区的数据为样本,实证分析版权保护期限与版权贸易的关系,探求版权保护期限的理想平衡点,并在此基础之上提出完善我国版权保护期限制度的政策建议。

一、研究文献综述

一般而言,版权保护期限就是指版权法律保护实施的时间期限。法律赋予版权一定保护期限的目的就在于使得作者在不泯灭创作热情的同时还愿意与公众分享其智力成果,这一规律俨然成为绝大多数国家的法则。从历史的角度来看,版权保护期限经历了从短到长的演变过程,逐步从最初的28 年扩展到现在的作者身后70 年[[1]]。学界为此展开了积极的探讨法律论文,在理论层面上,美国国会[[2]]就Eldred v.Ashcroft[[3]]判决指出,如果不延长现有版权作品的保护期,就没有人愿意对那些即将进入公有领域的但是却具有投资价值的版权作品进行追加投资。因此,延长版权保护期就能使这种追加投资成为可能。美国版权局[[4]]强调在信息全球化的今天,国际社会应当有一个统一协调的版权保护期标准,现在,欧盟已经通过一个版权指令将其版权保护期延长至作者有生之年加上死亡后70年。如果美国不延长版权保护期,那么,美国在欧盟的利益将受到损失。在实证层面上,Png 和Wang[[5]]调查了1991-2002年OECD 26个国家的样本数据。研究表明,在平均水平上,版权保护期限的延长使得电影产量提高了8.51%(4.60%)到10.4%(4.89%)之间法律论文,并且电影产量的增加在盗版率低的国家显得更为显著论文范文。

从版权法的基本原理来看,版权期限的扩张是对版权人保护的强化,但同时也意味着对社会公众义务的加重、对公众自由接近知识和信息的限制的强化,这引起学者对版权保护期限不断延长的担忧和焦虑。在理论层面上,Landes和Posner[[6]]认为版权保护期延长所激励是那些还没有被创作出来的作品,而表达成本的增加将涉及到对所有作品的借用,包括现有的和没有创作出来的作品。这是反对版权保护期限延长一个非常有力的判断。美国法官Thomas[[7]]总结认为版权保护60年的垄断权所产生的罪恶会双倍于30年的垄断权所产生的罪恶、三倍于20年垄断权所产生的罪恶。Lypzic[[8]]对版权保护期过长的弊端进行全面的总结:一是作者靠集体文化培养,从中吸收完成自己作品所需的各种要素,因此,反过来,将他们的作品尽快纳入公有领域作为共同财产也是理所当然的;二是超过一定的时间,几乎无法再找到所有的继承人,几乎无法使他们意见一致地按作品的流通市场所需求的速度授权使用作品;三是保护期限过长法律论文,公众会付出更大的代价,因为权利的永久化只会有利于继承人,不利于激发创造力;同样,它会使作品难于流通,这不符合公众享有文化的迫切要求。在实践层面上,Landes和Posner[[9]]并采用限制折扣的方法,指出一个永久性版权的现值与25年版权保护期的现值,相差仅约2.5%。法官Breyer[[10]]同样认为版权20年保护期限所创造的收益就占到了永久性保护所创造收益的98%以上。Varian [[11]]认为美国Sonny Bono 版权期限扩展法案所产生的激励效用是不显著的,版权保护期限延长20年的规定,仅仅能创造0.47%额外的补偿,如此低的补偿率不可能对作品创作具有显著影响。Landes &Posner [[12]]调查了1910-1991年美国版权办公室版权续展注册的情况,认为80%的版权作品在首次版权保护期结束之后已经没有商业价值了。Rappaport[[13]]研究了在美国1922-1941年间获得版权的电影在1998年的商业价值,他发现两个趋势:一是距离目前更近的电影更有可能进行商业运作。在1926-1928年的电影在1998年的商业存活率为11%法律论文,1929-1932年的存活率则为40%,1933-1941年的存活率则为65%;二是距离目前更近的电影具有更高的商业价值。在1926-1930年间创作电影的平均商业价值为175,000美元,1931-1934年间为250,000美元,1935-1941年间为400,000美元论文范文。

上述研究成果细致梳理了版权保护期限对版权人、传播人与使用人的各方影响,阐述了版权保护期限对激励作品创作和由于垄断所造成利用不足的两方面效应。可以说,学界目前对于版权保护期限重要性的探讨已经非常深入和翔实,并将关注的焦点和核心放在究竟多长的保护对于确保作者和出版者的经济利益是必要的。但令人遗憾的是迄今关于版权法最终能够提高公众福利的经验性研究却极度匮乏,究竟多少激励足以推动创造性活动,何种激励——金钱、控制还是时间?——真正起作用,对此缺乏事实性的必要研究加以分析并做出合理解释。从这个角度而言,目前版权保护期限延长对社会福利的影响依旧属于一个开放性命题,本文将在现有研究的基础之上展开进一步实证分析。

二、版权保护期限与版权贸易关系的实证分析

1、相关数据

对于版权保护期限,直接采用各国或地区的版权立法期限为统计变量。对于版权贸易法律论文,由于直接采用一国或地区版权贸易的绝对值往往会忽略各国或各地区规模大小的差异,导致数据失真,因此,采用人均版权贸易额进行修正。研究样本为2006年全球具有代表性的56个样本国家和地区的版权保护期限和人均版权贸易额的数据资料。相关数据参见表1。

表1版权保护期限与人均版权贸易额数据统计表

 

国家

和地区

版权保护期限ST

人均创意及其相关物品进出口贸易额(美元)CT

国家

和地区

版权保护期限ST

人均创意及其相关物品进出口贸易额(美元)CT

国家

和地区

版权保护期限ST

人均创意及其相关物品进出口贸易额(美元)CT

国家

和地区

版权保护期限ST

人均创意及其相关物品进出口贸易额(美元)CT

匈牙利

70

1605.958

瑞士

70

4166.612

拉脱维亚

70

501.3533

新西兰

50

722.645

荷兰

70

2730.922

阿根廷

70

80.21176

肯尼亚

50

11.10053

阿尔巴尼亚

70

66.27032

智利

50

140.8095

克罗地亚

50

494.4137

丹麦

70

2868.151

韩国

50

1109.034

卢森堡

70

5597.743

葡萄牙

70

647.9537

巴西

70

64.98956

印度

60

39.11031

奥地利

70

2404.444

冰岛

50

1385.601

加拿大

50

1302.102

马来西亚

50

987.572

塞浦路斯

70

1306.344

罗马尼亚

70

219.2006

西班牙

70

776.5571

泰国

50

281.735

澳大利亚

70

980.5365

以色列

70

4294.443

爱沙尼亚

70

1803.927

中国

50

173.2935

法国

70

1290.191

斯洛文尼亚

70

1071.108

捷克

70

1117.213

白俄罗斯

50

116.5495

德国

70

1532.578

斯洛伐克

70

859.9697

波兰

50

342.9795

格鲁吉亚

50

42.68358

意大利

70

1099.275

比利时

70

5964.5

爱尔兰

70

2054.753

亚美尼亚

50

261.7565

挪威

70

1398.058

英国

70

2649.674

日本

50

696.4777

菲律宾

50

47.41103

瑞典

70

2557.999

希腊

70

557.1021

马耳他

70

1424.512

印度尼西亚

50

34.50223

保加利亚

70

165.314

芬兰

70

3451.044

新加坡

50

9334.759

约旦

30

266.7404

美国

70

990.5456

土耳其

70

83.28199

立陶宛

70

571.765

摩洛哥

第13篇

关键词 海洋环境;环境监测;数据库设计

中图分类号:P71 文献标识码:A 文章编号:1671—7597(2013)021-065-01

当今海洋资源被我们广泛所利用,随之而来的是海洋的污染及其一系列的环境问题,为了可持续发展,我们必须对海洋环境的现状进行有效的监测管理,才能更好的保护海洋资源环境。海洋环境监测是海洋环境保护的“哨兵”和“耳目”,是关系到海洋环境保护事业健康发展的前提和基础,是防止和消除海洋环境污染,减少损害的重要手段。随着我国对个海洋区域维权的开展,渔业,石油等生产活动的不断扩大,长期的,实时的检测海洋环境数据,合理的统计数据分析,将为我国开展可持续发展战略,解决海洋污染,保护生态环境等活动提供可靠有效地数据基础,为海洋区域的灾害预防,解读海洋水文气象变化,监测气象服务提供重要的依据。

1 系统组成及数据库设计

1.1 海洋环境监测系统组成

海洋环境检测系统主要由海洋环境监测站、数据中心、业务应用平台三部分组成。安装在海洋沿岸及其附属平台上的海洋环境监测站,包含一系列数据采集、接收、保存的计算机终端,可以实时检测海洋环境观测数据,这些计算机终端通过海洋岸站与区域中心之间的数据专线或者无线传输网络将数据发送至中心数据库。经过业务应用系统的处理,不同用户可以通过web浏览器交互查询调阅单个或多个、实时的或历史的监测资料以及统计数据,业务平台管理人员还可以通过基础应用平台对设备进行监控,对业务型用户进行授权管理。

1.2 数据库选型

海洋环境监测系统以数据服务和数据分析为主要业务,因此合理高效的数据库设计是系统建设成功的关键之一。稳定,高效,二次开发友好,安全是超大数据量数据库选型的关键点。

中心数据库拟采用Oracle数据库。Oracle数据库属于关系型数据库,能在所有主流平台上运行,并完全支持所有的工业标准,采用完全开放策略,并提供了基于角色(ROLE)分工的安全保密管理,在数据库管理功能、完整性检查、安全性、一致性方面都有良好的表现。Oracle提供了与第三代高级语言的接口软件PRO*系列,能在C,C++等主语言中嵌入SQL语句及过程化(PL/SQL)语句,对数据库中的数据进行操纵,加上它有许多优秀的前台开发工具如 POWER BUILD、SQL*FORMS、VISIA BASIC 等,可以快速开发生成基于客户端PC 平台的应用程序,并具有良好的移植性。

Oracle提供了新的分布式数据库能力,可通过网络较方便地读写远端数据库里的数据,并有对称复制的技术。能够有效应对灾难,快速恢复生产能力。

1.3 数据库模块划分

海洋环境检测系统主要包括以下几个模块:用户模块,权限管理模块,系统设置模块,日志模块,数据检测模块和预警通知模块。

1.4 数据库表设计

1.4.1 数据检测模块

数据监测模块为海洋环境监测系统的核心模块,存储了该系统核心的数据,是系统业务的基石。本模块主要包括实时数据表,日记录表,其相关联的表包括监测站信息表,监测要素信息表,监测项目表等,各表关系及详细信息。

1.4.2 系统设置模块

系统设置模块主要用来设定系统运行时的基础数据,包括站点信息表,监测设置表,系统参数设置表等。站点信息表保存各区域中监测站的序号,地理位置,检测项目,风速风向仪高度等资料数据,每个监测站可监测多个项目。监测设置表保存各站点监测的个性化设置,如监测人员,维修人员,监测时段等等。系统参数设置表保存整个海洋环境监测系统的参数,如访问时间,最大使用内存,最大连接数,日志文件大小等。

1.4.3 日志模块

日志模块用来记录系统运行状况,包括各监测站点运行日志和业务系统运行日志两个部分。监测站点日志包括站点运行日志表和站点维护信息表,其中站点日志表主要记录站点运行状态,如站点实际开始监测时间,实际结束监测时间,运行状况,终端良好率等,站点维护信息表主要记录站点维护信息,如维护人员,维护时间,维护内容,维护费用等。业务系统日志包括Web应用服务器日志和系统运行错误日志。前者可以通过配置Web应用服务器自身日志模块来实现,无需将能大量日志记录保存到数据库中。后者即系统运行错误表主要记录系统运行发生的错误信息,错误堆栈,错误时间等,为系统维护人员排除错误提供决策信息。该表信息简单,不再详述。

1.4.4 预警通知模块

预警通知模块用来对需要通知用户或者管理员的业务逻辑进行监控,促进用户在合理的时间完成各项任务,并可以对可能发生的不良情况提前预料和反馈。

基于上述流程,该模块包括通知表,预警规则表,邮件表。其中通知表和邮件表用来保存发送到用户的通知或邮件,而这相对简单,不再详述。

预警表主要字段包括rule_id,rule_name,rule_desc,rule_type,interval_date,weekend_include_flag,status,start_date,weekend_include_flag,status,start_date,end_date,WHO。

1.4.5 用户管理模块

用户管理模块主要记录所用系统的使用用户信息。该模块包括用户信息表,系统部门表和用户部门分配表,表间关系和表详细信息

2 结束语

海洋环境监测数据库及WEB 应用平台设计界面友好明了、操作简单通用、数据全面丰富、特别是动态潮汐、风况等要素演变曲线,能极大方便预报员的日常预报及工程设计管理人员使用,不但可以拓宽资料的应用范围,而且能实现多站数据集中,多单位共享,满足了用户的不同需求,在海洋环境预报,及防灾减灾等方面可以发挥重要作用。

第14篇

摘要:推动社会矛盾预警机制建设,有助于实现社会矛盾的及早发现和及时化解,维护社会稳定。基于海因里希法则,社会矛盾预警以社会经济领域中发生的反映社会矛盾状况的各类社会事件为分析对象,通过信息挖掘揭示社会矛盾产生、发展和演化的规律,并据此建立社会矛盾预警体系。社会矛盾预警的技术支撑是大数据分析云平台,由基础服务层、数据分析层和终端层组成,基础服务层的主体是社会矛盾公共信息云平台。

关键词 :社会矛盾预警 大数据云计算

[中图分类号] D616[文献标识码]A[文章编号]1672-4828(2015)04-0040-07

DOI: 10.3969/j.issn.1672-4828.2015.04.005

石森昌,天津社会科学院经济社会预测研究所副研究员(天津300000)。

党的十六届三中全会提出要加强社会预警分析,并且在之后的四、五、六中全会对此加以反复强调。十八届四中全会再次提出要建立健全社会预警机制,但与之前不同的是,这次会议强调的是“建立健全社会矛盾预警机制”,即强调突出社会矛盾预警机制建设。为什么要强调建立社会矛盾预警机制,社会矛盾预警的涵义是什么,以及如何建立社会矛盾预警体系?本文将对上述问题展开分析。文章首先回顾中央对建立社会预警机制问题的历次表述,分析建立社会矛盾预警机制的现实意义,并对社会矛盾预警的内涵做出界定。其次,基于海因里希法则提出进行社会矛盾预警的基本思路。最后,给出社会矛盾预警的大数据云平台分析框架。

一、社会矛盾预警提出及涵义

2003年10月,党的十六届三中全会首次提出:“建立健全各种预警和应急机制,提高政府应对突发事件和风险的能力。”2004年9月,党的十六届四中全会强调指出:“建立健全社会预警体系,形成统一指挥、功能齐全、反应灵敏、运转高效的应急机制,提高保障公共安全和处置突发事件的能力。”2005年10月,党的十六届五中全会再次强调社会预警机制建设,“建立健全社会预警体系和应急救援、社会动员机制,提高处置突发性事件能力。”2006年10月,党的十六届六中全会对社会预警问题的表述是,“按照预防与应急并重、常态与非常态结合的原则,建立统一高效的应急信息平台,……,实现社会预警、社会动员、快速反应、应急处置的整体联动。”2014年月,党的十八届四中全会提出:“构建对维护群众利益具有重大作用的制度体系,建立健全社会矛盾预警机制、利益表达机制、协商沟通机制、救济救助机制,畅通群众利益协调、权益保障法律渠道。”

比较不同时期对社会预警问题的论述可以发现,十八届四中全会提出的社会矛盾预警问题具有不同的意义。首先,十八届四中全会之前,社会预警机制建设通常是和应急机制建设相联系的,社会预警机制建设实际上是为政府的应急管理服务的,是从社会危机管理角度来认识和看待社会预警机制建设问题;十八届四中全会把社会预警机制建设看作是化解社会矛盾和纠纷的重要工作机制,是从社会治理角度来认识和看待社会预警机制建设。其次,十八届四中全会之前,推进社会预警机制建设的目的是提高政府应对突发事件和风险的能力;十八届四中全会指出,建立健全社会矛盾预警机制是构建对维护群众利益具有重大作用制度体系的重要组成部分。

显然,着眼于化解社会矛盾而不是提高政府应对社会危机能力来推动社会预警机制建设,这是我国推进社会预警机制建设中的一个重大思路转变。同时也意味着维护社会稳定工作思路的重大转变,即从重视政府应对突发事件和风险的能力建设转向更加重视社会矛盾和纠纷化解,实现从源头上预防社会风险的发生。社会预警机制建设的这一思路转变不仅更符合社会稳定的内在需求,也是对过于突出应急管理能力建设工作思路的纠偏。

事实上,导致社会不稳定的群体性事件往往是由于社会矛盾不能得到及时疏导和化解而引致的。关于社会矛盾与社会稳定的关系,总书记(2004)曾对此进行过论述:“各级党委、政府高度重视和正确处理各类人民内部矛盾,以及由此引发的各类群体性事件,努力把维护稳定的各项工作抓实做细。”在他看来,各类群体性事件产生的主要原凶就在于未能正确处理各类人民内部矛盾,维护社会稳定的源头治理在于重视和正确处理各类人民内部矛盾。由于社会矛盾和纠纷化解对促进社会稳定具有重要意义,因此,通过强化社会矛盾纠纷预警预测工作,有助于推动社会矛盾的及早发现和及时化解,维护社会稳定。这就是推进社会矛盾预警机制建立的重要意义和价值所在。

关于社会矛盾预警问题,目前仅有极少数文献涉及(安然,2011;王林、吴贻龙,2013;王林、黄利芳,2014),但都没有对社会矛盾预警的内涵进行讨论。本文认为,社会矛盾预警是以社会经济领域中各种已存在和潜在的社会矛盾为研究对象,通过揭示各种社会矛盾产生、发展以及演变的规律,并建立用于观测各种社会矛盾发展演化状况的标准体系,通过对社会矛盾的产生和发展变化进行实时识别和跟踪预报,实现社会矛盾的及早发现和及时化解。

可以从几个方面加深对上述定义的理解。首先,社会矛盾预警是以各类社会矛盾为分析对象,对矛盾的产生和发展演化过程进行预警;而传统社会预警分析是以社会整体运行状况为分析对象,通过测度社会运行的风险水平进行预警。其次,社会矛盾预警的目的是为了实现社会矛盾的及早发现和及时化解;传统社会预警的目的是提高政府危机应对能力。第三,社会矛盾预警既与政府部门有关,也与社会各种机构和组织有关,因为正如总书记所指出的“努力化解社会矛盾,维护社会稳定,不仅是党委、政府的事,也是社会各界的事,人人都应关心,各种社会组织、各个部门都有责任。(,2004)”而传统社会稳定预警更多是为政府部门服务。第四,社会矛盾预警标准体系具有多样性,既有关于社会矛盾产生的预警体系,也有社会矛盾演化的预警体系,同时不同行业、领域也有不同的预警体系;而传统社会预警体系通常仅有一个用于对社会整体风险水平进行预警的体系。

二、海因里希法则和社会矛盾预警

社会矛盾预警以社会领域中各种社会矛盾为分析对象。由于社会领域巾每时每刻都产生新的社会矛盾,同时也有很多已发生的社会矛盾由于得到化解而消失,如何在海量的社会矛盾信息中展开预警分析,社会矛盾预警的基本思路和主要技术手段是什么?本部分将讨论社会矛盾预警的基本思路,第三部分将分析社会矛盾预警的主要技术手段。

安全管理领域经常引用一个术语叫做“海因里希事故法则”。该法则是美国人海因里希通过分析工伤事故的发生概率,为保险公司提出的经营法则。基于对大量数据的统计分析结果,海因里希指出,在一件重人安全事故的背后必有29件轻度事故的发牛,并同时存在300件潜在隐患(周兰胜,2013)。

“海因里希事故法则”反映了事故发生频率与事故发生后果之间的一般规律,即小事故损害小但发生频率高,大事故损害大但发生频率小。这一法则也表明,在大事故发生之前,一定已经发生一定数量的未遂事故和轻微事故,当导致这些未遂事故和轻微事故发生的原因未得到妥善处理,累积到一定程度时就会导致大事故的出现。凶此,从事故管理的角度来看,在未遂事故和轻微事故频繁发生之时,就应高度重视并探讨导致未遂事故和轻微事故产牛的原因及其发展演变规律,通过采取积极应对措施,消除事故原因、中断事故发展过程,达到控制和预防重大事故出现的目的。

尽管“海因里希事故法则”主要针对安全管理领域,但其对社会矛盾预警分析具有重要的启示意义。危害社会秩序和公共安全、影响社会稳定、干扰社会正常运行的社会安全事件发生,实质上是社会矛盾集中爆发的体现。与其他突发公共事件一样,社会安全事件也会经历孕育、激发、酝酿、爆发、升级以及减弱平息的演化过程(杨乙丹,2013)。孕育阶段就是社会矛盾的能量积聚过程。在这一过程,社会矛盾事实上已通过形形的社会事件表现出来,只是由于受到各种条件的限制而未能实现由社会事件转型为公共事件,并逐步发展壮大。当社会矛盾集聚的能量达到一定程度时,在合适的条件下,就会由某一具体的社会事件作为诱因事件引发社会风险爆发,其基本过程可以概括为:诱因事件发生一诱因事件获得公众和媒体的普遍关注而演化为公共事件一在政府应对不力+不真实信息传播+长期矛盾集聚等因素的共同作用下最终演变为严重的公共危机甚至是社会危机(汤志伟、杜斐,2013)。

因此,从社会矛盾预警的角度来看,当社会领域中由社会矛盾引发的社会事件在不同领域内频繁出现时,即使单个事件对整个社会没有影响或者影响很小,作为社会管理者也应引起足够重视。因为当这些社会事件不是由孤立的原因导致而是由某些共同的原因导致时,如果这些共同的原因未得到妥善处理,当其演化到一定程度时就会导致公共危机或者社会危机的出现。

由此,“海因里希事故法则”实际上为社会矛盾预警分析提供了思路:社会矛盾预警分析首先应聚焦于社会经济系统不同领域中反映社会矛盾的各类社会事件,这是社会矛盾预警分析的逻辑起点。其次,围绕反映社会矛盾的每一个具体的社会事件,要尽可能地收集到所有与该事件相关的信息。第三,对收集到的信息采用合理的分析工具和手段进行统计分析,尤其足要对各种信息进行甄别和分类,如哪些因素是专门指向特定的社会事件,哪些因素是共性的、与多数社会事件都相关联的;哪些因素是短期的冲击,哪些因素是长期存在的等等。第四,对共性的、长期的因素进行研究,掌握其发展演化规律,并据此建立社会矛盾预测预警分析体系,依据这些因素的发展趋势向全社会发出有关社会矛盾的警示、警报信号。

基于海因里希事故法则的社会矛盾预警分析的基本过程可以概述如下,参见图1。

案例收集,即对社会经济领域中发生的各类反映社会矛盾状况的社会事件,最广泛地收集与每一个社会事件相关的信息,建立社会事件的信息资料库(也即社会事件案例库)。最终实现对每一个社会事件的数据化和信息化。

信息挖掘,即对社会事件信息资料库,采用科学的数据分析工具和方法,寻找到与社会矛盾预警相关的、有价值的信息。

体系构建,依据信息挖掘结果,建立社会矛盾预警体系。需要强调的是,这里的体系不一定就是指标体系,也可以是社会矛盾形成和爆发的某种模式。并且对不同领域的社会矛盾、不同发展阶段的社会矛盾都有相应的预警体系。

信息收集,依据社会稳定预警体系要求,收集形成社会矛盾预警信号所需要的最新信息。

信号形成及,由收集到的最新信息,依据社会稳定预警体系形成预警信号,对信号按照给定的标准进行分类,把预警信号向社会公布。

三、社会矛盾预警的大数据分析云平台

上述分析表明,社会矛盾预警分析主要以反映社会矛盾的具体社会事件为分析对象。由于社会各行各业每时每刻都会产生新的社会矛盾及社会事件,同时又有社会矛盾及社会事件由于得到化解而消失,因此,社会矛盾预警分析将要面对的是海量实时数据的分析,传统的数据分析工具和手段将难以满足需求,需要采用面向海量数据的分析工具和手段,即大数据分析和云计算。

(一)大数据与云计算

大数据与云计算是一个硬币的两面,云计算是大数据的IT基础,大数据是云计算最具发展潜力的应用。

1.大数据

大数据( Big Data)并非一个确切的概念,最初是源于自然科学领域,指需要处理的信息量过大,已经超过当时一般电脑在处理数据时所能使用的内存量。随着互联网和数据处理技术的快速发展,大数据已不再仅用来描述大量的数据,还包涵了处理数据的技术以及相关的应用及其对其他领域的影响。“大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上是无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。(维克托·迈尔一舍恩伯格、肯尼思·库克耶,2013)”

大数据是数据、技术和应用三者的统一。(1)海量数据,是大数据发展的基础,具有三个主要特征:数据体量巨大,从TB(太字节)级别跃升到PB(拍子节)级别;数据类型繁多,包括网络日志、社会数据、互联网文本和文件、互联网搜索索引等;价值密度低,以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。(2)人数据处理技术,是以很经济的方式,以高速的捕获、发现和分析技术,从各种超大规模的数据中提取价值的分析手段和方法(胡雄伟、张宝林、李抵飞,2013)。大数据处理技术的典型特点是处理速度快,尤其是能够对大量的实时数据进行快速处理。(3)大数据应用,通过采用大数据分析技术,就可以实现对海量的、多样化的数据进行交换、整合和分析,从中发现新知识、创造新价值。应用范围广泛,如宏观经济预测、市场分析、气候预测、流行病传染分析、智能交通以及社会管理等方面。

2.云计算

云计算( Cloud Computing)足一种基于互联网的超级汁算模式,利用互联网的高速传输能力,将数据的处理过程从个人计算机或服务器移到互联网上的计算机集群中,在这种计算模式下,计算业务将不再局限于个人的计算机和企业计算中心,而是由一个大型的数据处理中心管理,数据中心按客户的需要分配计算资源,用户感觉自己就是在直接使用超级计算机,提供资源的网络就是“云”(陈涛,2009)。在云计算环境下,计算服务或者信息服务就如水、电等资源一样,可以实现随时获取,按需使用,按使用付费。

云计算具有如下特点:超大规模,Google云计算已经拥有一百多万台服务器,企业私有云一般拥有数百上千台服务器;虚拟化,云计算不仅支持应用软件服务,而且支持硬件服务,用户可以由“云”获得虚拟化的储存器、计算中心以及网络设备等;高可靠性,“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性;通用性,即“云”可以支持不同的应用请求,如学术研究、家庭娱乐、公司财务分析、政府社会管理等所有可能的应用;按需服务,向“云”购买服务就如购买水、电、煤气一样实行按需购买和使用(李永宏,2013)。

(二)社会矛盾预警的大数据分析云平台架构

社会矛盾预警的大数据分析云平台是以云计算作为IT架构、以大数据分析作为主要技术分析手段智能化的社会矛盾预警综合管理信息系统。

1.社会矛盾预警的大数据分析云平台整体架构

社会矛盾预警的大数据分析云平台由基础服务层、数据分析层和终端层组成,如图2所示②。

(1)基础服务层

基础服务层的主体是社会矛盾公共信息云计算平台,其主要功能包括两方面:一是把发生在各个领域、各个部门以及各个行业的社会矛盾及其相关信息进行汇总、整合,并把收集到的社会矛盾信息传输到数据分析层,供社会矛盾预警大数据分析平台进行分析;二是接收数据分析层形成的结论或者结果,并把这些结论作为经验或者知识供各个领域、各个部门及各个行业的相关人员学习和借鉴,以提升化解社会矛盾和纠纷的能力。

由于既要全面及时地汇集各个领域、部门和行业的社会矛盾信息并进行整合,同时还要与数据分析层保持良好的数据沟通,这不仅要求社会矛盾公共信息云计算平台的数据处理能力强,而且系统的安全性、稳定性以及数据的准确性也至关重要。

(2)数据分析层

数据分析层的主体是社会矛盾预警大数据分析平台,其重要功能包括三方面:一是把基础服务层提供的社会矛盾信息进行数据化,利用大数据分析技术和方法,产牛能够对认识和化解社会矛盾提供有效支持的信息,并把这些反映社会矛盾状况的信息集中存储,形成知识库;二是依据社会需求,把反映当前社会矛盾发展状况的社会矛盾预警信号通过信息平台对外,为相关主体或部门进行决策和判断提供支持;三是把解决社会矛盾的成功经验和模式作为知识传输到基础服务层,供相关部门和人员学习和借鉴。

社会矛盾预警大数据分析平台需要具备数据的准确性、分析的实时性和功能的多样性等特性。数据的准确性要求进行大数据分析所采用的模型必须经过充分和严格地验证,并且要定期进行模型稳定性评估;分析的实时性要求平台能够反映社会矛盾发展演变的最新态势,以便相关主体能够做出有效决策和判断;功能的多样性要求平台具有多维度的分析能力,如时间上可以反映每天、每周、每月的状态,在受众上可以满足政府、机构和公众的需求,在数据模型上既可以反映现状也可以进行趋势预测等。

(3)终端层

终端层的主体包括两部分,一是社会矛盾状况信息存储平台,一是社会矛盾预警信号平台。社会矛盾状况信息存储平台是把大数据分析平台得到的反映社会矛盾状况的信息和知识进行存储,一方面可以为研究人员开展社会矛盾研究提供信息资料;另一方面作为大数据分析平台的知识储备。社会矛盾预警信号平台将数据分析层产生的结果,依据不同的需求,提供和展示不同的社会矛盾发展演变状况信号。

终端层需要能够提供多样化的输出结果,提供给科研人员用于科学研究的信息应该讲求完整性和专业性,提供给公众用的信息应该通俗易懂和强调有用性,提供给政府部门的信息应该偏向宏观性等。

社会矛盾预警的大数据分析云平台具体的技术实现思路是,采用大数据分析技术处理和存储社会矛盾数据,结合大数据与云计算技术,利用专家模型库对海量社会矛盾数据进行多维度的分析和挖掘,并通过云平台服务,将分析结果传达至各类平台和应用终端,提高对社会矛盾发展演变状况的实时感知能力,使相关主体能及时完成对社会矛盾的评估和决策,推动社会矛盾和纠纷的智能化处置。

2.社会矛盾公共信息云平台的逻辑结构

社会矛盾公共信息云平台在基础设施和最终用户之间分为三层,即基础设施服务层、平台服务支持层以及应用软件服务层,参见图3。

物理基础设施即支持整个平台运行的各种信息设备,如机房、电源、服务器、网络设备以及各种终端等。

基础设施服务层通过虚拟化技术,以服务的形式,为整个社会矛盾公共信息云平台提供各种硬件、服务器、网络设备、通信设备、数据库和操作系统服务。换言之,在建立社会矛盾预警的大数据分析云平台过程中,各个具体部门既不用单独额外配置计算机、网络设备等硬件,也不用额外购买数据库和操作系统等软件,只需在原有网络基础上获得进入社会矛盾预警大数据分析云平台的权限即可,再通过必要的系统使用培训,就可以使用该平台。

平台服务支持层主要是为应用软件服务层提供平台支持系统和平台开发功能。平台支持包括认证管理服务、权限管理服务、用户管理服务、日志管理服务、注册管理服务、目录管理服务、邮件管理服务和消息管理服务等软硬件功能。平台开发功能包括根据不同职能部门的需求,设计不同的社会矛盾应用软件,以及为跨部门的社会矛盾信息交换提供支持等。

应用软件服务层为各个具体部门提供基于本部门职能的分析和化解社会矛盾所需要的各种应用系统和软件服务,并提供各个部门进入平台的界面。在社会矛盾预警云计算平台下,与处置社会矛盾相关的所有职能部门如法院、派出所、居委会、民事纠纷调解中心等都不用自己开发与处置社会矛盾相关的应用软件,利用个人电脑、移动终端就可以进入社会矛盾预警云平台,一方面把本部门正在处置的社会矛盾相关信息输入系统中,另一方面可以由平台中获得如何处置社会矛盾相关的信息和知识。

在社会矛盾公共信息云平台的逻辑结构中,上层可以调用其直接或间接的下层所有功能,同层次各个模块之间也可以相互调用其各自的数据信息。

[

参考文献]

[1]安然,2011,《社会治理创新视角下内蒙古社会矛盾预警机制的建立》,内蒙古大学硕士学位论文。

[2]陈涛,2009,《云计算理论及技术研究》,《重庆交通大学学报(社科版)》第4期。

[3]胡雄伟、张宝林、李抵飞,2013,《大数据研究与应用综述(上)》,《标准科学》第9期。

[4]李永宏,2013,《大数据与云计算》,《统计与管理》第6期。

[5]汤志伟、杜斐,2013,《群体性事件演化轨迹的定性模拟研究》,《社会科学研究》第4期。

[6]王林、吴贻龙,2013,《社会矛盾预警的运行机制》,《社会科学家》第4期。

[7]王林、黄利芳,2014,《基于因果倒逼的宏观社会矛盾预警指标体系构建》,《上海大学学报(社会科学版)》第5期。

[8][英]维克托·迈尔一舍恩伯格、肯尼思·库克耶著,《大数据时代——生活、工作与思维的大变革》,盛杨燕、周涛译,2013杭州:浙江人民出版社。

[9],2004,《妥善化解社会矛盾全力维护社会稳定》,《求是》第3期。

[10]杨乙丹,2013,《群体性事件的链式演化与断链防控治理》,《甘肃社会科学》第5期。

第15篇

关键词 分类信息;数据仓库;平台设计

中图分类号TP392 文献标识码A 文章编号 1674-6708(2010)31-0212-02

0 引言

分类信息又称分类广告,它是WEB2.0的衍生物,是新一代互联网应用模式。日常在电视、报刊上所看到的广告,往往是被强加给观众和读者的,这类广告称为被动广告。而人们主动去查询招聘、租房、旅游等方面的信息,对这些信息,称它为主动广告,也即是本文所说的分类信息。分类信息的崛起,很好的弥补了传统分类广告的不足。它不仅信息量大,而且信息随时在线。更重要的是利用分类搜索,可以保证用户在任何时间、任何地点,都能非常方便快捷的查询。它也以内容编排精细化、及时、空间无限等特质,在大众生活及商务活动中备受关注和喜欢。

1 数据仓库系统

1.1 数据仓库具有以下4个最基本的特点

1)面向主题(Subject-Oriented):所谓主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。

2)集成性(Integrated):数据仓库的数据由于不是面向应用,所以并不关心细节数据,而是从原有的数据库中抽取出来的,并经过统一和综合,再进入数据仓库中。

3)稳定性(Non-Volatile):数据仓库的数据主要供企业决策分析之用,主要涉及的数据操作时数据查询,一般情况下并不进行修改操作。

4)时间变异性(Time-Variant):在数据仓库中,数据记录总含有一个时间属性,仓库中记录了数据随时间变化的历史。

1.2 一般数据仓库系统的体系结构分为4个层次

1)数据源。是数据仓库系统的基础,是整个系统的源泉。

2)数据的存储与管理。是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储与管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。针对现有各业务系统的数据,进行抽取、清理、并有效集成,按照主题进行组织。该过程是通过ETL Server将数据源中的操作型数据经过必要的转换,重组导入数据仓库。

3)前段工具。主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中,数据分析工具主要针对OLAP服务器;报表工具、数据挖掘工具主要针对数据仓库。

4)数据用户。即历史数据等报表的使用者,一般为企业决策者。

1.3ETL策略设计

ETL指的是数据抽取、数据转换与数据加载。

1)数据抽取。它完成从原有操作型数据库中选择与数据仓库主体域相关的细节数据抽取到数据仓库中。同时,数据抽取还要考虑源数据环境和ETL开发环境的接口问题,不同的业务系统有不同的平台,相应地采用不同的数据抽取接口,一般应根据实际情况选择可靠合适的源数据接口。比较典型的源数据接口有数据库接口和文件接口。

2)数据转换。数据仓库的源数据之间往往出现不一致的字段长、不一致的赋值等问题。数据转换负责将数据名称和格式进行统一,同时对不存在的数据赋缺省值,创建新的数据逻辑视图。数据转换的目标是将每个字段转换为符合数据仓库标准的数据格式。

3)数据加载。数据加载有插入、增加和刷新3种模式。插入式加载对目标表进行增量操作;增加式加载需要对目标表同时做更新及插入操作,根据主键,对于已有的记录进行更新,对于不存在的记录做插入操作。

2 数据仓库技术在分类信息中的应用

2.1 分类信息对数据仓库技术的需求分析

本文分析的是某跨国公司需要将其多个国家不同平台的分类信息数据整合到统一格式的数据仓库系统。具体这些信息包括广告、用户、回复、目录、地址、支付、收费项目、网站等。它们的历史数据为决策者们提供决策依据。

1)广告:用户免费将广告到其所在地的分类信息平台。这些广告通常包括租房信息、工作招聘信息、闲置物品二手交易信息等。

2)用户:即广告投放者、回复广告用户以及注册用户。在该分类信息应用中,非注册用户也可以投放以及回复广告。

3)回复:当网页浏览者对广告感兴趣时,可以通过回复广告即发邮件给投放者与对方联系。

4)目录:广告的类别,又划分为多级子目录。根目录如工作、房屋、汽车、宠物、服务等,在工作的根目录下又细分为公寓出租、短期出租、旅游出租等。广告被放在最底目录下。

5)地址:分类信息一般为同城交易,因此广告也只对同一城市或者地区有效。这样,广告投放者所在的地址信息如国家、城市甚至地区就变得至关重要。

6)收费项目:包括延长广告有效期(默认免费广告有效期为3个月)、将广告靠前排放、彩色个性投放广告等。

2.2 分类信息网站数据仓库平台的ETL设计

本系统采用E-L-T,即先将源数据从各个国家的操作型数据库中抽取出来,再将这些数据直接装载到数据仓库平台的DBMS - Teradata,最后在Teradata中对数据进行清洗转换。由于Teradata有并行处理兼线性增长的数据处理功能,这样设计的成本与性能要强于传统的抽取-转换-装载流程。ETL的具体过程分为以下几步:

1)使用Shell脚本将需要的字段从源操作型数据库的表中选取出来,该步骤将抽取得到的数据生成由分割符和源数据组成的FLAT FILE。每次从不同的源数据平台上抽取数据时,只需编写对应的SELECT SQL语句;