美章网 资料文库 灰色关联分析下网络舆情热点事件研究范文

灰色关联分析下网络舆情热点事件研究范文

本站小编为你精心准备了灰色关联分析下网络舆情热点事件研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

灰色关联分析下网络舆情热点事件研究

摘要:通过对网络舆情热点事件特点的分析,建立了搜索指数、舆情关注度等5个定量指标构成的网络舆情热度评判体系。在此基础上,运用灰色关联分析求解关联度的方法,近似得到了若干个热点事件的网络舆情热度值排序,可以为有关部门分类分级管理网络舆情热点事件提供参考。

关键词:网络舆情;指标体系;灰色关联分析;热点

截至2016年12月,我国网民规模已达7.31亿,互联网普及率达到53.2%[1]。互联网信息技术的飞速发展深刻改变了人类的生活方式和社会结构,人类社会逐步分化为现实社会和虚拟社会。现实社会里发生的每件事情几乎都会投射到虚拟社会中产生网络舆情,其中大部分都会很快消失在虚拟社会的信息海洋中,但是也有少部分舆情会在一定的时间段内引发网民和媒体的大量关注,并持续较长时间,从而形成网络舆情热点[2]。网络舆情热点的形成具有自发性,且涉及面覆盖社会生活的方方面面,是人们对某一事件共同看法和情绪的集合。如果不及时关注和引导,在某些因素作用下,比如来自网络推手的恶意推动,会使负面情绪占据上风,甚至可能从线上向线下转移,引发群体性事件,不利于社会的和谐稳定,这就是网络舆情热点所带来的负面效应。因此,网络舆情热点的研究对于政府部门掌握民意、管理社会、制定政策具有重要意义。

为了对不同的舆情热点事件进行比较和研究,在这里引入“热度”的概念。热度是指关于某一事件网络舆情的高涨程度,表现为相关舆情量和舆论扩散范围的大小[3]。发现热点,判定热度是网络舆情管理的前提和基础,国内许多学者都对其进行了深入研究。姜胜洪[4]在分析当前网络舆情热点现状的基础上,总结了网络舆情热点的发生与发展规律,并提出了培养“意见领袖”进行舆论引导的策略。王长宁[5]在分析微博舆情传播特点的基础上,从微博信息、微博者和微博受众3个维度建立了微博舆情热度监测及预警指标体系。王国华[6]从舆情关联的视角出发,分析了网络舆情热点的演化规律。王伟[7]针对传统的一次聚类的舆情分析方法的不足,根据热点簇特征向量对网页进行二次聚类,提升了网络舆情热点分析的准确性。刘勘[8]提出了一种基于马尔可夫链的舆情热度趋势分析模型,实现了由发现网络舆情热点到预测热点的转变。以上学者对网络舆情热点的研究主要集中在两个方向:一是研究网络舆情热点的形成条件、演化规律,构建热度评价指标体系,提出应对策略等。二是基于某种算法或者模型,实现对网络舆情热点的抓取和分析,并逐渐向着计算机自动发现与预测的方向发展。该文章在前人研究的基础上,建立了网络舆情热度评判指标体系,利用灰色关联分析来获得某时间段内集中出现的网络舆情热点事件的热度值排序,以供相关部门把握主次,根据热度值分级应对。

1网络舆情热度评判指标

在构建网络舆情热度评判指标体系时主要考虑3个方面的问题:(1)该指标要能全面客观反映热点事件舆情变化的真实情况,因此要尽量使用定量指标,避免定性指标;(2)定量指标要方便获取数据,以保证舆情热度分析的时效性和准确性;(3)指标体系要具有普适性。基于以上3点,并参考了网络舆情热度指标体系研究的相关文献,文章采用搜索指数、舆情关注度、网民相关言论数量、网络媒体图文报道数量、事件平均持续时间共计5个指标来评判网络舆情热度。

1.1搜索指数

搜索指数指被搜索引擎检索的关键词在特定的时间段内的网络曝光率及用户关注度,它是一个实时的动态指标,一定程度上反映了关键词所代表事件的网络舆论热度变化趋势。基于百度搜索引擎庞大的用户规模和巨大影响力,文章以百度公司提供的网络舆情热点事件在对应时间段内最高百度指数来近似替代搜索指数值。

1.2舆情关注

度舆情关注度一般用某主题下相关网页的数量来表示[9],包含该主题内容的网页越多,则舆情关注度越大,该热点事件的舆情热度就越高。

1.3网民相关言论数量

网络舆情热点形成后会在网上引发激烈讨论,网民通过发表各种意见和评论的方式参与进来[10],这些相关言论数量越多,表明网络舆情热度值越高。为了方便数据采集与比对,该指标的数据主要来源于新浪微博。

1.4网络媒体图文报道数量

网络媒体是指区别于电视、报纸、广播等传统媒体,运用网络技术进行信息交流与传播的媒介,比如新浪、腾讯、网易等。热点舆情事件发生后网络媒体会发表大量原创或转载的新闻报道,因而可以在一定程度上反映网络舆情热度。

1.5舆情持续时间

任何事件引发的网络舆情都有一定的生命周期,该指标值即指相关事件从开始引发网络舆情到基本平息所持续的时间。

2灰色关联分析的应用

灰色关联分析是指对一个系统发展变化态势进行定量描述和比较的方法,其基本思想是通过比较参考数列和若干个比较数列之间几何形状相似程度来判断其联系是否紧密[11]。灰色关联分析法是一种多因素统计分析方法,它的优点在于少量的样本容量就可以满足需求,对无规律的数据同样适用,不会出现量化结果与定性分析结果不相符的情况,这样很大程度上减少了由于信息不对称带来的损失。文章选取2016年7月中下旬集中发生的5件典型网络舆情热点事件作为研究对象。

2.1比较数列和参考数列的确定

比较数据是指影响系统行为的因素组成的若干组数据序列,记为:00000X(n)(X(1),X(2),X(3),...,X(n))。按照表1中网络舆情热点事件对相应指标数据进行全网采集,得到比较数列的原始数据,如表2所示。参考数列是指反映系统行为特征的数据序列,记为()((1),(2),(3),...,()),0,1,2,...,iiiiiXnXXXXnik文中,选取比较数据每一列的最大值作为参考数列。

2.2原始数据的无量纲化处理

数据的无量纲化处理是指通过某种计算方法将有量纲的系统数值的绝对值转变成无量纲的相对值,主要解决数据的可比性问题以及简化计算[12]。常见的无量纲化处理方法主要有极值法、标准化、均值化以及初值化方法,文中采用初值化法对原始数据进行处理,如表3所示。

2.3求解关联系数()in

关联系数是指比较数列和参考数列在各个时刻的关联程度值。

2.4计算关联度,排关联序

关联度实际上就是各个时刻(曲线中各点)的关联系数的平均值,用来衡量比较数列与参考数列之间的关联程度。

3结语

自媒体时代,信息传播和交互的速率极高,现实生活中的任何事件都有可能在网络空间中被“放大”,成为网络舆情热点。这些热点舆情有可能是倾向于正面的,也有可能是倾向于负面的,而且热度值存在很大差异。此文研究工作的意义在于提供了一种比较科学的网络舆情热度排序方法,当热点事件集中出现时,可以为有关部门提供全面、准确的参考信息,对于网络舆情管理具有重要意义。文章也存在一定的局限性,主要在于灰色关联分析需要对各指标的最优值进行现行确定,而网络舆情是不断动态变化的,因而各指标的最优值难以确定,需要在接下来的研究中加以改进。

参考文献

[1]中国互联网络信息中心.第39次中国互联网络发展状况统计报告[EB/OL].(2017-01-22).

[2]张润莲,兰月新,王彩华,等.网络群体性事件演化博弈分析及对策研究[J].图书与情报,2016(4):24-30.

[3]曹学艳,张仙,刘樑,等.基于应对等级的突发事件网络舆情热度分析[J].中国管理科学,2014(3):82-89.

[4]姜胜洪.网络舆情热点的形成与发展、现状及舆论引导[J].理论月刊,2008(4):34-36.

[5]王长宁,陈维勤,许浩.对微博舆情热度监测及预警的指标体系的研究[J].计算机与现代化,2013(1):126-129.

[6]王国华,邓海峰,王雅蕾.网络热点事件中的舆情关联问题研究[J].情报杂志,2012,31(7):1-5.

[7]王伟,许鑫.基于聚类的网络舆情热点发现及分析[J].现代图书情报技术,2009(3):74-79.

[8]刘勘,李晶,刘萍.基于马尔可夫链的舆情热度趋势分析[J].计算机工程与应用,2011,47(36):170-173.

[9]王青,成颖,巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作,2011(8):54-57,111.

[10]苏国强,兰月新.基于SIR的突发事件网络谣言扩散模型研究[J].武警学院学报,2013(4):90-92.

[11]徐凤银,朱兴珊,颜其彬,等.储层含油气性定量评价中指标权重的确定方法[J].西南石油学院学报,1994(4):11-17.

[12]兰月新,王芳,张秋波,等.大数据背景下网络舆情主体交互机理与对策研究[J].图书与情报,2016(3):28-37.

作者:周颖;高扬;周杰;刘茉;夏一雪;张鹏 单位:中国人民武装警察部队学院

精品推荐