本站小编为你精心准备了网络舆情预测与分级方法研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
摘要:[目的/意义]建立一套行之有效的网络舆情预测和分级管理系统对提高政府网络监管效率具有重大意义。[方法/过程]分时段记录网络舆情事件的新浪微指数、百度指数、头条指数作为事件热度的衡量指标,运用EGM(1.1)模型对舆情事件的发展趋势进行预测,并在预测数据基础上,运用灰色关联分析方法,提出网络舆情事件分级方案。综合运用上述两模型确立的舆情监管体系对“江歌案宣判”“携程虐童案”“莫焕晶案二审宣判”等事件进行分析评价。[结果/结论]模型在处理舆情管理问题方面具有良好的适用性和精确性。结合舆情事件特点与分析结果,向政府及公司危机公关部门等提出了相应建议。
关键词:网络舆情;灰色系统理论;舆情预测和分级;实证研究
随着时代的发展,互联网越来越成为表达民意,反映舆情的重要平台,尤其是“微博”“微信”等“自媒体”社交软件的快速发展,使得网络舆情成为社会舆情环境的重要组成部分。与传统舆情相比,网络舆情具有不确定性更大、传播速度更快、反应时间更短等特征[1],这意味着在网络舆情事件爆发前后,能利用的数据仅包括几小时内的少量数据,可利用信息非常贫乏,事件发展趋势,群众态度倾向等更重要的舆情方面也存在不确定性大的问题。这不仅给广大研究学者抛出了一个难题,也在很大程度上增加了政府等管理部门对于舆情事件的监管和把控难度。基于此,本文提出运用灰色系统理论知识,构建基于EGM(1.1)模型和灰色关联分析方法的网络舆情预测和分级管理系统。灰色系统理论研究对象是“部分信息已知,部分信息未知”的“小样本”“少数据”“贫信息”不确定系统[2]。结合前文提到的网络舆情“可利用信息贫乏”“不确定性大”等特点,可以得出:舆情事件监管相关系统符合灰色系统特征,适用灰色系统理论相关算法与模型。灰色系统理论能够提供解决网络舆情事件“数据少”“不确定性高”等问题的新思路。
1文献回顾
目前,关于如何解决网络舆情事件的预测和分级管理问题,国内外学者做出了很多深入的研究,提出了诸多不同的方法和模型。从现有的研究成果来看,研究方法主要分为以下三类。1.1基于运筹管理思想的解决方法基于运筹管理思想的方法主张构建舆情事件评价指标体系,在评价指标体系的基础上,运用德尔菲法、模糊综合评判、AHP层次分析法等运筹管理方法,赋予不同指标不同的权重,最终得出对不同事件的热度评价。此类方法注重对事件的事后评价,根据不同的热度对事件进行分级,为管理者提供管理建议。其中,李文杰等采用分层抽样法,以网络、专家和纸质问卷调查相结合的方式得到各级指标量权重,并在此基础上通过多级模糊综合评判方法建立了舆情信息安全的模糊评判模型,实现了对舆情事件的分级与评价[3]。刘健等根据信息传播效果的“认知—情感—行为”阶梯模式理论,利用模糊数据包络分析法建立了微博舆情信息传播效果评价指标体系,从控制传播效果的角度提出了监管建议[4]。王高飞等将层次分析法与模糊综合分析法相结合,构建了移动社交网络舆情预警模型,并以“8•12天津港爆炸事故”进行实证分析,证明了该模型的有效性和准确性[5]。刘毅利用基于三角模糊数的模糊德尔菲法和模糊层次分析法,实现了对某一具体公共事务或热点话题的分析评价[6]。
1.2基于计算机算法的解决方法
基于计算机算法的方法将很多先进的计算机算法迁移到舆情监管的领域中,通过赋予算法参数舆情管理相关方面的现实意义,适当修改模型,实现对舆情事件的分析评价过程。此类方法成功运用了计算机反映速度快、并行处理和分布式处理能力强等优点,能够在一定程度上适应舆情事件爆发速度快、反应时间短的特性。其中,梁晓贺等基于超网络分析法构建了包含用户—观点—情感—时序阶段4层子网的超网络模型,以达到预测舆情主题演化的目的[7]。田世海等运用SVM算法完成对突发性安全事件的舆情预警工作,并应用MATLAB进行仿真实验,证明了模型的切实可行性[8]。郭韧等利用可拓聚类理论对网络舆情的演化趋势进行建模并预测,通过聚类分析得到预测结果[9]。张一文等结合贝叶斯算法的特点,建立网络舆情态势评估模型,从而对网络舆情态势进行有效评估[10]。胡悦等以微博为研究对象,运用模糊神经网络算法,提高了微博舆情发展趋势预测的准确性[11]。何建民等运用隐马尔科夫模型理论,选择网民特征、信息主题和信息内容完整度三维指标,实现了对微博舆情演化的预测[12]。Yang等提出了一套改进的SVM算法,并以此为基础实现了对网络事件参与者的观点预测[13]。
1.3基于在线数据抓取和内容分析技术的解决方法
基于在线数据抓取和内容分析技术的方法主要通过抓取监控平台内的评论信息,对采集到的文本使用文本分析方法,以达到及时发现和预测舆论发展方向,了解大众态度倾向的目的。此方法具有实时性高,能够反映大众态度倾向的优点。在此类研究中,安璐等学者采用基于词典的情感分析方法,在识别与预测网络舆情潜在问题方面提出了自己的观点[14]。赵晓航以新浪微博“天津爆炸”话题为例,为突发事件下政府如何利用微博平台收集、研判、应对网络舆情事件提供了科学的分析方法和应对手段[15]。董坚峰利用web挖掘技术,构建了突发事件网络舆情预警系统模型,实现了对突发事件的自动分级处理[16]。李彤等通多对微博内容的情感分析与集成,达到了对于微博舆情趋势预测的目标[17]。王英等利用爬虫工具和文本分析技术对微博内容进行处理,最终完成对网络舆情事件的研判过程[18]。V.Gopalakrishnan等通过抓取病人对药品的评论信息,运用情感分析的方法,实现了对病人意见观点的预测和分析[19]。W.Cherif等则是对一个旅游网站上的625条阿拉伯语评论进行分析评价从而达到了对使用阿拉伯语的人群进行意见分类和观点预测目标[20]。综上所述,目前国内外学者对如何解决网络舆情预测和分级管理问题的相关研究众多,但现有成果缺少对舆情事件预测和分级管理两个方面的综合性深入研究。部分学者注重舆情的预测环节,着重于构建能够研究舆情事件未来走势、话题演化预测、观点预测等方面的系统。这类系统往往建设复杂性高,成本预算大。部分学者注重对舆情事件的分析评价,为以后管理者处理类似舆情事件提供建议,而此类方法注重事后分析,实时性太差,无法适应网络舆情爆发快、反应时间短的特点。基于以上分析,本文主张以灰色系统理论的EGM(1.1)模型与灰色关联分析方法为基础,利用EGM(1.1)模型良好的预测性及灰色关联分析法优秀的分类准确性,构建网络舆情预测与分级管理体系,实现预测和分级的统一。此外,本文以新浪微指数、百度指数、头条指数三项指标数据构建舆情事件的衡量指标体系,三项数据采集方便且数据实时性高,一方面极大减少系统构建成本,另一方面也能很好适应舆情事件爆发快,反应时间短的特性。
2网络舆情预测与分级管理体系构建
2.1网络舆情衡量指标体系
利用相关指标量建立对事件热度或影响度的衡量指标体系是解决舆情事件相关监管问题的首要步骤。本文采用新浪微博的微指数、百度搜索的百度指数、今日头条的头条指数三种指数作为事件热度的评价指标。三种指数分别为新浪、百度、今日头条三家公司基于大数据处理技术建立起的大数据平台,其原理是在公司掌握的相关关键词的用户搜索数、互动数等数据基础上,运用大数据算法计算而来。指数功能推出至今,在处理舆情问题上成果不甚显著,其中陈涛等以百度指数和谷歌趋势数据为基础,实现了对“小悦悦事件”等热点时事的分析[21]。王康等以百度指数作为公司舆情热度指标,为公司应对舆情危机提供方法依据[22]。张玉强构建了基于新浪微指数的阶段性事件演化分析体系,为事件的识别与演化分析提供了新思路[23]。三大指数功能除了应用前景广阔外,还具备数据方便易得的特点,只需登录相应官方网站即可搜索获得,数据的时效性和完整性也较高。因此,本文认为以舆情事件的三大指数值为基础建立的事件热度衡量体系具有合理性和优越性。
2.2基于EGM(1.1)模型的舆情预测过程
在灰色系统理论中,GM系列模型是灰色预测理论的基本模型,尤其是邓聚龙教授提出的GM(1.1)模型,已在很多领域成功应用。该模型是一种时间序列预测模型,它能根据少量信息进行建模与预测,因而得到广泛的应用。GM(1.1)模型发展至今已有很多优化和改进,其中刘思峰教授针对不同模型的性质和原始数列的特点,提出了4种GM(1.1)模型的基本形式,即:均值GM(1.1)模型(EGM)、原始差分GM(1.1)模型(ODGM)、均值差分GM(1.1)模型(EDGM)、离散GM(1.1)模型(DGM)。具体应用中应根据不同的应用情景和原始数据的特点选择不同的模型[24]。在舆情事件发生后,登录相关指数官方网站即可记录事件具体指数值。本文以“江歌案宣判”“携程虐童案”“莫焕晶案二审宣判”三个舆情事件为例进行模型的建立和检验过程。采集到的相关舆情事件原始数据见表1。从表1中可以看出,数据序列单调性规律不强,增长区间的增长速度也没有达到指数级增长速率,基本符合振荡序列、非指数增长序列的特点。而且诸多学者也表示舆情领域的数据序列属于振荡序列[25]。因此,根据刘思峰教授的主张:对于非指数增长序列和振荡序列,应首选微分、差分混合形态的均值GM(1.1)模型(EGM)。
2.3基于灰色关联分析的舆情事件分级过程
基于前文介绍的模型可得舆情事件未来几小时内的指数数据,但是得到这些数据尚不能完成舆情事件监管管理任务,进一步地根据所得数据对舆情事件未来发展态势进行甄别,针对事件热度等级的不同提出建议,达到提前采取行动,防止公共危机事件发生的目标。灰色关联分析方法是本文处理舆情事件分级的主要方法。灰色关联分析是一种对系统发展变化态势进行定量描述和比较的方法,其基本思想是通过比较参考数列和若干个比较数列之间相似程度来判断其联系是否紧密。此模型所具备的样本量需求少,对无规律数据同样适用,不会出现量化结果与定性分析结果不符等优点,能够适应网络舆情特殊环境,为判别舆情事件等级提供简便可行的方法。目前,学术界已提出了基于相似性视角和接近性视角的两种新型灰色关联分析模型,基于相似性视角的模型主要用于衡量参考序列在几何形状上与待评价数据的相似程度,基于接近性视角的模型主要用于衡量参考序列在空间中所处位置上与待评价数据的接近程度[26]。舆情事件分级的基本思路是:首先定义舆情事件的四个等级“蓝色”“黄色”“橙色”“红色”。其中“蓝色”代表舆情事件的发展态势不是很紧急,不需过度进行干涉或防范;“黄色”代表相应的舆情事件已有扩大的苗头,需提高警惕;“橙色”代表相应的舆情事件已非常紧急,相应的措施应尽快实施起来;“红色”则代表舆情已大范围扩散,必须采取强力措施进行舆情干涉。其次,通过经验总结及专家评估的方式给出舆情事件四个等级分别对应的基准值。最后,将一个舆情事件某个时刻的三个指数值的序列数据作为待评价数列,通过比较四个等级的基准值与待评价数列接近程度,得出舆情事件的等级。此处思想与基于接近性视角的灰色关联模型相近,因此以此模型作为舆情事件分级的方法。
3实证研究
以三个典型舆情事件“江歌案宣判”“携程虐童案”“莫焕晶案二审宣判”为例,进行数据分析(原始数据见表2)。
3.1预测过程
以各事件的某指数值的时间序列作为原始数据列带入前文2.2节所介绍模型,经计算可得每个模型的关键数据。
3.2分级过程
将原始数据指数值与得到的预测值代入2.3节所介绍的灰色关联分析法模型中,可对每个时刻的舆情事件等级进行分级。
3.3结果说明与管理建议
将3.1节与3.2节所得结果进行综合,即可得最终结果。
4结束语
本文以灰色系统理论为基础,以新浪微指数、百度指数、头条指数为指标量,构建了一套网络舆情预测与分级管理体系。通过对三大指数的应用,解决了现有体系构建成本高、数据采集困难且数据实时性差的难题,并针对网络舆情不确定性更大、传播速度更快、反应时间更短所带来的问题,运用灰色系统理论,将具有良好预测性的EGM(1.1)模型及具有良好分类准确性的灰色关联分析法相结合,实现了对舆情事件预测与分级管理两大步骤的综合运用。最后通过对三个典型舆情事件“江歌案宣判”“携程虐童案”“莫焕晶案二审宣判”的案例分析研究,验证了本文所提方法的合理性和准确性,并结合舆情事件的特点给出了相应管理建议。在网络舆情监管形势日益严峻的大环境下,本文提出了一套建构简便而又科学有效的网络舆情预测与分级管理体系,为提高政府的网络舆情监管效率做出了贡献,对于保护国家信息安全,构建和谐网络环境具有重要意义。本文研究还存在一些局限:首先,三大指数具有很明显的各自公司的特点,以三大指数为指标量仅能反映舆情事件在微博、百度、今日头条的发展形势,若要全面反映舆情态势需进一步完善现有网络舆情指标体系。其次,本文虽能得到各舆情事件在不同时刻的热度及相应的舆情等级,但并未总结不同类型舆情事件的不同发展特点,也未总结针对不同舆情情况的管理方法,后续研究应进一步研究舆情事件的发展规律,建立完善的舆情应对方法体系。
参考文献
[1]张艳丰,李贺,彭丽徽,等.基于语义隶属度模糊推理的网络舆情监测预警实证研究[J].情报理论与实践,2017,40(9):82-89.
[2]刘思峰,党耀国,方志耕,等.灰色系统理论及其应用[M].北京:科学出版社,2005:13.
[3]李文杰,化存才,何伟全,等.网络舆情信息的综合评价指标体系构建与模糊评判模型[J].情报科学,2015(9):93-99.
[4]刘健,毕强,李瑞.微博舆情信息传播效果评价指标体系构建研究——基于模糊数据包络分析法[J].情报理论与实践,2016,39(12):31-38.
[5]王高飞,李明.基于AHP-模糊综合分析的移动社交网络舆情预警模型研究[J].现代情报,2017,37(1):41-44.
[6]刘毅.基于三角模糊数的网络舆情预警指标体系构建[J].统计与决策,2012(2):12-15.
[7]梁晓贺,田儒雅,吴蕾,等.基于超网络的微博舆情主题挖掘方法[J].情报理论与实践,2017,40(10):100-105.
[8]田世海,吕德丽.改进潜在语义分析和支持向量机算法用于突发安全事件舆情预警[J].数据分析与知识发现,2017,1(2):11-18.
[9]郭韧,李红,陈福集.基于可拓聚类的网络舆情演化预测研究[J].情报理论与实践,2017(1):83-87.
[10]张一文,齐佳音,方滨兴,等.基于贝叶斯网络建模的非常规危机事件网络舆情预警研究[J].图书情报工作,2012,56(2):76-81.
[11]胡悦,王亚民.基于模糊神经网络的微博舆情趋势预测方法[J].情报科学,2017,35(12):28-33.
[12]何建民,李雪.面向微博舆情演化分析的隐马尔科夫模型研究[J].情报科学,2016,34(4):7-12.
[14]安璐,吴林.融合主题与情感特征的突发事件微博舆情演化分析[J].图书情报工作,2017(15):120-129.
[15]赵晓航.基于情感分析与主题分析的“后微博”时代突发事件政府信息公开研究——以新浪微博“天津爆炸”话题为例[J].图书情报工作,2016,60(20):104-111.
[16]董坚峰.基于Web挖掘的突发事件网络舆情预警研究[J].现代情报,2014,34(2):43-47.
[17]李彤,宋之杰.基于模型集成的突发事件舆情分析与趋势预测研究[J].系统工程理论与实践,2015,35(10):2582-2587.
[18]王英,龚花萍.基于情感维度的大数据网络舆情情感倾向性分析研究——以“南昌大学自主保洁”微博舆情事件为例[J].情报科学,2017(4):37-42.
[21]陈涛,林杰.基于搜索引擎关注度的网络舆情时空演化比较分析——以谷歌趋势和百度指数比较为例[J].情报杂志,2013(3):7-10.
[22]王康,李含伟.自媒体时代的企业网络舆情应对策略研究——基于上市公司百度指数的研究[J].情报科学,2018,36(1):113-117.
[23]张玉强.基于微指数变化曲线的阶段性事件识别及演化关系分析[D].青岛:山东科技大学,2017.
[24]刘思峰,杨英杰.灰色系统研究进展(2004—2014)[J].南京航空航天大学学报,2015,47(1):1-18.
[25]钱吴永,党耀国.基于振荡序列的GM(1,1)模型[J].系统工程理论与实践,2009,29(3):151-156.
[26]刘思峰,谢乃明,等.基于相似性和接近性视角的新型灰色关联分析模型[J].系统工程理论与实践,2010,30(5):881-887.
作者:王宁1;赵胜洋1;单晓红2 单位:1.北京邮电大学经济管理学院,2.北京工业大学经济与管理学院