本站小编为你精心准备了网络信息搜索的旅游需求预测参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《系统管理学报杂志》2014年第三期
1文献综述
1.1旅游需求预测对于从事旅游业的各部门和机构而言,准确预测旅游需求至关重要。由于旅游产品从本质上讲是“易逝”的(例如未卖出的航班座位、旅馆房间等不能像其他产品一样储存),因此预测的准确性尤为关键,精确的短期预报能够有助于更好地制定日程计划、人员安排以及应急预案等。因此,旅游需求预测模型得到了学界和实务界共同关注。根据文献中的评述,围绕这一领域国外旅游期刊上共发表了数百篇论文,利用各种定性和定量方法,对不同目的地的旅游业进行预测。定量预测研究大体上可以分为两大类:时间序列模型和经济计量模型,时间序列模型用旅游需求的历史量以及随机扰动项进行预测,重点在于研究历史变动趋势和模式,而经济计量模型则研究各种经济指标对旅游需求的影响。对于经济计量模型,游客接待量是反映旅游需求最为通用的指标,而解释变量则千差万别,其中,游客收入、目的地旅游价格与来源国价格之比、其他目的地旅游价格以及汇率是影响旅游需求最重要的指标。从分析的粒度来看,大部分研究以国家和地区为研究对象,时间频率多为年度、季度和月度,以长期预测为主,很少有研究以天为时间单位预测短期旅游需求。近年来,国内对旅游需求的研究发展很快,但多是对国外理论的引介,实证研究较少,特别是以景区为对象的微观研究则更少。例外的是,文献中分别以海南省天涯海角景区、四川九寨沟景区和重庆武隆景区为对象对旅游流量进行了预测。然而,该类研究大都以单一景区为研究样本,从而在一定程度上影响了研究结论的外部效度。总体而言,现有旅游需求预测研究对影响旅游需求的因素、旅游需求预测方法等领域有着较为扎实的基础。然而,从实证研究的具体应用角度而言,数据的时间分辨率和空间分辨率较低(时间尺度多为月或年,空间分辨率多为国家或省市)。因此,尽管这些研究能够为宏观政策制定提供参考,但是在短期(例如以周/天为时间单位)、特定景区的游客需求预测方面现有研究仍显不足;同时,由于依赖于统计部门或市场调研机构的数据,现有研究一般都有时间滞后,无法做到实时预测。而在黄金周这类旅游需求集中释放时期,及时的预测往往又是最为需要的。由于网络信息搜索数据具有精度高、实时性强的特点,因此能够对传统时间序列模型和经济计量模型进行有效补充。
1.2网络信息搜索在各种消费者行为模型当中,信息处理理论都占有重要地位[,这一理论认为消费者决策过程包含5大过程:问题认知、信息搜索、评价、选择、购买后过程。旅游服务的特点决定了旅行决策通常伴有较高的风险,因此游客会采取各种策略降低风险,其中就包括进行广泛的信息搜索。在旅游目的地选择过程中,游客会形成并逐渐缩小备选集并最终做出选择,这一过程同时受到社会心理和非社会心理因素的影响,这些因素分为4类:内部变量(态度、价值观、生活方式、动机、意愿、人格特征等)、外部变量(预算限制、目的地的吸引力、营销组合、家庭成员或熟人的影响、文化和亚文化等)、旅行本身的特点(规模、距离、时间等)以及旅行体验(旅行中的情绪和感受、购买后评价等),而最终目的地的选择取决于这些变量之间的相互作用。文献中针对游客信息搜索行为提出了一个整合了心理、经济和信息处理视角的综合理论模型,提出尽管有多种因素影响搜索行为,但是这些因素大都经由对目的地的熟悉程度和经验2个中介变量产生影响。文献[中利用实验室环境下开展的现场研究方法,对网络用户的旅行信息搜索行为进行了研究,结果发现,搜索引擎在搜索过程当中发挥了重要作用。传统上,游客常用的信息来源包括旅行社、旅游传单/画册、广告、游客中心等。与此不同的是,互联网是一个由相互链接的网页节点组成的大型超链接系统,其优点是有助于用户快速获取大量信息并进行自由组合,但是由于缺乏传统信息的结构化特点,因此,用户要找到想要的信息需要花费更大的认知努力。而搜索引擎可以被看成是“互联网上的哈勃望远镜”,能够帮助游客从数以亿计的网页中定位所需要的旅游信息。有研究显示,关键词搜索是游客在线信息搜索时最常用的策略,平均八成以上游客在利用互联网搜索信息时会使用搜索引擎的关键词搜索功能。因此,以搜索引擎关键词搜索为指标的网络信息搜索有可能反映游客的旅游意愿并用于旅游需求预测。遗憾的是,目前有关网络信息搜索、特别是搜索引擎的研究大多集中于计算机科学和信息科学领域,尽管已经开始出现少量研究探讨了网络信息搜索与经济行为的相关性[18-22],但这些研究大多以宏观综合经济指标为对象(例如失业率、CPI等),网络信息搜索是否能够对微观主体的市场表现产生预测作用仍不清楚。本研究将网络搜索作为衡量游客信息搜索的直接指标,基于景区层次的面板数据,利用搜索引擎数据的实时性特点,以天为时间尺度探讨网络信息搜索对旅游需求的影响。
2实证研究
2.1数据本研究使用的景区样本为纳入四川省假日旅游统计系统的九寨沟、黄龙等21个景区1)。旅游数据来自于四川省旅游局(具体数据可从四川省旅游局网站直接获得2)),分别采集2010~2011年2个“十一”黄金周期间各景区的日游客接待量作为反映旅游需求的指标。游客搜索行为是通过关键词搜索反映的,搜索数据来自于百度指数。百度是全球最大的中文搜索引擎,截至2012年第三季度,百度在国内的市场份额达到80.3%,远远超过其后的谷歌中国(14.6%)、搜狗(2.3%)和搜搜(1.5%)[23]。百度指数是以百度网页搜索为基础的免费海量数据分析服务,用以反映不同关键词在过去一段时间里的“用户关注度”。用户关注度是以数千万网民在百度的搜索量为数据基础,以关键词为统计对象,表示各个关键词在百度网页搜索中搜索频次。百度指数每天更新1次,并且提供自2006年6月至今任意时间段的用户关注度数据。图1为百度指数的一个应用示例,显示的是2012年2个景点峨眉山和青城山的用户关注度变化趋势。由图1可以看出,在2012年的大部分时间里,峨眉山受关注程度要高于青城山,其中在4~9月份旅游旺季期间两景区的用户关注度的差距较大(前者约为后者的3倍),而在1~3月以及10~12月旅游淡季期间两景区的差距较小(前者约为后者的2倍)。由于百度指数仅以图形形式提供关键词的用户关注度变化情况,并无提供源数据导出的功能。因此,本研究采用了一种数据抓取软件获取数据。一般而言,本研究所使用的关键词来自于景区的正式名称,同时对其全称取其简称作为搜索关键个原因:①大部分景区的全称对应的网络搜索量不够,无法获取其百度指数;②假定游客在出行前搜索景区相关信息时会选择能够代表景区(无歧义)的最简关键词(即简称)进行搜索。从百度提供的相关词功能看,游客在搜索景区相关信息时,除了会直接关注景区信息,还会对其他相关信息进行搜索。排在前面几位的关键词为:××天气、××门票、××地图、××旅游攻略、××住宿等(××表示景区名称),这也验证了文献[24]中的观点,即搜索请求反映出用户的目标并且信息目标占主导地位。需要说明的是,由于假定搜索关键词反映的是游客的旅游意愿,因此最终的数据中删除了有歧义的景点信息(仅包括黄龙景区,原因在于对关键词“黄龙”的搜索可能指代游戏“黄龙骑士团”或“黄龙溪古镇”)。此外,有2个景区由于搜索量不足无法获取其搜索数据(华蓥山石林和梓潼七曲山)而被排除掉。因此,最终的面板数据包括了2010~2011年2个“十一”黄金周期间18个景区的日游客流量及相应的景区搜索量(具体景区为碧峰峡、都江堰、峨眉山、海螺沟、九寨沟、恐龙博物馆、乐山大佛、青城山、三星堆、石象湖、蜀南竹海、四姑娘山、瓦屋山、西岭雪山、小平故居、兴文石海、中国死海以及阆中古城)。与现有旅游需求经济计量模型研究一致,本研究还收集了各景区的门票价格。表1列出了数据的统计描述情况。由表1可以看出,各景区的游客量和搜索量逐年增加,游客量的偏度和峰度逐年减小,逐步趋向于正态分布,而搜索量在该指标上变化的方向相反。相关分析表明,搜索量和游客量之间的相关系数为0.35(P<0.01)。图2反映了搜索量和游客量之间的相关性3)。可以看到,大部分景区位于了线性拟合95%置信度区间以内。就单个景区而言,小平故居和阆中古城在置信区间以上且偏移较远,可能的原因是小平故居属于红色旅游景点,游客大多来自单位组织,而阆中古城属于古镇类旅游景点(区别于其他自然风光类景点),因此搜索量较少而游客量较多。在置信区间以下且偏移较远的是四姑娘山和西岭雪山,游客量与搜索量之比低于平均水平,说明部分旅游需求尚未满足,景区有待进一步开发。
2.2模型估计首先采用自回归时间序列模型作为基准模型,然后在基准模型的基础上加入搜索指标作为搜索模型,分别估计模型参数并进行比较。本研究所有的分析通过Stata11.0完成,尽管不同的计量软件可能导致参数估计出现细微差别,但这不应在统计义上影响本研究的总体结论。利用广义最小二乘法(GLS)对上述模型进行估计,结果显示,基准模型可以解释游客流量92.9%的方差,而搜索模型能够解释游客流量95.1%的方差,提高了2.2%。增量F检验显示,这一差异在统计上是显著的(WaldChi-Square(1)=440.08,P<0.001),这表明,网络搜索指标能够显著提高模型的解释能力。Rho值(不可观测的景区异质性导致的方差所占比例)从基准模型的36.8%下降到搜索模型的10.7%,说明所增加的搜索增量指标能够反映部分景区异质性信息。就单个解释变量而言,搜索增量与景区游客流量之间存在显著的正相关关系(β=3.33,P<0.001),验证了网络信息搜索能够反映旅游需求的假设。结果还显示,上一年游客流量与当年游客流量显著正相关(β=1.06,P<0.001),这与自回归模型的假设是一致的。此外,景区价格对游客流量的影响在5%的水平下不显著(β=-1.47,P=0.76),这表明,对于在黄金周集中出游期间,景区门票价格对游客旅游目的地决策不存在显著影响。表2列出了基准模型和搜索模型的估计结果比较。2.3模型验证下面采用模型估计———样本外预测的程序评估预测模型的外部效度。由于数据量限制,很难将据集随机分为估计样本和预测样本,因此本研究采用如下轮转方法进行处理:轮流将18个景区中的1个景区作为预测对象,利用其他17个景区的数据估计模型参数并进行样本外预测,分别计算出基于基准模型和搜索模型的预测值,然后评估基准模型和搜索模型预测值与实际值之间的误差。根据文献[25]中提出的准则,本研究选择平均绝对误差(MAE)和均方根误差(RMSE)作为反映预测准确性的指标:表3列出了旅游需求预测验证结果。可以看出,对于大部分景点而言,基于搜索模型的预测值误差小于基于基准模型的预测值误差。平均而言,在MAE和RMSE这2个指标上,基于搜索模型的预测误差分别比基于基准模型的预测误差小约808(人次)和1179(人次),使预测精度分别提高了约41%和43%。尽管网络搜索指标对预测误差的改进取决于具体的预测模型和数据样本,但是从以上的对比中还是能够看出网络搜索指标的价值。图3以箱线图的形式验证了搜索数据的预测效度。由图3可看出,不论是MAE指标还是RMSE指标,基于搜索模型的预测的误差都低于基准模型的误差。为了进一步验证这一差异是否具有统计意义,首先计算出每组数据基于不同模型的预测值绝对误差,然后进行配对T检验。结果显示,在0.1%的显著性水平上,基于搜索模型的预测误差显著低于基于基准模型的预测误差(t=4.35,P<0.001)。由此可见,基于网络信息搜索的模型能够显著提高旅游需求预测的准确性。
3结语
本文从旅游需求预测和信息搜索理论出发,重点讨论了网络信息搜索在旅游需求预测中的作用,并通过模型估计和验证对所提出的搜索模型的预测准确性进行了评价。结果显示,以搜索引擎关键词搜索为基础的旅游网络信息搜索是反映游客出游意愿的有效指标,结合了网络信息搜索的旅游需求预测模型能够对短期、景区层次的旅游需求进行及时、准确的预测,在MAE和RMSE这2个指标上相对于基准模型预测精度分别提高约41%和43%。从研究方法论层次看,本文的研究结果提出了一个新的、基于网络信息搜索的预测指标,验证了网络搜索对需求预测的增量解释能力,从而表明,基于网络信息搜索的预测是对传统旅游需求预测方法的有效补充。从现实意义来看,随着互联网发展成为游客获取信息并购买相关产品的途径之一,各旅游部门、机构和旅游从业者将能够及时、便捷地通过搜索引擎等工具提前了解游客出游意愿,并且将网络搜索信息整合到现有需求预测模型当中,提高旅游需求预测的准确性。特别是在黄金周这类旅游需求集中释放时期,对各景区游客流量进行及时、准确的预测将为旅游有关部门和机构提供可靠的决策依据,例如提前流量预报、制定限流方案等,帮助实现从“被动应急”转变为“主动调控”,促进旅游业实现可持续、生态友好型发展。由于数据可获得性等原因,本研究只对“十一”黄金周的旅游需求进行了验证,模型是否适用于非假日旅游需求的预测还有待验证。例如,本研究模型估计结果显示,旅游目的地价格对旅游需求影响不显著,这可能是我国特有的黄金周休假制度带来的旅游需求集中释放引起的,非假日情况下这种情况可能有所不同。由于旅游决策受到出行地和目的地之间的距离和交通等因素影响,在本研究模型基础上,如果能区分本地和外地旅游需求并结合相应的网络搜索数据,将可能进一步提高模型的解释和预测能力。
作者:王炼贾建民单位:西南交通大学经济管理学院香港中文大学工商管理学院