本站小编为你精心准备了城市轨道交通客流量预测探究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
摘要:通过分析城市轨道交通日均客流及相关影响因素的变化特征,以多种因素作为数据集特征,采用梯度提升法和随机森林的混合模型对日均客流量进行预测。以北京地铁客流数据作为研究对象,对模型进行了试验。试验结果表明,基于梯度提升和随机森林的混合模型相较于常规ARI-MA模型和随机森林模型具有更好的适应性,在常态和特殊情况下均能取得可接受的预测效果。
关键词:城市轨道交通;客流量预测;梯度提升
客流量的预测和分析是城市轨道交通规划和建设的重要依据。城市轨道交通客流与群众出行规律密切相关,通常具有较强的时间序列特征。过去已有相关领域的研究人员基于ARIMA模型实现了客流量的预测,通过对模型进行各方面优化,提升了预测效果[1-2]。近年来机器学习技术得到广泛应用,有的采用特殊结构神经网络[3-4]、支持向量机[5]等方法实现客流量预测,并通过分析客流特征研究居民出行规律和交通规律。本文在参考已有算法的基础上[6-8],使用梯度提升决策树混合模型预测城市轨道交通客流量,并分析相关影响因素特征。
1梯度提升决策树基本原理
梯度提升决策树是一种通过构建多个弱学习器、并将之组合形成强学习器的集成模型。通常使用分类回归决策树作为弱学习器。分类回归决策树是一种应用较为广泛的决策树实现方法,其每一次训练尽可能遍历所有可能的属性取值,依据最佳分割点将样本数据分为2个部分,以递归分割的方式,不断循环直至终止条件。梯度提升属于提升算法体系的一种,由斯坦福教授J.H.Friedman提出[6-7]。其基本思想是利用损失函数的负梯度在当前模型下的值作为模型本次训练结果残差的近似,并以该值作为下一次训练的目标。模型的输出结果将向着损失函数减小的方向移动。
2客流预测模型机理及数据集特征处理
2.1模型预测机理地铁日均客流量具有明显的周期性和季度性。其时序性决定了日客流量与日期、历史客流量直接相关。天气、气温及节假日等则是引起客流量波动的重要因素。使用树模型的实质,即通过样本数据探究以上相关因素的差异性对流量大小的影响。根据树模型的原理,在理想状态下,对于任意1组特征组合,都应存在1个客流量集合与之对应,同1集合内客流量的均值将作为符合该特征组合的客流量预测值。模型每一次迭代都将根据以上特征对样本进行若干次划分,特征与预测目标较高的相关性保证了分类效果。根据梯度提升算法,模型第一次训练以实际客流进行拟合,此后以上一次预测结果与实际值的残差来训练子树,从而逐步缩小预测残差,降低拟合偏差。数据样本及其特征的选择将极大影响模型的预测结果,只有合理的样本特征才能实现模型的最大作用。因此,需选定样本的输入与输出,并对样本数据进行特征工程处理,以保证样本属性与特征的有效性。
2.2数据集特征处理根据预测机理及相关研究,在分析影响城市轨道交通日客流量的若干因素后,搜集相关数据进行特征处理形成合适的训练样本。本试验采用的数据来源为北京地铁2015年1月1日至2017年7月17日15条运营线路的日客运量及对应时间的相关特征数据,共929个样本。特征数据包含离散值和连续值。离散值应按等级分类、合并或进行one-hot编码。为保证决策树分类效果,应根据特征与客流间的相关性作为评价标准,应将不相关数据或具有较多噪音数据进行剔除、替换和合并处理,以实现降维,最终形成适用于模型的数据集。根据以上分析对相关属性特征进行处理,得到训练特征。工作日与周末使用同一个状态进行分类;天气数据按照类别进行合并处理,分为7个等级;节假日对客流量有较大的影响,春节、国庆与其他节假日的差异性通过4个类别划分。通过Python模块Seaborn和Pandas可进行编程,以实现数据图表的可视化输出。
3试验与仿真
使用Python机器学习模块Scikit-learn[9]实现模型的建模与仿真。取前850个样本作为训练集,后79个样本作为测试集,模型输出为对应测试集下的日客流量。对模型参数进行多次调整,每种参数组合进行2000次训练。令T为样本的特征总数,选取部分参数组合下的预测结果如表2所示。由表2可知,回归子树的深度N与训练子集使用的特征数t越大,训练时间越长。
4结语
本文分析了梯度提升法的概念和基本原理,将梯度提升法和随机森林的混合模型应用于城市轨道交通客流预测。通过分析北京地铁客流特征及多种影响因素,制定了适用于模型的训练集。试验分析了梯度提升混合模型及其他两种基本模型的预测结果,基于梯度提升的混合模型能实现更高精度。综上所述,梯度提升混合模型能够适用于城市轨道交通客流量的预测与分析,且能取得较好效果。未来研究需进一步完善数据集,扩大样本规模,并结合智慧交通及大数据技术,深入分析城市人口出行规律,为城市轨道交通规划及管理提供新的研究思路及参考。
参考文献
[1]蔡昌俊,姚恩建,王梅英,等.基于乘积ARIMA模型的城市轨道交通进出站客流量预测[J].北京交通大学学报(自然科学版),2014,38(2):135.
[2]白丽.城市轨道交通常态与非常态短期客流预测方法研究[J].交通运输系统工程与信息,2017,17(1):127.
[3]李少伟,陈永生.城市轨道交通客流预测算法设计与仿真[J].计算机科学,2014,41(2):276.
[4]邹东,刘琼,黄梓荣.城市轨道交通线网时空相关性客流预测研究[J].城市轨道交通研究,2016(3):32.
[5]赵钰棠,杨信丰,杨珂.基于支持向量机的地铁客流量预测[J].都市快轨交通,2014,27(3):35.
[8]BOWLESM.Python机器学习预测分析核心算法[M].沙嬴,李鹏,译.北京:人民邮电出版社,2016.
作者:丁聪1;倪少权2;吕红霞2 单位:1.西南交通大学信息科学与技术学院,2.西南交通大学交通运输与物流学院