美章网 资料文库 空气质量预报门限自回归的运用范文

空气质量预报门限自回归的运用范文

本站小编为你精心准备了空气质量预报门限自回归的运用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

空气质量预报门限自回归的运用

1引言

上海市浦东新区自1999年建立环境空气质量自动监测系统以来,通过不断地建设,已经形成覆盖浦东新区不同城市功能区域的环境空气自动监测网络。目前,浦东新区的环境空气质量自动监测系统运行稳定,在此基础上开展空气质量的预报工作是监测工作的进一步要求。本文选择时间序列的门限回归模型,利用历史监测数据构建预测模型,对污染因子进行预测,通过将预测值与实际监测值进行比对检验,检查所选择预测模型的准确程度,并讨论了应用该模型在浦东新区开展空气质量预报的可行性。

2建立预测模型

2.1模型简介

非线性时间序列的门限自回归模型(ThresholdAut。一RegressiveModel,简称TAR)能有效地描述具有极限点、极限环(准周期性)、跳跃性、相依性、次谐波、高次谐波等复杂现象的非线性动态系统,在表征非线性特性上有其独到之处。由于门限的控制作用.保证了TAR模型较强的稳健性和广泛的适用性。与多元线性回归、投影寻踪回归、模糊分析、人工神经网络、灰色模型、混沌模型等预测模型相比,TAR模型的预测精度高且稳健、适用性强、应用简便。目前,TAR已成为工程分析计算中应用最广且技术较为成熟的非线性时序模型。TAR模型的基本思路为:按变量的不同取值范围,采用若干个线性回归模型来描述非线性关系,即在观测时间序列笼x,}的取值范围内引人L一1个门限值:(j)(j二1,2,……L一l),将该范围分成L个区间,并根据延迟步数d将{x,}按{x,J}值的大小分配到不同的门限区间内,再对不同区间内的x,采用不同的AR模型来描述,这些AR模型的总和完成了对时间序列{x,}整个非线性动态系统的描述。它的一般形式为:第1分段:值作为门限候选值,对每一候选值计算AIC(:,的,最小的AIC(r,刃对应的/即为模型中应取的门限值:。‘;、.匀‘,)._‘1、xt=“o’十乙ai’’xt一i十灯’当xt一d(r吸l)j=l(4)令入叼IC(d)二AIC(r,d)N一no(d)(8)第2分段:尸,x‘=a6一’+乙a}一’x卜‘+E户一‘当x卜J>r(2)i=l式中,尸,、尸2—正整数,分别为第l、第2分段的阶数;a}J)—常数;司j)—零均值,方差为时(力的白噪声,且司”、司,)相互独立;r—门限值;d—延迟参数。我们可以用符号TAR(2,尸;,尸2)表示此模型。由于TAR模型是分区间的线性回归模型,TAR常规的建模方法是选择1种模型变量,门限区间个数,「〕限值和门限延迟步数,进行各种不同参数的组合,以TAR模型残差平方和或者AIC函数值最小为准则,反复优化,从中得到1组相对最优的参数值。关于TAR的具体描述见参考文献【1]。

2.2模型建立

在本文中,按照以下步骤建立预测模型[2,3,:(l)给定模型中最大阶数L,最大延迟参数D,令n0(的=max{d,L},d二1,2.••…D,对固定的d,n0(司简记为n。。(2)对每一固定;、d,将时间序列扛,}中丸。+,,‘0+2,……,翔按照选定门限值:分为2类,2类数据按照定义式(1)、(2)建立矩阵形式:刀J)=A(J)夕(J)+:‘少)j=l,2(3)按照多元线性回归模型式的参数最小二乘估计可以解出:取最小的NAIC(d)对应的d即为模型中应取的延迟参数试(5)由时间序列{x,}按照上述步骤建立模型TAR(2,P;,尸2)后,对于时间序列{xt},可以得到时段N的未来第1个时段的预测值却(l):门、么门、x刀(l)=a6‘’+乙a挤一’x刀一i+li=l(xN+l(x、+,d镇r)(9)或x、(l)=a犷,+d>r)(10)(6)以上步骤确定的预测模型中只利用到单一因子的历史监测数据,而现实情况中环境空气污染因子的浓度变化还会受多种因素的影响,如果在预测模型中考虑加人另外因素(譬如气象因素),TAR模型即变化为混合门限自回归模型互TARSO[2,(p,,Q,),(p:,QZ)l}。设{xt,yt,t=1,2.二}是1对时间序列,d是延迟参数,:是门限值,考虑到实际监测中,即伴随序列y,对应x,的预测值xN+1时的yN+.难以预先得到,故采用如下的模型形式:‘,、孕‘,、xt=a6‘十乙a了’x卜iJ=l右{J,yl一;+:{‘’Qj艺i=1+(少卜、(:时,j=1;y,J>:,j=2)(ll)同样根据AIC函数值最小准则,利用历史时间序列{xt,y,}确定模型的各项参数,进一步得到预测值:x、(1)一。;/)十呈口:、)xN一,+,十鳌。:,),N一,十lI二l一=l口(’)=(A(’)A(J))’A(J’尸,)£(J)二刀J)一A(J)8(‘)(4(5(夕N+l,(r时,j月;yN十;、>:时,j=2)(12)(7)根据以上确定的算法,编写预测模型的计算程序「4]。2类数据的残差平方和11护‘’A“’少‘’日分另lJ记为RSS(P;)与RSS(PZ)。尸,与尸:按照AIC最小化准则确定,即:,二(,)而n{、,,。g丑琴华乏+2(17十2))}一IV1JI(6)(l镇几成L)AIC(r,d)二AIC(尸1)+AIC(夕2)(7)(3)将时间序列{x,}按从小到大排列,得到序列{x、},分别取0.3N,0.4N,0.5N,0.6N,0.7N对应的x

3预测值与实际监测值比对检验利用历史监测数据,计算预测值并与实际监测值进行比对检验。

3.1数据选择

为检验门限自回归模型在实际应用中预测的准确度,本文选择浦东新区环境空气自动监测系统中6个子站2002年1月至2004年10月时间段内各子站50:、N02、PM,。的日均浓度监测值,使用TAR模型预测计算2003年11月l日至2004年10月31日共366d的各子站502、NOZ、pM;。的日均浓度值。各预测值根据相应子站相应因子前溯365d的实际监测数据构建模型计算获得。

3.2比对检验

3.2.1由于预测与实际监测为同一目标即某一时段内的污染因子的浓度均值,因此,可以将预测结果与同时段实际监测结果看成为1对成对观测值,使用t检验法考察两者之间的差异。具体检验方法见参考文献【5J。2组数据之差的均值与差数均值为“O”的总体相等的检验统计量t的结果见表1。给定显著性水平a=0.05,自由度f=365,查表得临界值r。乃5(365)的范围为(1.960,1.980)由表1可知,所有的t值均小于1.960,所以根据检验规则,可以认为在0.05的显著性水平下,预测结果与实际监测结果的日均浓度值总体上相差为0。

3.2.2考察预测与实际监测方法是否具有相同的精密度,即考察2组数据的总体方差是否相等,采用F检验法进行检验(见表2)。由于样本统计量达到366对,数量较大,在0.05的显著性水平下,为使检验有意义,对预测值与实际监测值按月平均后进行检验。具体检验方法见参考文献【5]。给定显著性水平a=0.05,自由度f=11,查表得临界值F。刀25(11,11)的范围为(3.43,3.53)由表2可知,所有的F值均小于3.43,所以根据检验规则,可以认为在0.05的显著性水平下,预测与实际监测方法具有相同的精密度。在实验数据经过按月均变换后通过F检验的基础上(2组数据的总体方差相等),进一步考察两者总体是否具有差异,对2组数据进行t检验(见表3)。具体检验方法见参考文献【5】。给定显著性水平a=0.05,自由度f=11,查表得临界值r。乃5(11)“2.201。由表3可知,所有的t值均小于2.201,所以根据检验规则,可以认为在0.05的显著性水平下,预测结果与实际监测结果按月均变化后总体上相差为0。

3.2.3通过以上的检验,可以认为预测结果与实际监测结果总体上具有相同的精密度并且相差为0,但由于污染因子浓度的变化是非线性的,必须检查预测值与实际监测值的变化趋势是否一致。通过2组数据的相关性进行分析(见表4)。给定显著性水平a“0.05,自由度f=365,查表得临界值尸。。;(365)<o一946。由表4可知,所有的丫值均远大于0.1946,所以根据检验规则,可以认为在0.05的显著性水平下,预测值与实际监测值的变化趋势一致性程度是可接受的。

4环境空气质量预报中的应用

4.1根据以上的统计检验结果,可以认为利用门限自回归模型进行浦东新区的环境空气质量预报是可行的,预测结果是可以接受的。

4.2预测值与实际日报存在一定程度的不一致性,这是由于:(l)预测模型是根据历史监测资料推断预测值,必然存在一定的误差。(2)空气污染因子浓度是由外界气象因素、污染源排放情况、监测区域的扩散条件等诸多因素的综合影响决定的。在预测模型中,离预测值最近的1个历史数据距预测的时段至少具有24h的时差,这一时差中任何1种外界因素的突发性改变,直接影响到该因子最终的实际监测结果,造成预测与实际情况的不一致。(3)由于监测条件的限制,我们目前还无法在模型中引人其它可能会影响监测结果的因素作为伴随序列。

4.3检查原始数据,发现当监测时段内发生污染程度突然改变时,如伴随沙尘暴、突发暴雨、阴霆天等气候现象而发生的空气质量突变时,预测值与急剧变化的实际监测值存在1个“延迟响应”的现象。这说明,在TAR模型中,对于突发性的因素造成空气质量急剧改变的响应速度是其作为统计模型的弱项。

4.4在实际预报工作中,结合多种预测模型与实际天气状况,进行预测值的会商确定制度是1种能有效降低预测风险的措施。

5结语

环境空气质量监测作为1项综合性的监测工作,使用先进的自动监测设备实现对污染因子的实时、连续监测是必然的趋势。利用多种手段对监测资料进行分析,研究污染因子的变化规律,及时提供污染因子变化的信息,才能更好地为环境管理服务。门限自回归模型作为1种利用历史资料对非线性时间序列进行描述从而进行预测的数学模型,多年来在各种统计领域中均取得良好的效果。将该模型引入浦东新区的环境空气质量监测中,也是环境空气质量报告工作的进一步要求。