美章网 资料文库 神经网络模型优化设计范文

神经网络模型优化设计范文

本站小编为你精心准备了神经网络模型优化设计参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

神经网络模型优化设计

《测绘科学技术学报》2015年第五期

摘要:

高轨卫星是我国卫星导航系统的重要组成部分。提升该类卫星的轨道预报精度有利于用户定位精度的提高。提出了一种改进高轨卫星轨道预报精度的新方法。该方法避开了精化动力学模型的困难,尝试从轨道预报误差的规律中寻找突破。利用神经网络作为建立预报模型的工具,将某历史时刻的轨道预报误差作为训练样本,利用训练好的神经网络模型补偿当前时刻的预报轨道以提高轨道预报精度。对影响神经网络模型补偿效果的各因素进行了详细分析,制定了适应于高轨卫星短期、中期和长期预报的神经网络最优模型。利用实测数据进行了试验分析,结果表明:预报8,15及30d应选择的训练步长分别为10,20及25min;轨道预报8~30d时,训练噪声均选取0.01。神经网络模型有效地改进了高轨卫星的轨道预报精度,预报4~30d,轨道精度提高幅度为34.67%~82.37%不等。

关键词:

神经网络;轨道预报;训练噪声;训练步长;地球静止轨道卫星;倾斜地球同步轨道卫星

高轨卫星在我国的航天系统中应用十分广泛。特别是我国的卫星导航系统BDS(Beidousystem),其主要包括GEO卫星和IGSO卫星。导航卫星星历的精度是定位精度的基础,而广播星历本身便是轨道预报的结果。预报精度问题是制约BDS卫星导航系统服务性能的关键因素,因此有必要对导航系统中的高轨卫星轨道预报精度展开研究[1]。改进轨道预报精度的一种方法是建立更加精准的动力学模型[2 ̄3]。然而由于该方法需要长期精密轨道数据的支撑,周期长、难度大。改进轨道预报精度的另一种方法可以从轨道预报误差的规律中寻找突破[4]。神经网络作为一种新兴的建模工具,特点在于处理高维性、非线性的问题时不需要准确知道输出输入函数的结构参数。只要通过训练来掌握它们之间的内在关系,在输入训练集以外的数据时,神经网络可以获得它们之间正确的映射关系。该方法的优势在于不确定性系统的控制和预测。目前在轨道预报中使用神经网络工具的相关研究较少,文献[5]根据GPS卫星星历的相关周期特性,以时间系列预报作为基础,利用神经网络建立预报模型。在没有任何动力学模型的情况下得到了精度为数百米(1周)的预报结果。但是由于将卫星位置量直接作为神经网络的输出,神经网络算法的状态量动态范围大,限制了预报精度的提高。文献[6]利用GPS卫星精密星历已知的优势,将神经网络与动力学模型相结合组成混合预报模型,改进GPS导航卫星的中长期预报。该方法可以在一定程度上改进轨道预报精度,但不是每次改进均能成功,存在改进失效的情况。针对高轨卫星的高精度轨道预报这一难题展开研究。以神经网络作为建立预报模型的工具,在动力学模型基础上建立神经网络模型,通过对历史时刻预报误差的学习及训练,掌握其变化规律,再用于补偿和改进当前时刻的预报轨道,以达到提高预报精度的目的。针对神经网络训练及补偿特性,分析了不同因素对神经网络模型性能的影响。基于此制定了短、中、长期轨道预报的最优模型,最后利用不同类型卫星进行了试验分析。

1基于BP神经网络的轨道预报算法

BP神经网络是一种多层网络的“逆推”学习算法[7 ̄9]。利用神经网络进行轨道预报分为训练和补偿两个阶段。在训练阶段,采用拼接方法得到一条长时间的精密轨道,用于衡量动力学模型预报误差及神经网络模型的训练误差。针对拼接处小量级的跳跃现象,采用Robust ̄loess数值滤波方法进行轨道预报误差平滑[10]。由于预报轨道和预报误差为训练样本,故需要对两者的特性进行分析。同时神经网络模型参数在一定程度上影响神经网络的训练效果,因此有必要对影响神经网络模型的一些关键因素进行分析,以确定最优的神经网络模型。在补偿阶段,将当前时刻的预报轨道X(T)和V(T)作为神经网络模型的输入;将利用函数f(X,V)计算得到神经网络模型的输出作为当前时刻预报轨道的补偿值ΔXNN(T),将改进后的预报轨道X(T)和V(T)作为最终轨道输出。在神经网络具体应用中,为了提高网络性能以完成预定任务,需要认真考虑训练集预处理、网络结构设定以及训练算法等内容。网络的性能主要表现在训练效率及泛化能力。泛化能力是指辨识训练样本中所隐藏的规律并且当被输入样本以外数据时,网络能正确地反应这种规律的能力。关于网络泛化能力的相关讨论及改进措施,已有文献进行了比较详实的总结。这里涉及到的方法主要包括下列3个方面:一是处理训练样本的方法[11],将神经网络的训练样本进行归一化处理,使其在[-1,1]变化,以提高神经网络的性能;二是训练步长的选取;三是增加随机噪声[12 ̄13]。

2不同因素对神经网络模型性能的影响

分别针对预报轨道和预报误差特征、训练步长的选择、训练噪声的大小对神经网络模型性能的影响进行讨论。

2.1预报轨道和预报误差的特征分析

2.1.1中长期预报轨道和预报误差特征将短期轨道预报弧长定位为1~13d,中期轨道预报弧长为14~27d,长期轨道预报弧长大于27d。以某初始时刻的预报误差作为训练样本训练得到的神经网络可以对其他初始时刻的预报轨道提供补偿,但前提是两个初始时刻的预报误差数值大小及波形图要相近。对GEO卫星的预报误差进行时间序列分析,结果可以看出,预报误差最大值呈现以14d为周期的变化规律;IGSO卫星具有相同的特征。文中选取的训练弧长与当前时刻的轨道预报弧长相等。对于中长期轨道预报可以采用以下方案:假设预报弧长为md(14n≤m≤14(n+1),n≥1),用当前时刻起14(n+1)d之前那天的预报误差和预报轨道作为训练样本,训练弧长为md,训练得到神经网络模型。采用神经网络模型计算得到的补偿误差波形对当前的预报误差进行补偿。对于短期预报,由于预报弧长小于14d,其轨道预报方案中还考虑了预报误差波形的最佳匹配。即充分结合预报误差和预报轨道的动力学特性,建立了一个训练样本集。根据当前时刻的预报误差波形变化特征在样本集中搜索最佳训练样本,实现两者波形变化的最优匹配,从而实现最优的补偿效果。在中长期预报中未采用波形匹配算法的主要原因是,需要兼顾工程应用中的实时性,波形匹配耗时较长。

2.1.2短期预报中的波形匹配算法航天器是一个受摄动力系统,其初值不稳定性使得利用不同初始轨道得到的预报轨道和预报误差的特性均不同。这就导致不同初始时刻的预报误差并无规律。为了实现最佳的神经网络模型补偿效果,必须找到与当前时刻预报误差变化波形最为相近的历史时刻中的一条预报轨道。采用历史时刻的预报轨道和预报误差作为训练样本,训练得到神经网络模型。在实际工程应用中,因为当前时刻之后的预报弧段中的精密轨道无法获取,故不能获得当前时刻的预报误差波形变化规律,所以并不能直接通过预报误差波形比对来寻找补偿当前时刻预报轨道的训练样本。但是基于动力学模型外推可以得到当前时刻的预报轨道,如果能找到预报轨道与预报误差之间的波形变化对应关系,就可得到当前时刻的预报误差波形变化规律。由于预报误差的变化周期与轨道周期相同,对于GEO/IGSO卫星均为1d,通过对比预报误差波形变化最大值和最小值出现的时刻,搜寻得到用于补偿当前时刻预报误差的训练样本。由于预报轨道在数值上远远大于预报误差,为了便于分析问题,将两者进行归一化处理,即分别将两者除以各自的最大值,这样它们就在±1之间变化。图2和图3分别给出了某GEO卫星和某IGSO卫星在2013年第23天预报8d的轨道与相应的预报误差之间的对应关系。其中,横坐标表示预报时间,单位为d;纵坐标表示归一化后的数值,无量纲。1)对于两种类型的卫星,在J2000坐标系中X和Y轴方向,当预报轨道X/Y=0时,对应时刻的预报误差为最大值(峰值)或最小值(谷值)。预报轨道从正值变化为负值经过零值的时刻对应着预报误差的峰值,从负值变化为正值经过零值的时刻则对应着预报误差的谷值。2)在Z轴方向,GEO卫星的预报轨道和预报误差之间并无明显的对应关系;IGSO卫星存在与X/Y轴相同的对应关系。将作为训练样本的预报误差选择定义在J2000坐标系中,主要是因为在该坐标系中预报误差的规律性强,并且与预报轨道之间存在一定的对应关系。

2.2训练步长对预报精度的影响预报误差改进率的计算公式如下。以某GEO卫星为例,表1给出了不同预报弧长、不同训练步长下利用神经网络模型得到的预报误差改进率。分析表1中的数据可以看出下列3点。1)训练步长越小,神经网络模型的改进率就越高。2)预报弧长的长度与对训练步长的敏感度成反比,即弧长越长,训练步长的延长对改进率的影响就越小。训练步长从5min延长至40min,预报8,15和30d的改进率分别降低5.68%,3.9%和1.36%。3)由于训练步长越小,训练时间越长,因此改进率与训练时间是一对矛盾体。从综合改进率和训练时间的要求考虑,即改进率应尽可能高,而训练时间应尽可能短。故预报8,15和30d应选择的训练步长分别为10,20和25min。

2.3训练噪声对预报精度的影响以某初始时刻的轨道预报误差(称为训练值)作为训练样本训练神经网络模型,用其补偿另一个初始时刻利用动力学模型外推得到的预报误差(称为期望值)。如果训练值和期望值在同一时刻吻合的很好,那么利用神经网络模型一定能很好地修正动力学模型的预报误差。以某GEO卫星轨道预报8d为例,图4给出了采用不同噪声值时训练值和期望值之间的吻合关系。分为无噪声、噪声为0.01、噪声为0.05和噪声为0.10共4种情况。从图4中可以看到,不加噪声时训练值与其期望值的差别较大,因此应加入训练噪声以提高神经网络的泛化能力;加入噪声后训练值与期望值吻合的较好,但无法区分噪声值为多大时预报精度最高。表2给出了采用不同训练噪声时,经神经网络模型补偿后的轨道预报误差最大值的统计结果。其中原始预报误差为未进行补偿时的采用动力学模型外推得到的预报误差。表2不同训练噪声下的预报分析表2中数据可以看出下列两点。1)无噪声时,前4d无改善,精度反而降低;预报8d及更长弧段时预报误差略有改善,故应加入训练噪声。2)增加噪声后,噪声从0.001~0.100的变化对预报精度的改进幅度相当。但从总体来看,噪声越小,前6d的预报精度越高;但预报8d以及更长弧段时噪声为0.010的预报误差最小,故应选择训练噪声为0.010。

3试验结果及分析

根据上述短、中、长期轨道预报方案,并结合不同神经网络模型参数的优化设计分析,给出了利用神经网络模型进行轨道预报的试验结果。通过与精密星历比对可以分别得到动力学模型和神经网络模型的预报精度。表3列出了BDS系统中两颗GEO、三颗IGSO共5颗卫星在2013年第23天利用神经网络模型和动力学模型外推得到的预报误差(其中NN代表神经网络模型;Dyn代表动力学模型)。Sat02卫星由于轨道机动未能统计其中长期预报结果。表3中误差是在一定弧段内预报误差的最大值。从表3可得,神经网络模型1d预报误差有时会大于动力学模型的预报误差;但预报4,8,15及30d各卫星采用神经网络模型补偿后的预报精度均有所提高。这主要因为1d的预报弧段规律性不强,不利于神经网络模型的学习及训练。随着弧段的增长,训练样本的规律性增强,神经网络模型的补偿效果有所提高。为了更好地衡量神经网络模型的改进效果,给出各卫星的预报精度提高幅度,其与预报误差改进率的计算公式相同。表4给出了各卫星经神经网络模型补偿后的预报精度提高幅度。从表4中可以看出,预报4d各卫星的轨道精度改进幅度为40.25%~60.31%;预报8d各卫星的轨道精度改进幅度为63.28%~72.59%;预报15d改进幅度为47.01%~82.37%;预报30d改进幅度为34.67%~82.35%。可见神经网络模型在改进轨道预报误差中的作用显著。

4结论

利用神经网络模型进行高轨卫星的轨道预报精度补偿,对影响神经网络模型补偿效果的各因素进行了详细分析,重点分析了预报轨道与预报误差之间的对应关系,制定了适应于导航卫星短期、中期和长期预报的神经网络最优模型,利用实测数据进行了试验分析,验证了该方法的可行性。主要结论如下:1)对于GEO卫星和IGSO卫星,当预报轨道在J2000坐标系中的X/Y=0时,对应时刻的预报误差为最大值或最小值。两类卫星的中长期预报误差最大值均呈现以14d为周期的变化规律。2)预报8,15及30d应选择的训练步长分别为10,20及25min;必须在训练样本中加入适当的随机噪声以提高网络泛化能力,轨道预报8~30d时,训练噪声建议选取0.01。3)制定了短期预报以及中长期预报最优方案,采用神经网络优化模型后,轨道预报精度有所提高。不同预报弧长的轨道精度提高幅度也有所不同,预报弧段越长,训练样本的规律越强,越有利于神经网络模型的学习,从而神经网络模型补偿性能越好。预报4~30d,轨道精度提高幅度为34.67%~82.37%。4)神经网络模型对于改进高轨卫星的轨道预报精度是有效的,能够为BDS卫星导航系统中导航卫星的短期预报精度提高提供技术参考,并为全球卫星导航系统中导航卫星的自主定轨提供长期精密的初轨信息。5)在实际的工程应用中,必须保证每次的神经网络补偿精度都是提高的,以保证该方法的适用性。但试验分析结果表明,基于神经网络模型补偿的预报轨道精度存在少量下降情况。采用度下降的预报轨道,将严重影响预报轨道的使用效果。因此需要一种轨道精度评估方法,有效筛选出补偿失败的预报轨道。继续采用基于动力学模型预报的预报轨道,以保证最终输出的预报轨道精度一定优于或等于基于动力学模型外推得到的预报轨道精度,从而保证神经网络模型在实际工程中的适用性,还需要进一步研究。

作者:黄金 张宇喆 张正强 谷冰 李晓杰 单位:解放军国际关系学院 北京市遥感信息研究所 北京卫星导航中心