本站小编为你精心准备了城市不透水面估算方法分析参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《地质学刊》2017年第2期
摘要:城市不透水面遥感提取方法一直是城市遥感的重要研究领域。以南京市为例,采用LandsatTM(ETM+)数据,结合IKONOS影像,阐述了多源特征的提取与选择方法及其对不透水面估算精度的影响,并采用遗传算法优化最小二乘支持向量机参数,构建GA-LS-SVM模型。应用该模型估算南京市不透水面,与神经网络模型和像元分解线性模型进行比较。结果表明:采用多源特征提取城市不透水面,可以明显提高估算精度;GA-LS-SVM模型2000年与2006年估算误差RMSE分别为0.106和0.158,SE均为-0.001,明显优于其他2种模型。
关键词:不透水面;LandsatTM;多源特征;像元分解;GA-LS-SVM;江苏南京
0引言
不透水面分布被认为是表征流域、水质以及整个生态系统是否健康最为重要的环境指标之一。快速准确地掌握城市不透水面面积数据、了解城市空间扩展过程,可以为城市管理、规划和生态环境研究提供科学依据(陈本清等,2005;秦莉俐等,2005)。Ridd等(1995)提出经典的植被-不透水面-土壤模型(V-I-S模型),来解释城市生态环境的组成。国外很多学者利用该模型进行不透水面提取研究,取得了丰硕的成果。Ji等(1999)利用亚像元分析和分层分类法估算不透水率;Phinn等(2002)利用混合像元线性分解模型进行不透水面测算;Flanagan等(2001)利用亚像元分类结合人工神经网络方法提取流域不透水面;Wu(2004)分析了同种城市地物景观光谱存在很大差异,在此基础上提出改进的归一化混合像元线性分解模型,成功地提取了俄亥俄州哥伦布市不透水面;Powell等(2007)提出一种多端元像元分解模型,采用ETM+进行试验研究,取得较好的效果;Pu等(2008)以日本横滨为例,分别运用混合像元分解模型和神经网络模型对ASTER影像进行像元分解,制作城市地表要素组成图。大多数研究进行混合像元分解时,仅使用遥感影像的光谱特征,对多源特征的使用较少。
然而多源特征能够更加丰富地物特征,增加地物之间的可分性,如纹理能够很好地描述地物的空间特征(舒宁,1998;宋翠玉等,2006),在基于像元的分类中利用多源特征进行信息提取能够取得令人满意的效果(张锦水等,2006;牟凤云等,2007),因此开展多源特征对提取不透水面的研究,对提高估算精度具有重要意义。此外,在支持向量机建立在统计学习理论的VC维及结构风险最小化原理的基础上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折中,弥补了神经网络不能全局寻优的缺陷,具有泛化能力强、不过分依赖样本数量和质量、收敛至全局最优等优点。而最小二乘支持向量机是在支持向量机的基础上发展而来的,能快速得到模型参数的解析解。以南京市为例,采用LandsatTM(ETM+)数据,结合IKONOS影像,分析多源特征对不透水面提取精度的影响,探讨基于遗传算法和最小二乘支持向量机模型(GA-LS-SVM)的不透水面提取方法。
1研究区数据
1.1研究区与数据
南京市总面积为6597km2。主城区以商业区和高密度住宅区为主,不透水率最高;城乡结合部以工业区、低密度住宅区为主,不透水率较高;农田和公园植被覆盖好,不透水率较低,接近于0。不透水面提取选取的遥感影像为2000年9月16日的LandsatETM+、2006年4月2日的LandsatTM影像。采用2000年3月26的IKONOS影像获取训练和验证样本数据。研究还采用了90m分辨率的DEM数据、南京市统计年鉴、南京市城市规划资料以及南京市行政区划图。
1.2数据预处理
数据预处理主要包括几何校正和辐射校正。经检验,控制点最大均方差(RMS)为0.38个像元,总体RMS为0.19个像元,RMS被严格控制在0.5个像元以内。最后采用邻近点插值法进行重采样,将2006年影像配准到2000年影像上。
1.3样本选取利用高分辨
IKONOS影像获取训练和验证数据。IKONOS影像经与2000年遥感影像配准、全色波段与多光谱数据融合生成1m分辨率的图像处理后,在与IKONOS影像相同大小的TM(ETM+)影像上生成规则格网,取格网的交叉点共512个样本点,并对每个样本点进行检查,排除2000—2006年发生变化的12个点,得到500个样本点;最后根据目视解译结合实地调查,勾画出TM(ETM+)上每个像元样本点对应的IKONOS影像30×30像元窗口大小内不透水面面积百分比。
2研究方法
2.1特征提取与选择
2.1.1基于K-L变换的多尺度纹理特征提取
由灰度共生矩阵计算得到的多尺度纹理量之间存在很大的相关性,其相关性都在0.80以上。相邻窗口大小的纹理量相关性都在0.92以上,且随着纹理窗口的增大,相关性增强。将相关性强的多尺度纹理直接应用到信息提取中,一方面会增加冗余信息,影响信息提取精度;另一方面,随着特征数量增加,增加了特征选择以及信息提取的时间。对各纹理量的多尺度纹理特征分别进行主成分变换,变换后第一主成分的信息量达到95%以上,因此选用各纹理量多尺度纹理主成分变换后的第一主成分进行特征选择。
2.1.2顺序后向特征选择
顺序后向特征选择算法(SBS)是一种基于启发式搜索策略的特征选择算法。该算法是一种自上而下的方法,运行之初假定整个特征集就是所需要的优化特征集,而后在算法的每一步运行过程中删除1个对准则函数无贡献的特征,直到剩余特征个数符合要求为止。具体步骤:(1)令特征集T包含所有特征;(2)利用训练样本(仅含特征集T中的特征)训练LS-SVM,得到估算误差;(3)计算剔除特征集T每个特征后的估算误差;(4)从特征集T中删除精度提高最大的特征;(5)重复第2步至第4步,直到估算误差不再减小为止。
2.2基于遗传算法的最小二乘支持向量机
最小二乘支持向量机是在支持向量机基础上提出的一种改进学习算法,它将误差的二次平方项作为损失函数,并利用等式约束代替传统SVM的不等式约束,使原来复杂的二次规划问题转化为一次线性方程组的求解,大大降低了估算复杂度并提高了运算速度。
3结果与分析
3.1特征选择结果及分析
将从IKONOS影像获取的样本集按7∶3比例分成两部分,分别作为训练样本和验证样本。利用训练样本进行特征选择和模型参数优化,利用验证样本测试模型估算精度。特征选择时,选取LS-SVM的核参数δ=100,惩罚参数γ=7。为了分析比较多源特征以及特征选择和特征提取的效果,经过顺序后向特征选择得到2000年的以下几个特征集:①光谱特征(B1—B6);②除纹理特征外的其他特征组成的特征子集(B1—B11);③经特征提取后的所有特征(B1—B19);④对8个纹理量多尺度纹理的40个纹理特征和B1—B11组成的特征集经SBS特征选择后的最优特征子集[SBS(B1—B51)];⑤SBS对B1—B19特征选择后的最优特征子集[SBS(B1—B19)]。对上述特征集构建GA-LS-SVM模型,并进行模型参数优化,获得各特征集的不透水面估算精度。
3.2不透水面估算结果及分析
利用遗传算法对最优特征子集进行LS-SVM模型参数优化。遗传算法控制参数设置为:初始种群大小40、最大代数50、交叉率0.4、变异率0.1等。由遗传算法优化得到2000年和2006年LS-SVM参数(δ、γ)分别为:30和2.95、100和5.50。利用优化参数对2000年和2006年最优特征子集进行不透水面提取。采用均方根误差(RMSE)和系统误差(SE)2个指标进行精度评价。将GA-LS-SVM模型估算结果分别与采用基于RBF函数的神经网络(RBFNN)和像元分解线性模型(LMM)进行比较。
4结论
以南京市为例,应用TM影像,研究了多源特征对城市不透水面提取精度的影响以及基于多源特征的不透水面非线性估算模型,得到结论如下。(1)多源特征能够从不同角度刻画不透水面特征,特别是纹理特征,从空间上刻画不透水面特征,削弱“同物异谱”和“异物同谱”带来的估算误差,提高估算精度。利用主成分分析特征提取技术,结合顺序后向特征选择方法,能够在集中特征主要信息的同时有效去除冗余信息,提高分类精度。(2)城市是一个人类活动高度集中的多元复杂的系统,土地覆盖类型之间存在多次散射现象,因此混合像元分解是一个非线性问题。采用基于遗传算法的最小二乘支持向量机(GA-LS-SVM)提取不透水面,该模型能够很好地结合GA和LS-SVM的优点:①利用GA为LS-SVM选择合适的模型参数,得到优化模型;②LS-SVM可以发挥小样本、泛化能力强、解决非线性问题等优点,从而实现模型的有机结合,有效提高不透水面估算精度。
作者:陈晨1,陈亮2,陈静欣3,王金龙4,苏一鸣1 单位:1.江苏省地质调查研究院,2.黄河水利委员会信息中心,3.江苏省测绘产品质量监督检验站,4.河海大学地球科学与工程学院