美章网 资料文库 遥感影像的多点地统计学方法范文

遥感影像的多点地统计学方法范文

本站小编为你精心准备了遥感影像的多点地统计学方法参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

遥感影像的多点地统计学方法

1多点地统计的分类后处理

多点地统计中,训练图像描述了对真实场景分布的一种潜在的表现形式,是对所期望获得场景的一种模拟。训练图像代替了传统地统计学中变异函数,为模拟结果提供先验知识。多点地统计利用分类后的图像所提供的空间信息来推断各类别间的分布关系和空间依赖,然后通过模拟的方法重现类别分布。根据这个思想,训练图像采用初步的光谱分类法所得到的土地覆盖图。当搜索模板扫描训练图像时,获得了由类别分布图案构成的各个数据事件。然后,统计每个数据事件发生的次数,其统计量存储在一个搜索树中,记录了训练图像的空间结构特征。模拟采用了正态等分模拟(singlenormalequa-tionsimulation,SNESIM)算法,遵循经典序贯算法的流程,根据搜索树记录数据事件的发生情况,模拟时逐点推断每个数据事件中间点的取值情况。假设一个随机变量c(u)可能取的类别值为k,对于变量c(u)=k的条件概率由贝叶斯公式决定,条件概率密度函数则直接从训练图像中获取。算法的步骤如下。

1)定义一个数据模板,从最粗尺度的格网开始,用扩展的模板扫描训练图像从而建立搜索树,扫描过程中将非空的数据事件存储在搜索树中。

2)定义一条路径,保证访问到所有未知点且只访问一次。

3)对于每个未知点u,保留模板中用来构建搜索树的条件数据,假设n′<n是条件数据的个数,d(un′)是对应的数据事件,计算搜索树中存储数据事件d(un′)的概率分布。若d(un′)在搜索树中没有重复,则放弃最远的一个条件数据,条件数据减少到(n′-1),再从搜索树中获取数据事件d(un′-1)的分布。如果条件数据减少到n′=1仍没有重复的数据事件d(un′)被找到,则条件概率由边缘概率取代。

4)从结点u的条件概率分布函数中模拟每个点的类别,将这些模拟值加入模拟格网中,作为下次模拟的制约条件。

5)继续访问路径中的下个结点,重复步骤3)、4),直至所有点都遍历到,得到了一次模拟图像;然后,用一条不同的路径,从步骤2)重复整个过程,产生另一次实现,直至所有结点都访问到。SNESIM允许将数据条件作为模拟的制约,共同作用于后验概率。其中,硬数据相当于监督分类的训练样本,在模拟中严格继承其位置和属性,软数据则给出每个像素所有可能类别的归属概率。

2实例分析

本文在利用传统的最大似然法对遥感影像进行分类的基础上,用多点地统计模拟对分类结果作后处理,对比算法为空间平滑方法和基于贝叶斯的马尔科夫随机场分类法。

2.1实验区域和数据

实验区域位于乌干达的索罗蒂区,采用美国陆地探测卫星系统LandsatTM获取的影像,轨道号为P171R59,获取时间是2001-04-17,正是雨季之始,影像中有很多湿地区域。影像被裁剪成9km×9km的大小。土地分类的参考数据是基于已有的研究成果,通过面向对象分类法和实地调绘所得,有水体、沼泽、水生植物和其他植被4个类别,如图1(b)所示。300个随机采样的类别作为训练样本用来实施监督分类,参考影像的所有点都作为测试数据以评价分类结果。

2.2实验过程

LandsatTM影像的1~5和7波段参与分类,分类器是最大似然法,然后,用一个3×3的模板对最大似然的结果进行空间平滑。根据式(2),在同样条件下实施基于贝叶斯的马尔科夫随机场分类法,能量求解采用的是基于Gibbs采样的模拟退火法。最后,应基于多点地统计模拟的后处理方法。训练图像是最大似然法的分类结果,300个训练样本作为硬数据的模拟条件,软数据是由最大似然法估计的后验概率而得。多点模拟的类别是基于100次模拟的占优类别平均图。

2.3实验结果分析

(c)~2(f)列出了几种方法的分类图。(d)的空间平滑去掉了(c)中的很多椒盐噪声。在空间平滑的窗口中,窗口的中心值用一个占优类别替代。这种无模型的平滑算法只利用了单一的滤波器,无法满足多类别、分布复杂的空间信息的需求。(e)中的马尔科夫分类法的结果中,水生植物类的平滑效果比空间滤波更甚,这是由于邻元簇影响参数的选取会导致同质性;水生植物类边缘呈现锯齿状,这是因为受4-连通的邻元簇的影响。水生植物类别分布广泛,而且很多都生长在沼泽的边缘地区。对于多点地统计模拟的结果,多次模拟实现具有平均效应,类别边缘比马尔科夫分类结果的连续性好。最大似然法的结果不仅噪声多,还存在明显的沼泽错分到水生植物类的情况。这种错分情况在空间平滑和马尔科夫分类法中依然可见,而在点地统计模拟的结果中有所改善。沿着沼泽类边缘分布的水生植物类别,空间平滑和最大似然法的结果噪声较多,而马尔科夫的分类结果又过于平滑,多点地统计模拟则比较完整地重现了这类边缘曲线分布,体现了多点地统计模拟在对曲线分布地物类别的细节处理上具有优势。

2.3.1分类精度

表1展示了§2.3节所述方法中两个重点类别的精度。可以看出,对沼泽和水生植物这两个类别,多点地统计模拟方法的生产者精度有较大提高,而多点地统计模拟和马尔科夫分类法都对用户精度有较大改善。多点地统计模拟的总体精度和Kappa系数均高于最大似然分类法、空间平滑法和马尔科夫分类法。沼泽类的用户精度在多点地统计模拟法中较最大似然法分类有所提高,但是其提高不如马尔科夫分类法显著。原因之一是训练图像和软数据的条件制约是用最大似然法得到的,本身存在误差。特别是对于软数据,即使最大后验概率对应的类别是正确的,但如果后验概率不够大,模拟时每次实现也容易出现错分的情况。另一个原因是沼泽类别的空间分布形态,其分布较集中,且呈连续块状区域。因此,这一部分的类别被多点地统计捕捉到时,受先验的空间关联性的影响,模拟时更倾向于重现平滑、呈块状分布的区域。而水生植物类有着广阔且连续的分布图案,沿着沼泽分布的边缘曲线部分具有连通性和强相关性,所以在模拟中被保留下来。因此,多点地统计模拟后处理的精度要高于马尔科夫分类法的精度。

2.3.2高阶统计分析

为诠释多点地统计的相关性,本文通过一个针对水生植物类别的三阶矩统计图,比较马尔科夫分类法和多点地统计模拟方法在高阶统计量上的区别。以东方向为起始方向,沿45°角逆时针方向探测3个点之间的空间相关性,即起始点与离起始点距离为h1和h2的点之间的相关性,横纵坐标分别为h1和h2。对角线的亮度和连续性表明水生植物类模式分布的空间相关性的强弱。左下角原对于水生植物类别,多点地统计模拟比马尔科夫分类法的结果具有更强的相关性和连续性。右上角的亮度范围在(b)中比(a)要稍大一些,说明多点地统计模拟的结果中的水生植物类分布细节比马尔科夫法更多。对于图案间的相关性,在(b)中约200个单元的位置出现亮斑,而对应在(a)中则不明显,是由于马尔科夫法比多点地模拟统计的结果平滑,且分为水生植物类别的像元要少。(b)的局部区域比(a)更亮,表明多点地统计模拟法对细节的捕捉程度比马尔科夫分类要好。因此,多点地统计模拟在对水生植物这种复杂空间分布的地物类别进行处理时要优于马尔科夫分类法。

3结语

本文讨论的首要问题是多点地统计模拟的平滑原理,以及该方法与空间平滑法、马尔科夫分类法的不同之处。多点地统计在模拟过程中考虑了类别分布的相关性,它与别的分类方法最大的不同在于这种基于训练图像的先验知识对类别的平滑是有针对性的。SNESIM算法是数据事件搜索和匹配的过程,SNESIM用作分类后处理与传统的克里格法内插有着本质区别:前者通过模拟的多次实现取占优类别从而产生平均模式,减少了单次模拟的分类图中的不确定性,也导致了类别的平滑;后者是一种空间内插的方式,未考虑遥感影像的光谱特性,不属于基于像素的分类方法。空间平滑对所有点位采用恒定的权重,平滑了那些孤立的像元,但是没有模型依据。多点地统计模拟则采用了一个结合了先验知识、边缘分布、硬数据和软数据的复杂模型。马尔科夫分类法的初始分类是基于最大似然判别规则的,之后是光谱信息和空间信息综合作用的结果。马尔科夫分类法的条件概率只来自于光谱信息,而多点地统计的条件概率来源于训练图像和条件数据。本文研究的实例中,所有方法的总体分类精度都达到了85%以上。本文只考虑了4个类别,减少了分类的不确定性,而通常的基于像素的分类方法精度没有这么高。只采用4个类别的原因是本文的实验目的在于为锥虫病的研究提供基础数据,所以只关注了和病源传播有关的湿地类别,而对别的类别并没有细化区分;另一个重要原因是由于目前SNESIM算法效率的限制,过多的类别模拟过程很慢,算法的效率有待进一步提高。值得指出的是,本文研究采用了软分类的概率作为模拟条件的辅助数据,这样做的目的除了制约每个像素的分类精度外,还有一个重要作用就是保证了对非平稳性训练图像的多点地统计模拟的适用性。另一种常用的对非平稳性训练图像模拟的解决方案是利用分区的概念,对每个区域采用不同的训练图像进行模拟。本文提出了一种基于多点地统计的模拟方法改善土地覆盖分类精度。这种方法的核心在于从训练图像中提取具有空间结构的先验模型,比起单一的空间平滑法和基于马尔科夫随机场的分类方法,多点地统计模拟能提供更丰富、以多点关系为基础、描述复杂图案分布的训练图像信息。具体实例对比分析表明了该方法有效,提高了分类精度,达到了对复杂形态分布的湿地区域进行准确分类的目的。

作者:唐韵玮张景雄单位:中国科学院遥感与数字地球研究所数字地球重点实验室武汉大学遥感信息工程学院