美章网 资料文库 基于数据信息特征的土地资源论文范文

基于数据信息特征的土地资源论文范文

本站小编为你精心准备了基于数据信息特征的土地资源论文参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

基于数据信息特征的土地资源论文

1客观赋权方法比较分析和优化

对表3中的数据,用5种方法分别赋权,必然会出现不同的赋权结果(见图1)。复相关系数法利用重复信息确权,赋权结果必然和其他方法不同。由表4可知,利用差异信息的熵权法、变异系数法、均方方差法、离差最大化法的赋权结果相关性明显,赋权结果存在一定趋同;但赋权结果也存在区别(见图1),这归因于度量差异信息离散程度的确权系数精度不同。极端地说,如果确权系数相同,那么表5中变异系数、1-熵值、方差、离差对应的数值是成比例关系,进而指标排序完全一致。现实中,数据的离散程度是不可设计的,但是数据离散程度的趋势可以设计,为了判定熵权法等5种方法确权系数的精度,在原始指标体系的基础上(见表3),通过减少指标,构建离散程度逐渐上升和逐渐下降的指标体系即差异组。离散程度不同指的是,指标体系中所有指标离散度的均值。建立差异组时,选择变异系数衡量指标体系数据的离散程度。选择变异系数的原因:一是变异系数的计算较熵值的计算简便;二是变异系数可以摆脱数据极大值、极小值、均值的影响,衡量数据的离散程度的准确度高于标准差、离差[11]。本研究建立差异组,试图通过大量的试验,增强结论的说服性。

1.1探讨确权系数精度由表5可知,变异系数法和熵权法有6个指标的排序相同,对最重要指标的判定相同。图2中,不同指标体系下,变异系数法同熵权法的赋权结果的走势一致,同升同降。表5和图2反映变异系数法和熵权法的赋权结果极大趋同性。同时,在差异组指标体系下,对熵权法和变异系数法的赋权结果进行相关性检验,相关系数均在0.9以上,且双精度检验值绝大部分小于0.05。这说明熵权法、变异系数法独立数据差异信息离散程度的确权系数是相近的。确权系数的精度决定赋权结果的合理性,合理性由排序的准确性和权重数值的区分性体现。由于变异系数法同熵权法在排序上基本一致,从权重的区分性来判断方法的优劣。在差异组的各指标体系下,对变异系数法、熵权法的赋权结果,分别求标准差,熵权法对应的赋权结果的标准差总是大于变异系数法的,熵权法的区分度好。在假设变异系数法、熵权法的指标排序都合理的情况下,熵权法的赋权结果在区分度上由于变异系数法。均方差法利用标准差度量差异信息的离散程度,但是当进行2个或多个样本离散程度的比较时,当且仅当度量单位与平均数相同,可直接利用标准差来比较。如果单位和平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值来比较,而变异系数为标准差与平均数的比值,可以消除单位或均值的影响,更能合理反映数据的离散程度。故变异系数法较于均方差法。图2中,多数指标体系下,变异系数法同均方差法的赋权结果走势图有很大出入,这归因于均方差法不能消除指标均值的影响,难以合理比较不同指标的离散程度,赋权结果不合理。表5中,原始指标体系下,均方差法同离差最大化法有3个指标排序相同。图2中,随着指标体系的变化,较于其他2种方法,均方差法和离差最大化法的赋权结果走势相对一致。在差异组指标体系下,对均方差法和离差最大化法的赋权结果进行相关性检验,相关系数在0.8左右,且双精度检验值绝大部分小于0.1,说明均方差法同离差最大化法的赋权结果的趋同性强。但是,原始指标体系下,均方差法对最重要指标的判定同熵权法、变异系数法一致,而离差最大化法的判定则是将熵权法中第4重要的指标判定为第1重要指标,这种决策失误来源于离差最大化法公式中指标极大值、极小值的选取错误,从准确性考虑均方差法优于离差最大化法。对于1个指标体系赋权,保证合理反映指标的相对重要程度是前提,因此均方差法优于离差最大化法。前面推论,熵权法优于变异系数法,变异系数法在合理性、区分度上都优于均方差法,均方差法优于离差最大化法。因此,利用差异信息赋权的方法中,熵权法最优。

1.2赋权原理不同的方法比较熵权法利用差异信息赋权;复相关系数法利用重复信息赋权。但是,对于任意指标体系都包含差异信息和重复信息。为探讨2种方法的适用条件、赋权结果有无一致性,建立同差异组对立的相关组,研究熵权法在相关组的赋权结果、研究复相关系数法在差异组的赋权结果,进而比较分析。相关组,利用修正的复相关系数,对每1个指标存在1个容许度,定义容许度为TOL,TOL=1-R2,TOL越小,指标的相关性就越强[12]。利用容许度,定义方差膨胀因VIF=1/TOL,单个方差膨胀因子大于10或者平均方差膨胀因子大于1,说明指标之间的相关性强,独立性越弱[12]。利用方差膨胀因子均值,分别构建相关性递增指标体系和相关性递减指标体系。由图3可知,在相关性递增指标体系下,复相关系数法的赋权结果中指标权重的区分度不是很明显。在相关相关性递减指标体系下,复相关系数法的赋权结果中指标权重的区分度相对明显。现实条件中,指标体系的建立,尽力选择相互独立的指标,某一指标为其他指标所能解释的程度越弱,指标体系所包含的信息量就越大。图3说明,复相关系数法的适用条件并不要求指标间的相关性很强,相反的指标的独立性越强,复相关系数法的赋权结果越能合理。由图4可知,差异组离散性递减的指标体系下,复相关系数法赋权结果中指标权重均衡化明显,难以有效的区分指标的相对重要性。差异组离散性递增的指标体系下,复相关系数法赋权结果中指标权重的区分度相对明显。图4说明,复相关系数法在数据离散程度较高的指标体系中赋权结果更为合理。由图3~4可知,熵权法在差异组、相关组中的赋权结果指标权重的区分度都很好,复相关系数法对指标独立性强、数据离散程度高的指标体系的赋权结果更为合理。综合评价过程中,指标体系的建立,选择独立性强的指标保证极大程度地反映评价对象信息,样本中同一指标对应的数据避免重复,保证数据的有效性。故熵权法、复相关系数法适用于任意科学建立的综合评价指标体系。由图3~4可知,复相关系数法、熵权法的赋权结果不存在趋同,权重数值存在很大的差异。表5中,熵权法判定指标的重要程度排第1、2、3、4,在复相关系数法中分别排第2、3、1、8。8个指标的重要程度排序,无任何一致性。对各指标体系下,复相关系数法和熵权法得到的赋权结果进行相关性检验,相关性系数往往为负值。存在这种差异,是由于熵权法基于指标数值的离散程度,复相关系数法要是基于指标的相关性性赋权,这2类赋权方法分别利用了指标体系的不同信息,赋权结果一致性极低,相互补偿的作用很小。

1.3一种组合优化方法土地系统的整体性、动态性、开放性、阶段性说明土地系统是一个复杂巨系统,土地体统的复杂性要求在进行土地评价的过程中必须辩证的考虑问题[12]。指标赋权是土地评价的重要过程,要求系统的、辩证的衡量各指标的重要性。定量评估指标重要性,有2种原理:(1)利用指标数值的差异信息赋权;(2)利用指标数值的重复信息赋权。原始数据信息由差异信息和重复信息组成。为了充分利用原始数据信息,保证赋权结果的合理性,对1组指标体系数据分别用熵权法、复相关系数法进行赋权,利用乘法组合赋权将熵权法、复相关系数法的赋权结果进行归一[10,13-16]。其公式见(1)。式中:wj(1)为熵权法赋权结果,wj(2)为复相关系数法赋权结果。由图5可知,组合赋权法,对2种赋权方法的结果都有兼顾,借鉴了熵权法和复相关系数法对各指标的权重,尤其是最重要指标和最不重要指标的判定,充分利用原始数据信息。

2结论与讨论

(1)在指标逐渐减少的情况下,熵权法和变异系数法的趋同性、均方差决策法和离差最大化法的趋同性较为显著。(2)在赋权过程中,熵权法显示了对指标权数分配的敏感性,指标赋权结果区分度好。这主要是因为熵权法的赋权公式极大程度地保留了指标的差异信息,进而著区分指标的重要性。(3)均方差决策法和离差最大化法,一方面难以准确比较不同指标离散程度,另一方面对指标赋权结果的区分度不好。方法自身的缺陷、对指标差异的敏感性弱,使得均方差决策法和离差最大化方法不适宜进行土地资源评价的赋权。(4)利用重复信息的复相关系数法和利用差异信息赋权的熵权法的赋权结果必然难以趋同。考察角度的不同,难以判断2种方法的优劣,而现实中收集的数据信息必然包含重复信息和差异信息。熵权法和复相关系数法的组合赋权法,兼有2种赋权方法的优点,较全面地反映了原始数据提供的2种信息。本研究为了加强结论的可靠性,在原始指标体系的基础上通过减少指标,设计了大量的指标体系,但客观事物的复杂性是难以模拟的,进一步的研究结果需要对更复杂的情况进行研究得出。

作者:倪广亚刘学录李沁汶郝佳单位:甘肃农业大学资源与环境学院