本站小编为你精心准备了DPS数据在生物统计中的应用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
1.1异常值的检测
在科学实验中,由于外界条件的改变和主观因素的影响,实验测量的数据中个别数据往往会产生较大误差,即出现异常值。这些异常值的存在往往会掩盖研究对象的变化规律,甚至得出错误的结论[4]。为了提高实验的数据的精确度,我们要将数据中的异常值予以剔除。对异常值的判断通常有三种标准:3σ准则准则即拉依达准则、格拉布斯(Grubbs)准则、狄克逊(Dixon)准则。其中:在测量次数较少时,最好不要选用3σ准则[5]。用狄克逊准则判断样本数据中混有一个以上异常值的情形效果较好。所以我们在此选择使用格拉布斯准则。用有如下的判别准则:︱-︱≥G(a,n)S则数据粗差,应予剔除。否则,应予保留。其中为该水平数据的算术平均数,s为该水平数据的便准偏差,公式:G(a,n)是格拉布斯准则的临界值,a为显著水平,n为该水平的重复次数。使用DPS数据处理软件将很方便的剔出异常值。以A、B、C、D、E、F6个品种水稻植株镉的吸收影响[6]为例见表1。首先,在DPS软件中录入数据,以行为水平,有A、B、C、D、E、F6行,1、2、3、4、5、6列为重复。其次,选中每一行的数据区域,将其定义为数据块。再单击菜单栏中的“数据分析”→单击“异常值检测”→选择“格拉布斯(Grubbs)法”→选择P值“0.05”→单击“确定”按钮→输出“结果”见图1。从图1看出:C6单元格的数值0.3942是应该剔除的异常值,应用相同的方法,可知:F5单元格的数值0.3152也是应该剔除的异常值,其结果与文献[6]中用Excel软件处理结果相同。
1.2方差分析及多重比较
由于试验中各种因素的影响,研究所得的数据呈现波动状,因此要比较两个或两个以上样本均数差别是否显著,就要进行方差分析(F检验)。R.A.Fister认为:造成波动的原因可分成两类,一是随机因素,另一是研究中施加的对结果形成影响的控制因素。通过分析研究不同来源的变异对总变异的贡献大小,从而确定控制因素对研究结果影响是否显著。当F检验结果显著时,表明可控因素对实验结果影响显著,就需要进一步找出是何种控制对实验影响显著,就需要对不同控制水平见进行两两单独比较,以水稻不同药剂处理的苗高[7]为例,具体数据如表2介绍使用DPS进行方差分析及多重比较。
1.2.1方差齐性检验。因为方差分析的基本假定之一就是误差同质性,所以在进行方差分析之前要判断所有实验处理是否具有共同的误差方差。首先进行样本方差齐性检验,选中数据→单击菜单栏中的“试验统计”→单击“方差齐性检验”→系统默认“0不转换”→单击“OK”,系统将给出检测结果见图2。这里检测结果采用的是Bartlett卡方检验。这里计算得到卡方值=0.69599,自由度=3,P=0.87415>0.05,表示差异不显著即方差齐性。如果p<0.05,侧表示方差鱼油显著异质性,这时不易用方差分析法进行统计检验,可以考虑对数据进行适当转换:平方根转换、对数转换、正反弦转换,然后再进行方差分析。图2方差齐性检验结果
1.2.2进行方差分析及多重比较。选中数据→单击菜单栏中的“试验统计”→选择“完全随机试验”→选择“单因素试验统计分析”→跳出“方差分析参数设置”对话框,见图3进行设置→单击“确定”,系统将给出分析结果见图4.计算结果显示包括:(1)数据处理时当前日期;(2)各处理的样本数、均值、标准差、标准误以及95%的置信区间值。(3)方差分析表列出了处理间和处理内的平方和、自由度、均方、F值和显著水平。由图4知,P<0.01,各处理之间差异极显著,需要进一步进行多重比较。(4)输出各处理的均值差以及新复极差多重比较的显著水平,同时将结果用目前国内科技论文中常用的标记字母法表示出来,清楚明白,为使用者提供了极大地方便。从图4中可以看出,该试验除1与3处理无显著差异外,4与2及1、3处理间差异显著性达到0.05水平。处理2与1、4与2、1与3无极显著差异;4与1、3,2与3呈差异极显著。该结果与文献[7]一致。
1.3线性回归
在生物统计学试验中,常要研究多个变量之间的相互关系,虽然他们之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式即多元回归方程。多元回归系数的计算比较复杂,特别是当自变量达3个以上的回归分析给计算带来很大的不便。用DPS数据处理软件可以方便的进行回归系数计算和回归分析。如陆建身[8]书中例题:中籼南京11号高产田的每1/15hm2穗数(,单位:104)、每穗实粒数()和每1/15hm2稻谷产量(,单位:500g),其结果如图5。建立每1/15hm2穗数、每穗粒数对每1/15hm2产量的二元线性回归方程。具体操作步骤:按图5方式录入数据、定义数据块→单击菜单栏“多元分析”→单击“回归分析”→单击“线性回归”,系统会给出如图6的操作界面。从图中我们可以得到横坐标为y拟合值、纵坐标为残差的残差你和分布图,以便于我们对残差进行分析、诊断。同时,还知道了X1,X2的回归系数分别是:24.8002和9.3594,方差膨胀系数<10,所以诊断不存在多重共线性[9]。当诊断结束,单击“返回编辑”,系统将给出回归分析结果如图7,从图中我们可以得到回归方程:=-351.7457+24.8002+9.3594,决定系数R2=0.841570,回归方差极显著,与文献[8]结果一致。
2结论与讨论
对生物试验数据进行整理、分析时需要大量的数学公式及代数运算,费时费力还容易出现错误。Excel电子表格程序进行数据处理虽然生动、直观,但是没有提供对方差齐性检验以及多重比较的程序,需要另外编写命令来完成[10]。SPASS、SAS等数据处理软件虽然功能完善,但软件非汉化,使用不便。DPS数据处理软件无需使用者了解运算细节,只需将试验数据输入电子表格,然后调用相应的分析功能,系统将给出所有计算、分析结果。根据本文的例子中使用的方法,我们可以很方便的完成数据的异常值检验、方差分析、多重比较以及回归分析。同时,DPS数据处理软件还为生物研究工作者提供了动植物种群数量抽样、动植物种群数量空间分布研究、生物群落的消长演替过程分析等方面的内容,使的数据处理工作简便易行,结果准确。
作者:徐伟季索菲单位:安徽林业职业技术学院园艺教研室安徽省农业科学院水产所