美章网 资料文库 医学统计分析方法选择探讨范文

医学统计分析方法选择探讨范文

本站小编为你精心准备了医学统计分析方法选择探讨参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

医学统计分析方法选择探讨

医学统计是进行医学研究的重要工具,被广泛地应用于实验设计、资料收集及数据分析等方面,正确应用统计学方法对有效开展科学研究和提高医学科技论文学术质量有着极其重要的意义和作用[1]。统计学的基本方法一般不难掌握,但是能否正确运用仍是较普遍的问题。为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法选择原则及应用过程中的注意事项。

1t检验

t检验是英国统计学家W.S.Gosset1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中2个小标本均数的比较。理论上,t检验的应用条件是要求标本来自正态分布的总体,两标本均数比较时,还要求两总体方差相等。但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。

常用的t检验有如下3类:(1)单个标本t检验:用于推断标本均数代表的总体均数和已知总体均数有无统计学意义。当标本例数较少(n<60)且总体标准差未知时,选用t检验;反之当标本例数较多或标本例数较少、总体标准差已知时,则可选用u检验[3]。(2)配对标本t检验:适用于配对设计的两标本均数的比较,在选用时应注意两标本是否为配对设计资料。常用的配对设计资料主要有如下3种情况:两种同质受试对象分别接受两种不同的处理;同一受试对象或同一标本的2个部分,分别接受不同的处理;同一受试对象处理前后的结果比较。(3)两独立标本t检验:又称成组t检验,适用于完全随机设计的两标本均数的比较。与配对t检验不同的是,在进行两独立标本t检验之前,还必须对两组资料进行方差齐性检验。若为小标本且方差齐,则选用t检验;反之若方差不齐,则选用校正t检验(t′检验),或采用数据变换的方法(如取对数、开方、倒数等)使两组资料具有方差齐性后再进行t检验,或采用非参数检验[4]。此外,当两组标本例数较多(n1、n2>50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。

2方差分析

方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。因此,在应用方差分析之前,同样和成组t检验一样需要对各组资料进行正态性检验、方差齐性检验。

常用的方差分析有如下几类:(1)完全随机设计的方差分析:主要用于推断完全随机设计的多个标本均数所代表的总体均数之间有无显著性差别。完全随机设计是将观察对象随机分为两组或多组,每组接受一种处理,形成2个或多个标本。

(2)随机区组设计的方差分析:随机区组设计首先是将全部受试对象按某种或某些特性分为若干区组,然后区组内的每个研究对象接受不同的处理,通过这种设计,既可以推断处理因素又可以推断区组因素是否对试验效应产生作用。此外,由于这种设计还使每个区组内研究对象的水平尽可能地相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别。(3)析因设计的方差分析:将2个或2个以上处理因素的各种浓度水平进行排列组合、交叉分组的试验设计。它不仅可以检验每个因素各水平之间是否有差异,还可以检验各因素之间是否有交互作用,同时还可以找到处理因素的各种浓度水平之间的最佳组合。此外,还有正交设计、拉丁方设计等多种方差分析法,实验者在应用时可以参考相关的统计学著作。

目前,某些医学论文中有这样的情况,就是用t检验代替方差分析对实验数据进行统计学处理,这是不可取的。t检验只适用于推断2个小标本均数之间有无显著性差别,而采用t检验对多组均数进行两两比较,会增加犯I型错误的概率,即可能把本来无差别的2个总体均数判为有差别,使结论的可信度降低[6]。对多个标本均数进行比较时,正确的方法是先进行方差分析,若检验统计量有显著性意义时,再进行多个标本均数的两两(多重)比较。

3χ2检验

χ2检验是一种用途比较广泛的假设检验方法,但是在医学论文中常用于分类计数资料的假设检验,即用于2个标本率、多个标本率、标本内部构成情况的比较,标本率与总体率的比较,某现象的实际分布与其理论分布的比较。但是当标本满足正态近似条件时,如标本例数n与标本率p满足条件np与n(1-p)均大于5,则可以计算假设检验统计量u值来进行判断[5]。

常用的χ2检验分为如下几类:(1)2×2表χ2检验。适用于2个标本率或构成比的比较,在应用时,当整个试验的标本例数n≥40且某个理论频数1≤T<5时,需对χ2值进行连续性校正。因为T值太小,会导致χ2值增大,易出现假阳性结论。此外,若标本例数n<40,或有某个T值小于1,此时即使采用校正公式计算的χ2值也有偏差,需要用2×2表χ2检验的确切概率检验法(Fisher确切检验法)。(2)配对资料χ2检验。适用于配对设计的2个标本率或构成比的比较,即通过单一标本的数据推断两种处理结果有无显著性差别。在应用时,如果甲处理结果为阳性而乙处理结果为阴性的标本例数n1与甲处理结果为阴性而乙处理结果为阳性的标本例数n2之和<40,需要对计算的χ2值进行校正。(3)R×C表χ2检验。适用于多个标本率或构成比的比较。在R×C表χ2检验中,若检验统计量有显著性意义时,还需要对多个标本率或构成比进行两两比较,即分割R×C表,使之成为非独立的四格表,并对每两个率之间有无显著性差别作出结论。

2×2表资料在应用时可分为如下几种类型:横断面研究设计的2×2表资料、队列研究设计的2×2表资料、病例-对照研究设计的2×2表资料、配对研究设计的2×2表资料。研究者应注意不同类型的2×2表资料的统计分析方法略有差别,比如在分析队列研究设计的2×2表资料时,如果用χ2公式计算得到P<0.05,研究者则应再计算相对危险度(RR)并检验总体RR与1之间的差异是否具有统计学意义[7]。

此外,在进行R×C表χ2检验时,还有如下2个主要的注意事项:首先,T值最好不要小于5,若有1/5的T值小于5,χ2检验结论是不可靠的,解决的办法有3种:增大标本量;删去T值太小的行和列;将T值太小的行或列与性质相近的邻行或邻列的实际频数合并[2,8]。其次,不同类型的R×C表资料选择的统计分析方法是不一样的。(1)双向无序的R×C表资料:可以选用一般的χ2公式计算。(2)单向有序的R×C表资料:如果是原因变量为有序变量的单向有序R×C表资料,可以将其视为双向无序的R×C表资料而选用一般的χ2检验公式计算,但如果是结果变量为有序变量的单向有序R×C表资料,选用的统计分析方法有秩和检验、Radit分析和有序变量的logistic回归分析等。(3)双向有序且属性不同的R×C表资料:对于这类资料采用的统计分析方法不能一概而论,应根据研究者的分析目而合理选择。如果研究者只关心原因变量与结果变量之间的差异是否具有统计学意义时,此时,原因变量的有序性就显得无关紧要了,可将其视为结果变量为有序变量的单向有序R×C表资料进行分析。如果研究者希望考察原因变量与结果变量之间是否存在线性相关关系,此时需要选用处理定性资料的相关分析方法如Spearman秩相关分析方法等。如果两个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这两个有序变量之间的线性关系,此时宜选用线性趋势检验。如果研究者希望考察列联表中各行上的频数分布是否相同,此时宜选用一般的χ2公式计算。(4)双向有序且属性相同的R×C表资料:这类资料实际上就是配对设计2×2表资料的延伸,在分析这类资料时,实验者的目的主要是研究两种处理方法检测结果之间是否具有一致性,因此常用的统计分析方法为一致性检验或Kappa检验。

4非参数检验

非参数检验可不考虑总体的参数、分布而对总体的分布或分布位置进行检验。它通常适用于下述资料[2]:(1)总体分布为偏态或分布形式未知的计量资料(尤其标本例数n<30时);(2)等级资料;(3)个别数据偏大或数据的某一端无确定的数值;(4)各组离散程度相差悬殊,即各总体方差不齐。该方法具有适应性强等优点,但同时也损失了部分信息,使得检验效率降低。即当资料服从正态分布时,选用非参数检验法代替参数检验法会增大犯Ⅱ类错误的概率。因此,对于适用参数检验的资料,最好还是用参数检验。

秩和检验是最常用的非参数检验,它包括以下几类[2,5]:(1)配对资料的符号秩和检验(Wilcoxon配对法):是配对设计的非参数检验。当n≤25时,可通过秩和检验对实验资料进行分析;当n>25时,标本例数超出T界值表的范围,可按近似正态分布用u检验对实验资料进行分析。(2)两标本比较的秩和检验(WilcoxonMann-Whitney检验):适用于比较两标本分别代表的总体分布位置有无差异。如果标本甲的例数为n1,标本乙的例数为n2,且n1<n2;当n1≤10、n2-n1≤10时,可通过两标本比较的秩和检验对实验资料进行分析;当n1、n2超出T界值表的范围时,同样可按近似正态分布用u检验对实验资料进行分析。(3)多个标本比较的秩和检验(WilcoxonKruskal-Wallis检验):适用于比较各标本分别代表的总体的位置有无差别,它相当于单因素方差分析的非参数检验,计算方法主要有直接法和频数表法等。此外,在进行上述3类秩和检验(前两类秩和检验实际上已经被u检验替代)时,如果相同秩次较多,则需要对计算的检验统计量进行校正。