前言:我们精心挑选了数篇优质统计学变量类型文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
[关键词]社会科学 统计方法 应用问题
社会科学的实证研究在应用统计学时,统计分析是其关键环节,资料性质分析、资料类型的判断、统计方法的选择等各个环节都应把握好,否则,其分析结果将是没有意义的。本文拟通过对社会科学实证研究论文中应用统计分析方法出现的问题,从描述性分析、定量资料的统计分析、定性资料的统计分析、相关与回归分析等方面进行解析。
一、描述性分析问题
在社会科学实证研究中,一般首先要对社会调查数据进行描述性统计分析,以发现其内在的规律性,再选择进一步的分析方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、集中趋势分析、离散程度分析、分布形态以及一些基本的统计图形。
描述性统计分析虽然较为简单,但如果对某个事件或某种现象的描述不清楚或存在偏差,那么其后的所有分析都将值得怀疑,而描述的偏差可能会引起公众或学术界对某些社会现象的误解,甚至误导政府决策。
1.均值的误用
均值是用于描述样本集中趋势的最常用指标,但应注意,对于正态或近似正态的对称分布样本,它是较好的指标,一般与离散趋势指标中的标准差一起描述数据资料(即形式);而对于偏态分布的样本,则常用中位数来描述集中趋势,一般与离散趋势指标中的四分位数间距一起描述数据资料(即形式),究其原因是均值容易受到极端值的影响。
对于两个分布完全不同的样本,可能会得到相同的均值,因此均值在某种程度上抹杀了样本内部的差异,而往往这种内部差异正是需要进行深入研究或应当引起人们注意的。为了弥补均值的这种缺陷,一般在报告均值的同时,也应该报告标准差,或用直方图或散点图的形式描述分布,以展示群体内部的差异。
2.绝对数的误用
因为社会调查研究比较容易得到大容量的样本,所以对任何小概率事件,用绝对数报告都会出现较大的数字,单纯对绝对数的强调往往会产生误解。比较合理的方式一般是在报告某事件绝对数的同时,给出该事件的发生率或占研究样本的比例。
3.相对数的误用
相对数常用于描述定性资料的内部构成情况或相对比值或某现象的发生强度,一般有比与率两种形式。虽然比与率的计算形式是相同的,即两个绝对数之商乘以100%,但它们的含义是不同的。率用于反映某种事物或现象发生的强度,而比则用于反映部分与整体或某一部分与另一部分之间的关系。当数据的比较基础相差悬殊,用绝对数表述没有可比性时,就要借助于相对数。
应用相对数也容易出现一些问题,如:百分比与百分率的混用;当分母很小时,只计算百分比或百分率,而没有报告样本量;当比较两个或多个总体率时,没有考虑到各总体对应的内部构成情况是否一致,而直接比较等。
例如在报告流动人口犯罪问题时,给人的印象往往是流动人口犯罪率高于常住人口,其实是忽视了流动人口的年龄和性别构成与常住人口完全不同,且青年男性是犯罪率较高的人群,这样对两个不同群体的比较往往会导致错误的结论。
二、定量资料的统计分析问题
定量资料的统计分析是指所观测的结果变量是定量的,而且希望考察定性的影响因素取不同水平时,定量观测结果的均值之间的差别是否有统计学意义。定量资料的统计分析在统计学应用中占有很大的比重,出现的误用也比较多。
正确选择定量资料统计分析方法的关键有两点:一是正确判断统计研究设计的类型;再是检验定量资料是否满足“独立性、正态性及方差齐性”的前提条件[1]。前者要求使用者对统计研究设计的类型较为熟悉,后者则需要进行预分析,可适当借助于统计分析软件。根据前提条件是否满足来决定用参数假设检验或方差分析,还是用非参数检验方法,进而根据对统计研究设计类型的判断,确定采用具体的统计分析方法。
对定量资料作统计分析时,常犯的错误有:
1.不管统计研究设计类型,盲目套用t检验或单因素方差分析;
2.不验证“独立性、正态性及方差齐性”前提条件,而直接应用参数检验法;
3.将多因素设计定量资料人为拆成多个成组设计定量资料,采用t检验法;
4.将多因素设计定量资料用单因素多水平方差分析解决,或用一元分析替代多元分析等。
三、定性资料的统计分析问题
定性资料的统计分析是指观测结果为定性变量的统计处理问题。定性资料的统计分析在社会科学研究中的应用也是很广泛的,通常根据影响观测结果的原因变量性质分为三种情况:
1.原因变量都为定性变量,此类资料就是通常理解的定性资料。常用的统计分析方法有:检验、秩和检验或Ridit分析、Spearman秩相关分析、线性趋势检验、一致性检验(也称Kappa检验)、加权检验、对数线性模型等。
2.原因变量中既有定性变量,又有定量变量。这类资料的统计分析通常有两种处理方法:一是结合专业知识先将定量的原因变量离散化,使其转化为定性变量,然后采用上面3.1的统计方法处理;二是先对定性的原因变量,采用哑变量技术进行处理,转化为多个二值变量,赋予0或1值,然后采用Logistic回归分析方法或多值有序变量Logistic回归分析处理。
3.原因变量全部为定量变量。这类资料的分析可以直接采用Logistic回归分析方法或多值有序变量Logistic回归分析处理。
定性资料的最常用表达形式是列联表,列联表有多种类型,如横断面设计的四格(或称2x2)列联表、队列研究设计的四格列联表、配对研究设计的四格列联表、双向无序的R×C列联表、单向有序的R×C列联表、高维列联表等,不同类型所用统计方法也不同,所以处理这类资料的关键是分辨出列联表的类型,从而选择相应统计分析方法。
在社会科学研究中,定性资料的统计分析常犯的错误主要就是列联表的误判,从而错误的选用统计方法。
四、相关与回归分析问题
相关分析是研究变量之间的相互关系,常局限于统计描述,较难从数量角度对变量之间的联系进行深入研究;回归分析则是研究变量之间的依赖关系,可实现对自变量进行控制,对因变量进行预测,及对随机变化趋势进行适当修匀。
相关分析可用于对定类、定序、定距及定比等尺度的各类资料进行定量描述,但各类资料的计算公式是不同的,所以应用时,需要判明资料的类型;而回归分析则要根据因变量性质的不同,选用不同的回归分析方法,一般可分为两类:一是因变量为连续型变量,具体的,当为非时间性的连续型变量时,可用线性回归分析、多项式回归分析、非线性回归分析等;当为时间变量时,可用COX半参数回归分析、指数分布回归分析及威布尔回归分析等;当为随时间变化的连续型变量时,则需要利用时间序列分析。二是因变量为离散型变量,需要利用Logistic回归分析、对数线性模型分析及多项Logit模型分析等。
在社会科学研究中,相关与回归分析的应用非常广泛。但应用时也经常出现一些错误:
1.没有结合问题的专业背景和实际意义,就进行相关与回归分析。其结果有时可能是莫名奇妙的,可能出现所谓的虚假相关。
2.对于较简单的线性相关与回归分析,不注意应用条件,盲目套用。一般地,Pearson相关分析要求两变量都是随机变量,且都服从或近似服从正态分布,若不满足条件,应采用其它相关分析法,如Spearman相关分析等。而线性回归分析则要求因变量必须是随机变量,且服从或近似服从正态分布,在回归分析前,先要进行统计检验,证实两变量的显著相关性,再进一步进行回归分析才有意义。
3.只求得相关系数或回归方程,而不进行参数假设检验就下统计分析结论。因为相关系数或回归方程都是由样本数据求得的,是否具有统计学意义,必须通过其相关参数的假设检验来判定。
4.多元回归分析策略的错误。在社会科学实证研究中,对多元回归分析的应用,不少人采取的策略是先用单变量分析,得到有统计学意义的多个变量,再将它们引入回归方程进行多变量分析,用逐步回归法进行筛选,从中选出有统计学意义的变量,这种分析策略是不正确的。因为自变量之间可能存在不同程度的交互作用,在单变量分析中无统计学意义的变量并非在多元回归分析中也没有意义。正确的处理方法应该是先综合分析各种变量之间的作用、实际意义及关系,有些可作为控制变量(如性别、年龄等),将经过初步筛选的所有变量代入回归方程进行分析,再采用逐步回归方法,必要时可多用几种筛选变量的方法,同时要注意自变量间的交互作用,进行综合分析,这样才能得到较为可靠的结果。
参考文献:
[1]王在翔:社会统计理论与实践[M].青岛:中国海洋大学出版社,2008
[2]胡良平等.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003.148-239
[3]柯文泉:统计方法应用中应注意的几个问题[J].时代经贸,2008,6(96):83-86
目前,很多研究人员对影像资料分析方法的学习和理解存在一定困难,尤其初学者对繁杂的概念、复杂的计算公式、数据资料性质判断以及如何选择合适统计学方法等问题难以深刻理解。针对这些问题,王良等[1]建议采用以下模式:判断资料类型、根据研究目的选择分析方法、其他适宜方法。
1.1根据资料类型初步确定方法
临床研究中产生的各种不同原始资料,而不同数据资料类型采用的统计分析方法也不同。定量资料常用的方法有t检验、方差分析、非参数检验、线性相关与回归分析等。定性资料可用的方法有χ2检验、对数线性模型、logistic回归等,影像医师可根据不同需要选用不同统计方法。值得一提的是有些资料类型确定后,统计方法的选用对其有序性有相应要求;而多种方法联合应用或者使用部分少见的分析方法时还需要在选定统计方法后,利用统计软件(如SAS、SPSS)对应的不同命令进行初步分析试验。
1.2根据研究目的选择方法
1.2.1差异性研究
差异性分析是指评价比较组间均数、频数、比率等的差异。根据研究需要可选用的方法有χ2检验、t检验、方差分析、非参数检验等。临床上研究两组、多组样本比率或构成比之间的差别关系时最常用χ2检验,也是针对计数资料进行假设检验的一种常用的统计学方法,而对两组定量资料分析常用t检验和秩和检验,多组资料分析则常用方差分析;Fisher精确概率法主要适用于总体样本频数小于40或四格表中最小格子T值<1。虽然Fisher精确检验不属于χ2检验,但仍可以作为有效的补充,而也有人认为在统计软件普遍易得的当下,Fisher精确概率法也同样适用于大样本四格表的资料。如彭泽华等[6]在探讨冠状窦-左心房肌连接的双源CT冠状动脉成像(DSCTCA)形态特征时针对冠状窦-左心房肌连接的类型在两组类别变量采用联表的χ2检验,结果差异无统计学意义(χ2=0.115,P=0.944)。Teefey等[7]在研究超声表现及白细胞计数预测急性胆囊炎坏疽变化关系时使用Fisher精确分析。t检验适用于两组定量资料分析且资料满足方差齐性和正态性两个基本条件;同样t检验适用于完全随机设计的单因素两水平的资料,在选用t检验时应注意对资料进行相应的变量变换,若资料不能满足基本条件则选用适合分析偏态分布的非参数检验(如:秩和检验)进行分析。如Wang等[8]在研究不同侵袭性的前列腺癌组织和正常前列腺组织以及外周带前列腺癌Gleason评分与肿瘤信号对比时采用t检验。Kung等[9]在研究化脓性髋关节炎的临床和放射学预测指标时也使用t检验分析。秩和检验包括基本秩和检验(Wilcoxon等级检验、Mann-WhitneyU-检验)和高级秩和检验(Kruskal-Wallis、Friedmantests、Kolmogorov-Smirnov拟合检验)。当研究资料为两方差齐且呈正态分布的总体,而总体分布类型未知或者不满足参数检验的条件时,采用t检验对样本进行比较;但若无需比较总体参数只比较总置的分布是否相同且总体资料分布类型未知时需要采用非参数的Wilcoxon秩和检验进行比较。针对两组或多组样本的定性资料使用秩和检验比较时,需要混合两样本数据、编秩(从小到大)、计量T值、查表或计算求得P值。如Saindane等[10]在对“空蝶鞍”的临床意义判定因素研究中针对颅内压增高和偶然发现空蝶鞍患者两组资料对比时采用Wilcoxon秩和检验。Filippi等[11]在研究DTI测量儿童Ι型神经纤维瘤病胼胝体派生指标时运用Wilcoxon秩和检验。事实上在影像资料分析中经常见到多重组间比较的情况,方差分析(analysisofvariance,ANOVA)就是用来推断两个或者多个总体之间是否有差别的检验,又称F检验。多重组间比较不能单纯选用两样本均数比较的t检验,但是可以根据资料类型选用ANOVA检验。若来自两个随机样本资料呈正态分布且方差齐性同的定量资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验。通过F检验可以比较可能由某因素所至的变异或随机误差,同时可了解该因素对测定结果有无影响。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。Obdeijn等[12]在研究乳腺术前MRI能减少术中切缘和乳腺保守术后再次手术,使用ANOVA分析两组资料,结果对照组(29.3%)相比术前MRI病例组(15.8%)有效减少切缘和再次手术(P<0.01)。
1.2.2相关性分析
相关性分析不等同因果性,也不是简单的个性化相比,其涵盖的范围和领域较为广泛。统计学意义中的相关性分析包含相关性系数的计算,其过程为:每个变量转化为标准单位后,乘积的平均数即为相关系数。相关性分析可以用直观地用散点图表示两个或者多个变量的离散,当其紧密地靠近于一条直线时,即变量间存在很强的相关性。相关分析常用的方法有Pearson相关性分析、Spearman等级相关分析和卡方检验。临床中对两个或者多个均为定量变量的资料,且变量均呈正态分布时可选用Pearson相关分析,但多数情况下Pearson相关分析适用于两组资料的相关性分析。判断两变量之间线性关系的密切程度主要用Pearson积差相关系数,其范围为-1~+1。若相关系数的绝对值越接近1,即两变量间相关性越密切;反之,相关系数的绝对值越接近0,其相关性越差。实际上在高质量期刊论文中使用Spearman等级相关分析的研究也很常见,其通过相关系数进行变量间线性关系分析来判定两个变量间相关性的密切程度。而密切程度的量化指标则通过计算样本相关系数r,根据实际计算r绝对值所属范围来推断两个来自总体变量的线性相关程度,从而推断总体的相关性。根据实际分析需要,将相关关系密切程度分为6等:当IrI=0时,说明两变量完全不相关:当0<IrI<0.3时,说明两变量不相关;当0.3<IrI<0.5时,说明两变量低度相关;当0.5<IrI<0.8时,说明两变量显著相关;当0.8<IrI<1说明两变量高度相关:当IrI=l时,说明两个变量完全相关。王效春等[13]在研究磁敏感加权成像与动态磁敏感加权对比增强MR灌注加权成像联合应用在脑星形细胞瘤分级中的价值一文应用Spearman等级相关分析,结果显示肿瘤内磁敏感信号与相对血容量最大值和病理分级呈正相关(IrI分别为0.72、0.89,P值均<0.01),相对血容量与病理分级呈显著正相关(r=0.78,P<0.01)。又如Lederlin等[14]在比较几何参数、相关功能与组织学特性在哮喘患者的支气管壁CT衰减性关系中同时使用Pearson相关分析和Spearman等级相关分析,其r=0.39~0.43,表明与对照组相比常规CT衰减参数在哮喘患者平常支气管的CT参数、气道壁衰减方面更好的区分哮喘患者,同时也更好地区分气道梗阻。值得提及的是对资料有序或无序无法作出初步判定,且明确资料类型为定性资料时还可以选择使用卡方检验和Spearman等级相关分析。
1.2.3影响性分析
由于事物之间的联系是多种多样的,而某一结局可能受到来自其他多个方面的影响,此时为分析某一结局发生的影响因素可采用的资料分析方法有线性回归(一元或多元)、logistic回归、Cox比例风险回归模型(生存分析)等。在影像资料分析中一元线性回归是将影像资料中一个最主要影响因素作为自变量来解释因变量的变化。多元回归定义为某一因变量的变化受多个重要因素的影响,而此时需要用两个或多个影响因素作为自变量来解释因变量的变化,且多个自变量与因变量之间是线性关系(多个因变量之间相互独立)。实际研究中多元线性回归模型在影像资料分析应用较为广泛。Langkammer等[15]在磁敏感系数绘图在多发性硬化中应用研究中使用多元线性分析,结果显示各种影响因素中年龄是预测磁化率影响最强的因素。Logistic回归是研究二分类和多分类观察结果与某些影响因素自己建关系的一种多变化分析方法,其经常需要分析疾病与各影像指标之间的定量关系,同时又需要排除一些混杂因素影响。Logistic回归在统计学上属于概率型非线性回归,其分析思路与线性回归大致相同,能有效解决过高或过低水平因素以及分析因素少而样本量大等问题。相比多元线性回归,Logistic回归在处理分类反应数据方面更为常用,且适用于结局为定性影像资料。如Lee等[16]研究高分辨率CT在发现小蜂窝样特发性间质肺炎纤维化的连续变化和预后应用中使用logistic回归分析,结果表明高分辨率CT在网状和磨玻璃状范围内评价普通肺炎与非特异性纤维化肺炎之间差别明显(P<0.01)。在临床实际工作中常常需要分析生存时间与影像资料之间的关系,Kaplan-Meier法就是常用的一种分析方法,其又称乘积极限法,对大小样本资料分析均适用。实践中习惯上以时间为横轴、生存率为纵轴回执的阶梯状图称为Kaplan-Meier生存曲线(survivalcurve),也称K-M曲线。Cox比例风险回归模型是另一种生存分析方法,包括参数与半参数模型两类,其主要是进行多因素生存分析的一种方法,同时可分析众多变量对生存时间和生存结局的影响。Saad等[17]在经颈静脉肝内门体静脉分流术在肝移植受者的技术分析和临床评估研究中比较成功施行肝移植与非移植病人开展门体分流术(transjugularintrahepaticportosystemicshunt,TIPS)后的临床疗效评估,使用了Kaplan-Meier法,结果显示6~12个月、12~24个月、24个月以上,移植成活率分别为43%、32%和22%。生存期大于1年的晚期肝脏疾病模型存活评分低于17分、等于17分或大于17分的存活率分别为54%和8%(P<0.05)。
2其他适用方法
2.1ROC曲线
ROC(receiveroperatingcharacteristic)曲线是欧美影像学期刊中应用较为常见的统计学方法,国内期刊应用相对较少。ROC曲线根据一系列不同的分界值以真阳性率(灵敏性)为纵坐标,假阳性率(特异性)为横坐标绘制的曲线。ROC曲线分析结合灵敏度(sensitivity)和特异度(specificity)广泛应用于医学诊断,也应用于影像诊断及人群筛查。ROC曲线根据曲线下面积(areaundertheROCcurve,AUC)的大小对诊断试验作定量分析。理论上,AUC值在0~1间。根据实际情况将诊断分为不符合诊断(AUC<0.5)、无诊断价值(AUC=0.5)、低准确性(0.5<AUC<0.7)、一定准确性(0.7<AUC<0.9)、较高准确性(0.9<AUC<1),AUC越接近于1,表明诊断准确性越高。Hyodo等[18]在研究乏血管少结节的慢性肝脏疾病患者发展成富血管性肝细胞癌风险因素一文中使用ROC曲线分析,结果显示后续发展成血管性结节平均增长率明显高于非血管过渡性结节。
2.2Kappa检验
Kappa检验主要用于评价不同资料间一致性程度,常用Kappa值评价一致程度。Kappa系数适用于两项和多项无序分类变量资料。在影像学试验中常需要判断多名医师测量同一研究对象或者同一医师多次测量同一对象的一致性,Kappa一致性检验便是最佳选择。Kappa检验还可通过计算Kappa值对两种非金标准的诊断方法进行诊断结果一致性分析。一般而言,评价Kappa一致性需要计算Kappa系数,但在研究考察新的诊断试验方法是否优于金标准,或者检验是否与金标准一致时,还需要计算特异度、灵敏度、阳性预测值和阴性预测值等指标。目前公认的Kappa系数分为六个区段即一致性极差(Kappa值<0),一致性微弱(Kappa值0~0.2),一致性弱(Kappa值0.21~0.40),中度一致Kappa值(0.41~0.60),高度一致(Kappa值0.61~0.80),一致性极强(Kappa值0.81~1.00)。
2.3Levene检验
相关热搜:统计学 统计学原理
一、数据统计分析的内涵
数据分析是指运用一定的分析方法对数据进行处理,从而获得解决管理决策或营销研究问题所需信息的过程。所谓的数据统计分析就是运用统计学的方法对数据进行处理。在实际的市场调研工作中,数据统计分析能使我们挖掘出数据中隐藏的信息,并以恰当的形式表现出来,并最终指导决策的制定。
二、数据统计分析的原则
(1)科学性。科学方法的显著特征是数据的收集、分析和解释的客观性,数据统计分析作为市场调研的重要组成部分也要具有同其他科学方法一样的客观标准。(2)系统性。市场调研是一个周密策划、精心组织、科学实施,并由一系列工作环节、步骤、活动和成果组成的过程,而不是单个资料的记录、整理或分析活动。(3)针对性。就不同的数据统计分析方法而言,无论是基础的分析方法还是高级的分析方法,都会有它的适用领域和局限性。(4)趋势性。市场所处的环境是在不断的变化过程中的,我们要以一种发展的眼光看待问题。(5)实用性。市场调研说到底是为企业决策服务的,而数据统计分析也同样服务于此,在保证其专业性和科学性的同时也不能忽略其现实意义。
三、推论性统计分析方法
(1)方差分析。方差分析是检验多个总体均值是否相等的一种统计方法,它可以看作是t检验的一种扩展。它所研究的是分类型自变量对数值型因变量的影响,比如它们之间有没有关联性、关联性的程度等,所采用的方法就是通过检验各个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。(2)回归分析。在数据统计分析中,存在着大量的一种变量随着另一种变量的变化而变化的情况,这种对应的因果变化往往无法用精确的数学公式来描述,只有通过大量观察数据的统计工作才能找到他们之间的关系和规律,解决这一问题的常用方法是回归分析。回归分析是从定量的角度对观察数据进行分析、计算和归纳。
四、多元统计分析方法
很多科研人员(包括临床医生)在进行科研工作过程中,习惯用专业知识取代一切其他知识。其突出表现是:等科研工作已经完成,甚至论文已写完,因某些数据处理有问题被退稿时,才想起要找统计学工作者帮助处理论文中的实验数据;考虑问题稍周到一些的科研人员在科研工作完成之后,在撰写论文之前就想到要运用统计学知识来分析实验数据。这两种运用统计学的科研人员都是在把统计学当作分析数据的“计算工具”或当作发表学术论文的“敲门砖”,是对统计学重要性认识不足的突出表现。理由很简单,科研数据是否正确可靠、是否值得进行数据分析、结论是否可信等一系列重要问题都没有令人信服的证据来帮助说明,换句话说,若缺乏科研设计或科研设计不科学、不完善,即使花费10年时间和数亿人民币进行调查或实验获得了大量科研数据,与某人用计算机产生的毫无专业含义的任意多个随机数据没有什么区别,除了浪费了大量国家和人民的血汗钱,对科学技术进步、对人类的贡献不仅为零,甚至是负数!因此,在进行科研工作之前,制定科学完善的科研设计方案,特别是其中的实验设计方案或调查设计方案的质量好坏,是科研工作成败的关键所在!
科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!
在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。
1 在分析定量资料前未明确交代所对应的实验设计类型
人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。
2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化
例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?
对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!
3 实验设计类型判断错误
例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01
对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。
在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。
如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)
事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。
通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。
例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05
对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。
对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。
4 人为改变设计类型且数据利用不全
例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?
对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05
由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。
5 正交设计及数据处理方面的错误
人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。
参考文献
很多科研人员(包括临床医生)在进行科研工作过程中,习惯用专业知识取代一切其他知识。其突出表现是:等科研工作已经完成,甚至论文已写完,因某些数据处理有问题被退稿时,才想起要找统计学工作者帮助处理论文中的实验数据;考虑问题稍周到一些的科研人员在科研工作完成之后,在撰写论文之前就想到要运用统计学知识来分析实验数据。这两种运用统计学的科研人员都是在把统计学当作分析数据的“计算工具”或当作发表学术论文的“敲门砖”,是对统计学重要性认识不足的突出表现。理由很简单,科研数据是否正确可靠、是否值得进行数据分析、结论是否可信等一系列重要问题都没有令人信服的证据来帮助说明,换句话说,若缺乏科研设计或科研设计不科学、不完善,即使花费10年时间和数亿人民币进行调查或实验获得了大量科研数据,与某人用计算机产生的毫无专业含义的任意多个随机数据没有什么区别,除了浪费了大量国家和人民的血汗钱,对科学技术进步、对人类的贡献不仅为零,甚至是负数!因此,在进行科研工作之前,制定科学完善的科研设计方案,特别是其中的实验设计方案或调查设计方案的质量好坏,是科研工作成败的关键所在!
科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!
在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。
1 在分析定量资料前未明确交代所对应的实验设计类型
人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。
2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化
例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?
对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!
3 实验设计类型判断错误
例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01
对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。
在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。
如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)
事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。
通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。
例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05
对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。
对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。
4 人为改变设计类型且数据利用不全
例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?
对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05
由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。
5 正交设计及数据处理方面的错误
人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。
参考文献
【关键词】 统计学; 统计方法; 统计分析; 研究设计
正确运用统计方法的前提是良好的实验设计。如果试验前没有良好的设计, 或者设计存在缺陷, 那么, 即使使用高级的计算机和复杂的统计方法处理数据, 也只能得到错误的结论。对于生物(医学)研究者来说, 统计问题咨询应该在一个研究项目开始之前, 而不是在研究数据出来以后。没有系统学习过生物(医学)统计学的许多实际工作者常常错误地认为统计分析是在试验完成后才考虑的问题, 而且不考虑研究目的、 资料类型以及统计方法的前提条件等有关统计方法选择的问题。需强调的是,实验设计、 资料搜集与整理分析是科学研究的三个紧密联系的阶段, 而良好的设计是顺利地进行实验和收集数据、 分析数据的先决条件, 希望通过运用统计方法的计算来弥补设计上的错误是不可能的, 也是有害的[1]。
1 统计分析步骤
统计方法的选择依赖于研究方案中的统计学设计。统计学设计是要求研究工作者, 根据研究目的规定研究因素, 选择观察指标, 确定研究对象的样本含量, 拟定研究的实施方法及数据收集、 整理和分析的模式, 以达到用最少的人力、 物力和时间, 获得可靠的结论。在实际工作中, 必须根据医学研究目的、 设计类型、 资料性质、 样本大小和分析过程中所遇到的各种实际情况等, 并结合专业方面的知识来恰当地选择和运用统计分析方法, 才能做出正确的、 符合实际的结论。在区分了研究资料的反应变量和解释变量的基础上, 数据的统计分析主要回答两个问题: 一是反应变量的差异是否可归因于分组因素或对比因素? 二是多个反应变量之间是否存在某种联系? 因此, 医学科研数据统计分析大致分以下4个步骤。
1.1 数据整理 主要进行数据质量的核查、 异常值的处理, 考察数据分布及变量转换等, 以及看数据是否符合特定统计方法所要求的条件。如计算均数和标准差要求数据基本上呈正态分布, 方差分析要求各组方差的差别不宜过大等。
1.2 统计描述 按分组因素或控制因素分组计算反应变量的基本统计量, 如均数、 百分率、 标准差、 标准误等, 得出资料的大致轮廓和进一步分析方向。结果的表达方式主要是统计图或统计表[2, 3]。
1.3 统计推断 选择和运用恰当的统计方法(见统计方法选择)作详细分析, 如均数间的差异比较进行t检验或方差分析、 反应变量间的相互关系进行相关分析、 反应变量与解释变量的依存关系拟合各类回归模型等等。各种假设检验得到的P值是下结论的主要依据[2-4]。
1.4 结果表达 将各种分析结果简单明了地表达出来, 为专业上的分析讨论提供统计学背景[4]。有条件的话, 前3个步骤应在计算机上借助统计软件完成。另外, 以上4个步骤只是一种粗略地划分, 对有些资料,统计描述即可得出较为明确的结论。对于随机分组的实验设计资料或随机抽样的调查资料, 一般可根据资料性质和分析目的找到恰当的统计方法。但对于对比性资料的分析, 往往需要同时用多种统计方法进行处理或拟合复杂的统计模型。
2 统计方法选择
生物(医学)科学研究从研究设计开始到数据的收集、 整理、 分析的全过程中, 统计学知识始终贯穿其中, 而统计分析方法的正确选择在数据处理中至关重要。在研究方案制定时选择何种统计分析方法取决于实验的目的、 不同的设计类型、 观察指标组成的资料性质和样本大小等。
在研究设计时, 统计方法的选择需考虑以下6个方面的问题: (1)看反应变量是单变量、 双变量还是多变量; (2)看单变量资料属于3种资料类型(计量、 计数及等级资料)中的哪一种; (3)看影响因素是单因素还是多因素; (4)看单样本、 两样本或多样本; (5)看是否是配对或配伍设计; (6)看是否满足检验方法所需的前提条件, 必要时可进行变量变换, 应用参数方法进行假设检验往往要求数据满足某些前提条件, 如两个独立样本比较t检验或多个独立样本比较的方差分析, 均要求方差齐性, 因此需要做方差齐性检验。如果要用正态分布法估计参考值范围, 首先要检验资料是否服从正态分布。在建立各种多重回归方程时, 常需检验变量间的多重共线性和残差分布的正态性。
不同的统计分析方法都有其各自的应用条件和适用范围。实际应用时, 必须根据研究目的、 资料的性质以及所要分析的具体内容等选择适当的统计分析方法, 切忌只关心P值的大小(是否
3 统计方法综合运用实例
例 根据2001年进行的大规模调查, 已知某地健康青年男子身高均数为168.34 cm, 体重均数为57.20 kg, 同年在该地应征男性青年中随机抽取120名男子, 测得其身高、 体重资料见表1, 试对该资料进行统计分析[1]。表1 120名应征男性青年的身高与体重资料
3.1 资料的分布特征和数字特征的统计描述 本例属于单样本双变量计量资料。对该资料进行统计分析时, 首先应对每一个变量的分布类型及其特征进行统计描述, 编制直方图或频数表, 计算相应的统计描述指标, 然后在此基础上选择和运用恰当的统计方法进行统计推断, 最后作出明确结论。
本例的身高、 体重频数分布情况见图1~2。由图1可直观看出, 身高的频数分布特征为: 所有数据分布在155~182之间; 数据主要集中在164~173之间, 共有73人, 占总人数的60.8%; 各组段的频数基本以168.5为中心呈对称分布。因此, 可认为身高近似服从正态分布。而体重的频数最多组段58~不在所有组段的中间位置, 各组段的频数以61为中心呈不对称分布(图2), 故可认为体重呈偏态分布。图1 120名应征男性青年身高的频数分布图表2给出了资料分布的数字特征: 均数(x)、 标准差(s)、 中位数(Md)、 四分位数间距(QR)和全距(R)。为了进一步说明各变量是否服从正态分布, 表2也同时给出了偏度系数 由表2可见, 身高的|ug1|和|ug2|均小于1.65, 故可认为身高服从正态分布(矩法正态性检验), 此结论与上述的直观结果相同, 也与图3的图示法结论相同(散点几乎都在一条直线上)。同理, 体重的|ug1|和|ug2|均大于1.65, 故可认为体重不服从正态分布, 此结论亦与上述的直观结果相同, 显然与图4的图示法结论也相同(散点不在一条直线上)。
由于身高近似服从正态分布, 且是大样本数据, 故可用样本均数168.84 cm代表身高的平均水平, 用样本标准差5.19 cm代表身高的个体差异, 用x±1.96 s来描述身高的95%散布范围, 即168.84±1.96×5.19=158.67~179.01 cm。由于体重不服从正态分布, 用中位数58.00 kg代表体重的平均水平, 用四分位数间距8.75 kg代表体重的个体差异, 用百分位数P2.5~P97.5描述体质量的95%参考值范围, 即49.03~80.77 kg。
3.2 参数的点估计与区间估计 身高的均数: =X=168.84 cm, SX=0.47 cm, 95% CI=167.90~169.78 cm 。体重的均数: =X=57.67 kg, SX=0.63 kg, 95%CI=56.44~58.90 cm。体质瘦弱(体重≤50 kg )检出率: =p=17/120=14.17%, SP=3.18%, 95%CI=7.93%~10.41% 。身高与体重的相关系数: =r=0.4040, Sr=0.0842, 95%CI=0.2423~0.5435。本例n=120, 属于大样本数据, 由样本均数分布规律可知, 虽然体重不是正态分布, 但在大样本时, 其样本均数近似服从正态分布, 故仍可用正态分布法进行总体均数的点估计与区间估计。相关系数也不服从正态分布, 故在计算ρ的95%CI时要进行反双曲正切函数转换。
3.3 假设检验 根据历史资料, 已知10年前该地健康青年男子身高均数为166.50 cm, 体重均数为55.20 kg, 可通过假设检验回答: 本次调查结果所代表的该地健康青年男子的身高总体均数、 体重的总体均数、 是否比10年前提高了。
本例属于大样本资料, 可用样本标准差作为总体标准差的估计值, 即身高标准差的估计值=S=5.19, 体重标准差的估计值=S=6.89, 分别进行单样本u检验: 身高: u=4.98, P
同理, 还可以对体质瘦弱检出率、 身高与体重的相关系数等作假设检验。
参考文献
[1] 陈长生. 统计方法的综合运用与统计结果的表达[A]. 徐勇勇. 医学统计学[M]. 2版. 北京: 高等教育出版社, 2004.
[2] 陈长生, 赵清波. 康复医学论文中统计描述指标率和比的正确应用[J]. 中国临床康复, 2003, 7(11): 1692-1694.
【关键词】 焦虑;抑郁;因素分析,统计学;学生;农村人口
【中图分类号】 R 749.7 R 395.6 【文献标识码】 A 【文章编号】 1000-9817(2008)09-0785-03
抑郁、焦虑症状是青少年常见的心理障碍,不仅会影响身心健康,还与吸烟、饮酒、伤害等健康危害行为密切相关[1-2]。农村学校寄宿生大都是由于父母外出打工或住家偏远不得不寄宿,这些孩子长期与父母分离,情感的缺失可能会对孩子的心理健康产生不良影响。为进一步了解安徽省农村寄宿学生的心理卫生状况,笔者于2007年12月到2008年5月对安徽省寄宿制学校学生样本人群的抑郁、焦虑症状及其影响因素进行了研究,结果报道如下。
1 对象与方法
1.1 对象 选取安徽省长丰、绩溪、全椒、岳西4个县,每个抽样地区抽取农村寄宿制学校4~5所,每所学校分别从各年级(小学五年级~高中三年级)抽取1~3个班的所有学生作为调查对象,共收回有效问卷3 834份。其中长丰县958人(25.0%),绩溪县1 008人(26.3%),全椒县1 019人(26.6%),岳西县849人(22.1%);在校住宿学生1 586名(41.4%),在亲朋家住宿学生233名(6.1%),租房住宿学生323名(8.4%),在家住宿学生1 692名(44.1%);寄宿生(在校和租房住宿合并)1 909人(49.8%),走读生(在亲朋家和在家住宿合并)1 925人(50.2%);小学生721名(五年级、六年级分别为377和344人),初中生1 898名(初一、初二、初三分别为680,813,405人),高中生1 215名(高一、高二、高三分别为451,424,340人);男生2 293名(59.8%),女生1 541名(40.2%)。平均年龄(15.15±2.07)岁。
1.2 调查变量 (1)人口统计学变量:包括年级、性别、年龄、地区、父母文化程度、自评家庭经济状况、独生子女情况、自评性格倾向、住宿类型等。(2)抑郁和焦虑症状评定:应用Zung抑郁自评量表(Self-rating Depression Scale, SDS)[3-4]和焦虑自评量表(Self-rating Anxiety Scale, SAS)[4-5]进行评定。SAS和SDS均包含20个项目,其评定分为4级,按最近1周以来的实际情况评分,20个项目评分之和为粗分,粗分乘以1.25,四舍五入取整数即为标准分。本研究以标准分≥50分为界值,评估有无抑郁、焦虑症状。
在校住宿生是指来校上课和参加其他课外活动且在学校宿舍住宿的学生;住亲朋家住宿生指来校上课和参加其他课外活动且在亲戚或朋友家住宿的学生;租房住宿生指来校上课和参加其他课外活动自己租房住宿的学生;在家住宿生指来校上课和参加其他课外活动且回家住宿的学生。
1.3 调查方法及质量控制 在正式调查之前对调查员进行调查技术培训,统一方法。开展预调查完善调查表;所有调查表均印有指导语,调查时解释指导语并提醒学生和教师仔细阅读指导语后填写;以班级为单位,现场发放调查表,要求学生以匿名方式集中独立填写问卷,当场核验收回。
1.4 统计分析 资料以EpiData 3.0建库录入,经数据转换导入SPSS 10.0进行统计分析。统计方法包括描述性分析不同住宿类型学生的抑郁、焦虑症状分布特征,用χ2检验和多因素Logistic回归对抑郁、焦虑症状的影响因素进行分析。
2 结果
2.1 抑郁、焦虑症状检出情况 3 834名学生抑郁症状检出率为49.5%,焦虑症状检出率为24.6%,抑郁和焦虑症状并存检出率为20.8%。抑郁和焦虑呈正相关(r=0.404,P<0.01)。
2.2 不同住宿类型学生抑郁、焦虑症状检出情况 表1显示,在校住宿、在亲朋家住宿、租房住宿和在家住宿学生的抑郁症状以及焦虑症状的检出率差异有统计学意义,其中在校住宿与租房住宿的学生抑郁、焦虑症状检出率差异无统计学意义(χ2抑郁=1.269,P=0.260;χ2焦虑=0.350,P=0.554),而在家住宿与在亲朋家住宿的学生抑郁、焦虑症状分布差异亦无统计学意义(χ2抑郁=0.644,P=0.422;χ2焦虑=0.103,P=0.748),将在校住宿与租房住宿的学生合并为寄宿生,在亲朋家住宿与在家住宿合并为走读生。寄宿生和走读生抑郁症状检出率分别为52.7%和46.2%,差异有统计学意义(χ2=16.021,P=0.000);寄宿生和走读生的焦虑症状检出率分别为27.7%,21.5%,差异亦有统计学意义(χ2=19.573,P=0.000)。
4种住宿类型中,抑郁症状检出率男、女生差异均无统计学意义。在校住宿学生中,焦虑症状检出率女生高于男生,差异有统计学意义(χ2=5.547,P=0.021);其余3种住宿类型的学生,焦虑症状检出率男、女生差异均无统计学意义。无论在校住宿、在亲朋家住宿、租房住宿还是在家住宿,从小学五年级至高三年级学生抑郁症状和焦虑症状的检出率差异无明显的规律性。4种住宿类学生间抑郁症状检出率比较,差异有统计学意义(χ2=17.927,P<0.01);焦虑症状检出率比较,差异也有统计学意义(χ2=20.046,P<0.01)。
2.3 抑郁、焦虑症状的影响因素分析
2.3.1 抑郁、焦虑症状影响因素的单因素分析 χ2检验表明,寄宿情况、地区、年级、独生子女情况、父亲文化程度、自评家庭经济状况、体型、自评性格倾向8个因素间抑郁症状检出率差异有统计学意义,寄宿情况、地区、性别、年级、独生子女情况、父亲文化程度、自评家庭经济状况、体型、自评性格倾向9个因素间焦虑症状检出率差异有统计学意义。
2.3.2 多因素非条件Logistic回归分析 见表2。
由表2可见,分别以抑郁症状(焦虑症状)(无症状赋值为0,有症状赋值为1)为因变量;以焦虑症状(抑郁症状)、地区(设置哑变量,“岳西县”为参照)、年级(设置哑变量,“高三”为参照)、性别(“男”为参照)、独生子女情况(“是独生子女”为参照)、父亲文化程度(设置哑变量,“大专及以上”为参照)、自评家庭经济状况(设置哑变量,“上等”为参照)、体型(设置哑变量,“很胖”为参照)、自评性格倾向(设置哑变量,“外向”为参照)、寄宿情况(走读生为参照)为自变量,进行多因素Logistic回归分析(Forward:LR法)。纳入标准α =0.05,剔除标准 α=0.10。
结果表明,寄宿生有抑郁、焦虑症状的危险均高于走读生;性格外向的学生发生抑郁症状的危险性较低;绩溪县和全椒县学生抑郁症状发生情况低于岳西县;家庭经济水平上等的学生比经济状况一般的学生更易出现抑郁;五年级到初二年级学生发生抑郁的危险性比高三年级更大。女生有焦虑症状的危险性高于男生;高三年级学生的焦虑症状检出率高于其他年级;绩溪县学生焦虑发生率低于岳西县;抑郁与焦虑密切相关。
3 讨论
以往运用Zung自评抑郁量表、流调中心用抑郁自评量表、Beck抑郁量表等自评抑郁量表进行的调查发现,我国青少年抑郁发生率为22.8%~44.0%[6-10]。国外青少年自我报告的发生率为8.6%~52.4%[11-14]。本次调查的寄宿制学校3 834名学生抑郁症状检出率为49.5%,其中寄宿生的抑郁症状检出率为52.7%,高于安徽省中学生(22.8%)[7]和安徽省大学生(28.2%)[15]。学生总的焦虑检出率为24.6%,寄宿生的焦虑症状检出率为27.7%,高于安徽省中学生[16],低于丁树荣等[17]的调查结果。反映抑郁和焦虑情绪问题在农村寄宿制学校中普遍存在,寄宿生和走读生都有较多的心理问题,但是寄宿生比走读生更容易出现抑郁、焦虑情绪,特别是抑郁。可能因为本次调查中66.1%的学生为留守儿童,且寄宿生有70%为留守儿童,其余还有部分为离家偏远而寄宿,这些孩子长期与父母分离,与家人联系及外界交流相对较少,生活环境相对封闭,情感的缺失可能会对孩子的心理健康产生不良影响。
由于评定方法和人群种族的不同,青少年抑郁、焦虑症状是否存在性别差异国内外研究的结果不一致。很多研究认为,抑郁症状的性别差别不明显[18-20],焦虑症状女生显著高于男生[9,15],本次调查结果与这一结论相同。可能与男女生的心理特征有关,女生情感细腻、敏感,具有较高的焦虑特质。岳西县寄宿生出现抑郁、焦虑症状的风险均高于全椒县和绩溪县,笔者分析是因为岳西县是国家级贫困县,经济水平落后,且地处大别山脉,交通较闭塞,地形地貌在4个县中最为特殊,寄宿生生活条件较差,故该县寄宿生较易出现抑郁、焦虑情绪。
多因素结果显示,小学五年级到初二年级的学生发生抑郁的风险较高,而以高三年级为参照,其他年级出现焦虑情绪的风险均低于高三年级。考虑是因为小学五年级到初二年级这个时期的学生正处于青春发育期,青春发动期的身心变化本身是一种应激事件,可能导致个体的抑郁风险增高[21-22]。对农村寄宿制学校这一特殊群体,父母的日常教育关心都比较少,面临这一转变而无法适应、无处倾诉解决,很可能导致抑郁情绪的增加;而高三年级学生面临高考压力,焦虑情绪的产生在所难免,与苏虹等[9]报道一致。
综上所述,农村寄宿制学生的心理健康不是某一个因素的独立作用,而是多个因素的相互作用结果。只有正确认识其危险因素,采取适当的预防措施,通过家庭、学校和社会等多方面的关心和帮助,方能促进农村寄宿制学生的身心发育。但本研究只是横断面调查,还需要进一步研究来确定抑郁、焦虑的影响因素。
(致谢:本课题得到安徽省学校体育卫生协会的大力支持,特此感谢!)
4 参考文献
[1] 陶芳标,张金霞,毛琛,等.抑郁、焦虑症状与中学生多种危害健康行为.中国学校卫生,2004,25(2):131-133.
[2] 张洪波,陶芳标,曾广玉,等.安徽省中学生故意伤害行为及社会心理特征研究.中国公共卫生,2002,18(5):563-565.
[3] ZUNG WW. A self-rating depression scale. Arch Gen Psychiatry, 1965,12:63-70.
[4] 汪向东,王希林,马弘,主编.心理卫生评定量表手册:增订版.北京:中国心理卫生杂志社,1999:194-196,235-238.
[5] ZUNG WW. A rating instrument for anxiety disorders. Psychosomatics, 1971,12(6):371-379.
[6] 曾强,李乐,唐双阳,等.某高校大学生抑郁症影响因素和预防途径分析.实用预防医学,2006,13(6):1 412-1 413.
[7] 张洪波,陶芳标,曾广玉,等.安徽省中学生抑郁心理症状及其相关因素.中国公共卫生,2001,22(6):497-498.
[8] 冯正直,张大均,汪凤.中学生抑郁症状的影响因素分析.中国临床心理学杂志,2005,13(4):466-468.
[9] 苏虹,王保金,陈卉鸣,等.中学生抑郁、焦虑情绪的流行特征及相关因素分析.中国行为医学科学,2002,11(2):196-198.
[10]刘贤臣,等.SDS和CES-D对大学生抑郁症状评定结果的比较.中国心理卫生杂志,1995,9 (1):19-20.
[11]PATTEN CA, GILLIN JC, FARKAS AJ, et al. Depressive symptoms in California adolescents: Family structure and parental support. J Adolesc Health, 1997,20(4):271-278.
[12]MIKOLAJCZYK RT, BREDEHORST M, KHELAIFAT N, et al. Correlates of depressive symptoms among Latino and Non-Latino White adolescents: Findings from the 2003 California Health Interview Survey. BMC Public Health, 2007,147(7):21.
[13]CROCKETT LJ, RANDALL BA, SHEN YL, et al. Measurement equivalence of the center for epidemiological studies depression scale for Latino and Anglo adolescents: A national study. J Consult Clin Psychol, 2005,73(1):47-58.
[14]LA GRECA AM, HARRISON HM. Adolescent peer relations, friendships, and romantic relationships: Do they predict social anxiety and depression? J Clin Child Adolesc Psychol, 2005,34(1):49-61.
[15]许韶君,陶芳标,张洪波,等.大学生抑郁、焦虑症状及其影响因素的分析.安徽预防医学杂志,1999,5 (2):121-122.
[16]张洪波,陶芳标,曾广玉,等.安徽省中学生焦虑心理症状流行特征研究.中国校医,2001,15(1):10-11.
[17]丁树荣,王天奎,王本华,等.中学生焦虑状况及影响因素研究.中国公共卫生,1996,12(9):419-420.
[18]BENNETT DS, AMBROSINI PJ, KUDES D, et al. Gender differences in adolescent depression: Do symptoms differ for boys and girls? J Affect Disord, 2005,89(1-3):35-44.
[19]MASI G, FAVILLA L, MUCCI M, et al. Depressive symptoms in children and adolescents with dysthymic disorder. Psychopathology, 2001,34(1):29-35.
[20]KOVACS M. Gender and the course of major depressive disorder through adolescence in clinically referred youngsters. J Am Acad Child Adolesc Psychiatry, 2001,40(9):1 079-1 085.
[21]STICE E, PRESNELL K, BEARMAN SK. Relation of early menarche to depression, eating disorders, substance abuse, and comorbid psychopathology among adolescent girls. Dev Psychol, 2001,37(5):608-619.
【关键词】人际信任 家庭类型 普遍信任
人际信任是个体将他人的言词、承诺以及口头或者书面的陈述认为可靠的一种概括化的期望。人际信任对大学生人际交往有一定的影响,比如大学生人际信任的高低,会影响大学生与同伴交谈,生活中的交际和交友,体现在与人接触的能力。良好的人际信任对大学生的成长有促进作用,对心理健康发展也有帮助。为了解大学生人际信任在职务、生源地和家庭类型上的差异现状,调查研究情况如下。
一、对象与方法
(1)对象。 随机抽取190名大学生进行调查, 获得有效样本190份,回收率100%。其中,职务:担任班级职务的大学生56人,没有担任班级职务的大学生134人;平均年龄21.04±1.40岁;生源地:来自城市的大学生29人,来自农村的大学生161人;家庭类型:属于独生子女家庭的有27人,非独生子女家庭的有170人。调查时间为2014年10月。
(2)方法。采用自行设计调查表,调查基本情况,包括职务、生源地和家庭类型。采用Rotter编制的人际信任(ITS)量表调查,并做相应访谈。
(3)统计学处理。采用SPSS16.0进行描述统计分析和独立样本t检验。
二、结果
(一)不同职务、生源地、家庭类型大学生人际信任差异比较(表1)
表1 不同职务、生源地、家庭类型大学生人际信任评分结果比较(x±s)
注:*代表p(双侧)< 0.05,**代表p(双侧)< 0.01,下同
表1所示,从职务自变量上看,大学生人际信任在特殊信任因子、普遍信任因子及人际信任总分上的得分,没有统计学意义上的差异(p>0.05)。从生源地自变量上看,大学生人际信任在普遍信任因子及人际信任总分上的得分,差异有统计学意义(p0.05)。从家庭类型自变量上看,大学生人际信任总分上的得分,差异有统计学意义(p0.05)。
三、讨论
(1)班级职务差异。研究发现,是否担任班级职务,大学生人际信任的特殊信任、普遍信任因子及信任总分,没有显著差异。通过访谈发现,原因是班干部和非班干部是同龄人,他们和父母、同伴的交流方式有90后的时代特点,渴望情亲和友情,但是相处中矛盾较多,等等的时代共同点和受教育环境的相似,故差异不显著。
(2)生源地差异。研究发现,来自城市的大学生,人际信任在普遍信任因子及人际信任总分显著高于来自农村的大学生。通过访谈发现,原因是城市大学生大都是独生子女,是每个公寓的唯一孩子,父辈和祖辈给予的爱和关注更多,成长环境更安逸,在与人相处中更容易信任陌生人,故城市大学生人际信任的总体得分也较高。
(3)家庭类型差异分析。研究发现,独生子女家庭的大学生,人际信任总分显著高于非独生子女家庭的大学生。访谈发现,独生子女大学生,父母给予他们的期望和爱较多,在成长过程中,指导和保护也较多,独生子女大学生他们的社会实践参与的较少,对人的评价也较多的往积极方面考虑,故他们的人际信任总得分较高。
四、建议
社会方面,社会大环境中,弘扬正气,法制健全,提高整体国民素质水平,社会的整体人际信任高,在这样的安全的环境下,大学生的人际信任会得到全面发展,特殊信任和普遍信任都会有所提高。学校方面,可以多让大学生参加集体活动,在理论教育的同时,让大学生有更多的参加生活实践的机会,增加独生子女和非独生子女的互动交流,让大学生与朋友家人和睦相处的同时,也能结交更多的新同学新朋友,为其步入社会的人际信任发展打下基础。家庭方面,家长首先认识到大学生已经是成年人,可以独立承担家庭一部分责任,并且有能力;其次,给大学生与人交流交往的机会和信任,家庭有重大决定可以和其商量,然后共同决定;最后,父母的交流互动模式是大学生人际信任发展的第一课堂,父母在生活中有良好的互动方式是有必要的。个人方面,大学生认识到自己已经长大成人,自己有主动与人交往交流的能力,能人际信任发展的能力,不仅能与家人和睦相处,在生活中也能和陌生人打交道。
参考文献:
Epidemiology and Population Health, Albert
Einstein College of Medicine
Biostatistics and
Epidemiology
A Primer for Health and
Biomedical Professionals
Third Edition
2004, 243pp.
Softcover $ 33.20
ISBN 0-387-40292-6
本书是由美国Albert Einstein医学院流行病学和群体健康系流行病学室Sylvia Wassertheil Smoller教授编著的。第一版于1990年出版,第二版于1995年出版,现为第三版。本书的特点是根据流行病学和统计学的基本框架,使读者理解流行病学与生物统计学的基本原理,理解“为什么做”和“做什么?”学会“如何做、如何解释”。书中的内容都是临床试验和基础研究中最常用的、或是在文献中经常引用的。
全书共分9章。第1章讲述科研方法问题,包括逻辑推理、变异、研究设计、变量的量化、无效假设、假设检验、检验错误的类型、显著性水平等;第2章叙述概率的一些基本概念;第3章介绍常用的统计学检验方法;第4章介绍流行病学的基本概念,包括流行病学的应用、常用指标、流行病学研究类型、偏倚、混杂、交互、多变量分析等;第5章介绍筛检的基本概念;第6章是叙述随机对照临床试验;第7章介绍生活质量的评价,包括量表的结构、可靠性、真实性、敏感性(反应性)以及用量表评价生活质量的局限性;第8章介绍遗传流行病学的基本概念,包括双生子研究、连锁和联系分析、传递不平衡检验等;第9章阐述科研伦理学与统计学的关系。第8、9两章的内容在人类研究中十分重要,是第三版新增加的,是一般流行病学或统计学入门书籍中所没有的。
书后附有9项附录,介绍正文中各种统计学计算的实例,以使读者能够更顺利阅读本书、以及如何实际计算,包括卡方、Z值及t-值的临界值表、Fisher精确检验、几组比较的Kruskal-Wallis非参数检验、相关系数计算、率的年龄调整、比值比的可信性、两个变量的“J”或“U”型关系、量表记分改变的适宜性(敏感性)评价、以及遗传学基本原理和知识。书后还附有参考文献及建议阅读的书目,读者如需了解更深入的、超出本书范围的内容、或涉及高等数学方面的内容,可阅读这些推荐的教科书。书末附有主题索引,便于读者检索。
本书以科学的哲学和逻辑学原理,讨论统计学检验的基本原理,而不是让读者去做具体的统计学检验。全书各章节都是独立的,读者可不按顺序阅读,只阅读感兴趣的部分。本书特别适合那些没有或很少有数学背景的读者,使他们能够读得懂、用得上。
本书内容既简明,又适合范围较广的读者需要,所阐述原理和方法适合多种领域,包括医学、公共卫生、心理学、教育学。本书是一本简明的流行病学与生物统计学教科书,适合从事临床和基础研究的医生、医学专业本科生、研究生,或非医学专业学生参考,也可供程度较高的读者、以及对生物统计学与流行病学的逻辑学和方法学感兴趣的研究人员参阅。
乌正赉,教授
(中国医学科学院基础研究所)
关键词:生物统计学;SPSS;考核方式;改革
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)18-0247-02
生物统计学是数理统计方法在生物科学领域的应用,它主要是研究数据资料的收集、整理、分析和解释的科学[1]。生物统计学是我院动物科学、动物医学、动物药学、动植物检疫、水产饲草等专业的专业基础课,由于该课程理论抽象、公式繁多、内容枯燥,是学生们普遍认为难学的一门课程[2]。实验教学是培养学生理论联系实际,提高创新意识和实践能力的重要环节。在生物统计学的教学工作中充分认识并落实实验教学的地位,对于培养学生运用数理统计方法解决生物学领域问题的能力、增强创新意识、提高人才培养质量有着重要的作用[3]。可见实验教学在生物统计学中占有重要地位,因此我们应该注重实验教学环节并对其适时改革。
一、SPSS在生物统计学上机实验中的应用
目前,在生物统计学上机实验课中,可选用的软件有Excel、SPSS、SAS、Oringin和R软件等[4-7]。其中SPSS为专业统计软件,其统计分析功能较强,是复杂、大型统计分析中的常用工具[8]。SPSS即社会科学统计软件包是世界著名的统计分析软件之一,“易学、易用、易普及”是SPSS软件最大的竞争优势,也是广大数据分析人员对其偏爱有加的主要原因。SPSS主要具有以下优点:大量成熟的统计分析方法、完善的数据定义操作管理、开放的数据接口、灵活的统计表格和统计图形。因此我们在实验教学中首选SPSS软件作为上机用统计软件。由于SPSS软件版本多,而且多为英文版,对于初学者来说中文版本更为适合,因此我们专门购买了SPSS17中文多国语言版本。
SPSS软件运行时有多个窗口,各窗口有各自的作用,但是想快速入门,只需要熟悉两个基本窗口即可,他们是数据编辑窗口(SPSS Data Editor)和结果输出窗口(SPSS Viewer)。数据编辑窗口是SPSS的主要程序窗口(见图1),其功能主要是定义SPSS数据的结构、录入数据和管理数据。数据的录入一般分两种方法:(1)在数据编辑窗口里,新建数据,首先打开数据编辑窗口的左下方“变量视图”,在里面定义需要录入数据的变量名称以及其他选项,如图1中的“品种”、“血糖值”就是变量名,然后回到数据视图,可以在定义好的变量下录入相应的数据。(2)在数据编辑窗口里,可以直接打开已经存在的数据,如“.cav、.xls、.dbf、.txt”等形式的数据资料。SPSS结果输出窗口是SPSS的另一个主要窗口(见图2),它的主要功能是显示管理SPSS统计分析结果、报表及图形。SPSS结果输出窗口中显示的结果等信息可以保存起来,以后需要时候可以再打开查看结果。
二、数显互动系统在生物统计学上机实验中的应用
生物统计学的上机操作实验环节可以提高学生的动手能力,还可以提高其解决实际问题的能力。但是对于从未接触过SPSS统计软件的初学者来说,只是口述SPSS统计软件的各种操作是不够的,学生不容易接受,而且会手忙脚乱。因此我们使用的是Motic第二代数码显微互动系统,该系统由教师主控单元、学生终端单元和链接教师和学生间的网络系统三部分组成。该系统的优点在于可进行图像的实时数字传输,实现师生双向信息互动和文件传送[8]。
生物统计学的整个上机实验过程主要包括以下几个环节:(1)老师演示:学生上机操作前老师要以例题的形式进行讲解和操作,教师通过数码互动系统在主控单元计算机屏幕进行数据分析操作,每名学生坐在自己的电脑前就可以从电脑上看到教师分析数据时的每一个操作动作,这样可以使得学生很快就掌握了该次上机的详细操作步骤。(2)学生操作:学生针对本次实验内容自己上机运用SPSS软件进行相应的统计分析,在这个环节里如果学生遇到不会操作的地方,可以举手向老师请教,在老师的指导下能够顺利完成实验内容。(3)写电子版实验报告:只用SPSS分析完数据还不够,还要会分析最终结论(即统计推断)。因此学生要把实验的主要结果(图、表等)和最终结论填写到实验报告中。最终以Word的形式通过Email发送给老师。
三、生物统计学上机考核方式的改革
考核方式的改革是生物统计学实验教学改革的重要组成部分。合理的考核评价体系,对于客观、全面评价学生的学业水平和引导学生的学习方向上发挥着重要作用,能够达到调动学生积极性,提高学生学习效率的目的[3]。以往的上机考核多以上机实践总结和考勤作为评分标准,学生在写上机实践总结时往往存在抄袭,而且文笔好的学生写的总结内容丰富全面,可能得了高分,这样对于学生的动手能力和水平难以准确地给予评价。因为我们针对上机考核方式进行了一些改革。在上机考核中增加了电子实验报告和上机考试这两部分。电子实验报告是每次实验课上当堂完成实验操作结果那部分,既可以作为检验学生对每节实验课是否掌握的依据,还可以提高学生的电脑运动能力(Word)。上机考试主要是针对整个上机实验内容进行抽样考试,我们事先出各种类型的试卷,针对不同的班级随机抽取一个类型的试卷进行上机考试,因为班级多,而计算机机房的电脑有限,只能采用各个班级轮流上机考试。为了杜绝了不同班级考题一样及考题外漏等问题,我们分别出了A、B、C等多种类型试卷。最终,上机总分=考勤(10%)+电子实验报告(20%)+上机考试(70%)。
四、结语
通过以上SPSS软件的应用、数显互动系统的应用以及多元化评定上机考核等方面的改革与实践,使得学生对生物统计学的学习、理解、操作等情况能够及时反馈给老师,老师可以根据情况不断完善实验教学方法和手段,从而提高实验教学效果,同时增强了学生的动手能力和解决实际问题能力。学以致用是生物统计学最重要的特点之一,因此不仅要求学习者掌握知识,更要学会应用知识[9]。尤其是在做本科生或研究生毕业论文的时候,学生应该能够独立完成合理试验的设计,运用SPSS统计软件,针对不同数据进行分析,完成高质量的毕业论文。
参考文献:
[1]张勤.生物统计学[M].第2版.中国农业大学出版社,2008.
[2]白俊艳,贾小平,张小辉,等.生物统计学课程改革与实践[J].畜牧与饲料科学,2013,34(10):57-60.
[3]张强,张建平.生物统计学实验教学的探索与实践[J].实验室科学,2012,15(6):15-18.
[4]梅花,白乙尔图.SPSS统计软件在《生物统计学》教学中的实例应用[J].中国畜牧兽医文摘,20l2,(7):217.
[5]朱水平.生物统计学实验教程[M].云南科技出版社,2006.
[6]姜红霞.origin软件在生物统计学教学中的应用[J].陕西教育:高教版,2009,(3):82-83.
[7]马相如.自由软件R及其在生物统计学教学中的使用[J].科技传播,2010,(3):81-82.
【关键词】 创伤和损伤;对比研究;学生;农村人口
【中图分类号】 R 641 G 478.2 【文献标识码】 A 【文章编号】 1000-9817(2008)09-0782-03
伤害严重威胁着人类的生命和健康,近年来已成为主要的公共卫生问题之一,并已被列为单独的一类疾病[1]。我国每年约有70万人死于伤害,伤害已成为中小学生的首位死因[2],给人们的身心健康和国家的经济造成了极大负担[3]。随着社会经济的发展和教育体制的改革,寄宿制学校越来越多[4]。通过调查研究,人们逐渐认识到寄宿生特有的生活方式,使他们在心理、体质等很多问题上与普通学校的学生存在差异[5-7],对这一群体的管理和教育方式也应有所侧重。为进一步了解安徽省农村寄宿制学校学生的伤害发生情况,笔者于2007年12月到2008年5月对安徽省5个县农村寄宿制学校的部分学生进行了问卷调查。
1 对象与方法
1.1 对象 采取分层整群抽样法,在安徽省抽取长丰、绩溪、全椒、濉溪和岳西5个县作为调查点,每个县抽取寄宿制学校5所,共计25所。每所学校从符合条件的年级抽取1~3个班,对其所有学生进行调查。共发出调查问卷5 624份,回收并审核后的有效调查问卷5 556份,问卷合格率达98.79%。学生年龄范围9~21岁,平均年龄为(14.97±2.07)岁;其中长丰县958人(17.2%),绩溪县1 008人(18.1%),全椒县1 019人(18.3%),濉溪县1 722人(31.0%),岳西县849人(15.3%);男生3 241名(58.3%),女生2 315名(41.7%);住校生2 607人(46.9%),住家学生2 133人(38.4%),住亲戚朋友家334人(6.0%),租房住者482人(8.7%);小学生721名(五年级377名,六年级344名),初中生3 201名(初一1 011名,初二1 288名,初三902名),高中生1 634名(高一528名,高二490名,高三616名)。
1.2 调查变量与方法
1.2.1 社会人口统计变量 包括性别、独生子女情况、学习阶段(小学、初中和高中)、体型(很瘦、偏瘦、中等、偏胖和很胖)、地区(长丰县、绩溪县、全椒县、濉溪县和岳西县)、住宿类型(住校、住亲朋家、租房住和住家)、自评家庭经济状况(下等、中下、中等、中上等和上等)和父、母文化程度(无父/母、未上或小学未毕业、小学毕业、初中、高中、中专大专及以上)等。
1.2.2 伤害发生情况 问卷中列出10种常见伤害类型,要求学生填写自己在最近1 a的发生情况。调查员到各学校以班级为单位进行现场调查,学生集中填写问卷并当场收回。伤害发生率=(1 a中至少发生过1次伤害的人数/调查总人数)×100%。
1.2.3 伤害的分类及判断标准 参考ICD-10损伤、中毒外因分类,将伤害分为扭伤、跌伤或坠落伤、烧伤或烫伤、溺水、交通事故、刀(或锐器)割伤或刺伤、动物咬伤、中毒、爆炸伤、电击伤和窒息等共10种。凡有以下情况之一者判定为伤害:(1)到校医室或医院处理过;(2)由教师或家长做过紧急处理;(3)因伤缺课0.5 d以上。
1.3 统计方法 用EpiData 3.0建立数据库,SPSS 13.0进行统计分析。用描述性统计分析方法分析一般情况,χ2检验用于分析学生的伤害发生率有无差异。分别以住校和住家2种住宿类型学生总的伤害发生情况为因变量,对单因素Logistic回归分析有统计学意义的因素进行多因素Logistic回归,探讨这2种住宿类型学生伤害发生的主要危险因素。
2 结果
2.1 农村寄宿制学校学生伤害发生情况 被调查者在过去1 a内至少发生1次伤害者2 891人,伤害发生率为52.0%。各类伤害累计发生次数为9 582次,伤害者平均伤害发生频率为1.72次/人。由表1可见,住校、住亲朋家、租房住和住家这4种住宿类型的学生伤害总体发生率差异有统计学意义(χ2=8.44,P<0.05),不同住宿类型学生在交通事故和动物咬伤这2种类型伤害发生率间的差异均有统计学意义。经两两比较可知:住家学生伤害总发生率和交通事故发生率均高于住校生,OR值分别为1.18和1.80,P值均<0.05;住家学生交通事故发生率亦高于住亲戚朋友家的学生(OR=2.63,P<0.05);住家学生动物咬伤发生率高于其他3种住宿类型学生,OR值分别为1.37,2.16和1.53, P值均<0.05。
2.2 农村寄宿制学校学生伤害的分布特征
2.2.1 不同性别学生伤害发生情况 由表2可见,男生伤害总发生率为56.7%,女生为45.5%,差异有统计学意义(χ2=67.28,P<0.01)。在不同类型的伤害发生率上的性别差异均有统计学意义。
2.2.2 不同学习阶段学生伤害发生情况 由表3可见,伤害总发生率在不同学习阶段之间的差异有统计学意义(χ2=66.15,P<0.01),其中初中生伤害发生率(55.9%)和小学生伤害发生率(54.1%)均高于高中生(43.6%)。具体类型中,扭伤、跌伤或坠落伤、烧伤或烫伤、刀(锐器)割伤或刺伤的发生率以初中生最高,而溺水、交通事故和动物咬伤的发生率以小学生最高。
2.2.3 不同地区学生伤害发生情况 由表4可见,不同地区学生伤害总体发生率差异有统计学意义(χ2=95.07,P<0.01)。多种伤害类型发生率的地区间差异均有统计学意义。
2.3 不同住宿类型学生伤害危险因素分析 由表5可见,按α=0.05的标准选取,进入住校生和住家生伤害回归模型的变量相同,分别是地区、学习阶段和性别;将各变量进行赋值,地区(岳西县为对照)、学习阶段(高中为对照)和性别(赋值为男1女2),经多因素非条件Logistic分析(Forward:LR法,纳入、剔除标准分别取0.05和0.10)可知,影响住校生伤害发生率的因素有地区(绩溪县和长丰县高于岳西县)、学习阶段(初中生高于高中生)和性别(男生高于女生),而影响住家学生伤害发生率的因素有性别(男生高于女生)、学龄阶段(初中生高于小学生和高中生)和地区(长丰县高于岳西县)。
3 讨论
许多研究显示,青少年是伤害的高发人群[8-9]。我国中小学生每年发生伤害达4 250万人次,因伤害缺课达2.38亿天,不仅对学生本身的身心健康和学业造成了不良影响,给家庭和社会带来的负担亦是巨大的。调查结果显示,安徽省农村寄宿制学校学生在过去1 a里总的伤害发生率为52.0%,伤害者平均伤害发生频率为1.72次,这一结果高于胡佳等[10]的报道,低于阳本华等[11]的报道结果,可能与所调查的伤害类型和资料来源不同有关,也有可能与调查对象地域差异有关。
本次调查的学校是寄宿制学校,被调查的学生以住校和住家2种居多。调查结果显示,4种住宿类型的伤害发生率存在明显差异,其中住校生的烧烫伤和交通事故发生率均明显低于非住校生,这可能与住校生接触这2类危险的机会较少有关。有关资料显示,交通伤害已成为中小学生伤亡最主要原因之一[12]。因此,对于非住校生,应加强他们的交通安全意识,教育他们养成遵守交通规则的好习惯,以减少交通事故的发生率。虽然减少伤害相关行为的发生是降低伤害发生率的有效手段,但随着年龄增长,从事家务劳动是一个必然趋势,学生在使用煤气、电器的同时,需注意避免烧烫伤、电击伤、中毒等伤害的发生,这就需要教师和家长积极引导和提醒以去除伤害的隐患。另外,地区也是影响伤害发生的一个主要因素,这与他们的地理位置、气候特征以及生活习惯等差异有关,不同地区的有关部门应当根据自身特点制定伤害防范和管理措施。
伤害的发生与性别因素有关,与刘慧慧等[13]多数报道结果一致。调查中女生的伤害发生率大都低于男生,这可能与她们独有的性格、运动强度小、活动范围小有关,并且在日常生活中,社会各方面对男女生的保护和教育方式也不相同,今后应加以注意,降低男生伤害的发生率;伤害的发生在不同的学习阶段之间存在差异。初中生伤害的总体发生率高于小学生和高中生,且跌伤、烧烫伤、刀割伤的发生率也最高,可能与这个年龄段的孩子活动的机会多、强度大,喜欢新鲜和刺激的游戏有关;而小学生溺水、交通事故和动物咬伤的发生率最高,尤其是住校的小学生,是住校生中伤害发生的高危人群,自理能力较弱,心理尚处于未完全成熟阶段,应加强教育以促进他们尽快摆脱幼稚,并做好防范与管理工作;尽管高中生可能由于学业的压力使其伤害发生率最低,但仍然不能放松警惕,缓解压力,促进他们身心健康是必不可少的。此次调查发现,有8.7%的学生在外租房住宿,他们的安全系数大幅度降低,对于这部份学生的身心健康的关注和安全管理也不容忽视。
伤害预防要根据不同的年龄和群体制定有效的安全措施[14]。通过开展各种教育活动提高学生的自理能力、自我保护意识和自我救治技能,以减少伤害的发生和避免不良结局的产生。除此之外,学生的安全问题仅靠学校单方面的努力是不够的,家庭的配合和社会的关注必不可少[15]。只有社会各界共同行动,才能有效减少和预防学生意外伤害的发生。
(致谢:本课题得到安徽省学校体育卫生协会的大力支持,特此感谢!)
4 参考文献
[1] 王春灵,王云霞.766例儿童意外伤害原因分析及预防.华北煤炭医学院学报,2008,10(1):91-92.
[2] 季成叶,陶芳标.儿童青少年非故意伤害预防.中国公共卫生,2005,21(9):1 150-1 152.
[3] 王声.我国伤害流行病学研究亟需开展.中华流行病学杂志,1997,18(3):131-133.
[4] 李士凯.寄宿学生的疾病预防与管理.现代预防医学,2005,32(2):156.
[5] 刘朝军,田素英,寻广磊,等.寄宿制和非寄宿制学校高中生心理健康状况比较.中国临床康复,2004,8(27):5 782-5 784.
[6] 蔡亮亮.寄宿小学生610名健康状况调查.中国学校卫生,2003,24(6):640.
[7] 赵红深,陈雄新,李健芝,等.不同住宿方式学生体质状况比较分析.中国学校卫生,2008,29(4):366-367.
[8] 吴晓红,陈建华,杨楚春,等.黄石市小学生伤害流行病学调查.疾病控制杂志,2004,12(8):519-522.
[9] MACKENZIE SG, PLESS IB. CHIRPP: Canada's principal injury surveillance program. Inj Prev, 1999,5(3):208-213.
[10]胡佳,刘莉,毛军,等.上海浦东新区2003学年中小学生伤害发生情况.中国学校卫生,2005,26(11):976-977.
[11]阳本华,李军,肖和平,等.郴州市中小学生伤害流行病学调查分析.现代预防医学,2001,28(2):152-154.
[12]王声.校园安全与中小学生伤害现况.中国学校卫生,2006,27(2):96-98.
[13]刘慧慧,郝加虎,张国庆,等.宿州市农村中小学生伤害影响因素分析.中国学校卫生,2005,26(6):464-465.
[14]张振华.福州市儿童青少年意外伤害分析.中国校医,1999,20(3):172.
关键词:肝胆外科、切口感染、多因素分析、对策
切口感染为所有外科术后最常见并发症之一,当今社会无菌技术飞速发展及多种广谱抗生素的应用可以降低其发生率,但尽管如此切口感染发病率仍比其他术后并发症的发生率要高得多。术后切口感染严重影响病人的预后,对病人的术后康复引起严重的后果,而且还会给病人家庭增加巨大不必要的经济负担[1]。因此为了降低术后切口发病率,笔者通过回顾研究我院623例肝胆外科并发切口感染的病例,通过对比分析法总结其发生的因素及相对应的防范措施,现将具体情况总结如下。
1、资料与方法
1.1 一般资料 通过研究我院在2008年1月至2012年1月期间肝胆外科病例623例,其中男性399例,女性224例,年龄最大75岁,最小18岁,平均年龄55岁。623例患者实施的手术类型具体总结如下:肝移植,肝叶切除术,胰腺肿瘤切除术,胰十二指肠切除术,肝肿瘤切除术,胆总管探查引流术等。
1.2 方法 通过回顾分析研究我院在2008至2012年期间的切口感染病例,包括病人的病例,档案记录的查房单,病程单,辅助检查结果,切口分泌物实验室检查结果,并将其按不同发病原因统一记录于统计调查表中。
1.3统计学方法 应用SPSSl5.0软件分析,计数资料采用百分比表示,数据对比采取X2校验,P>0.05,差异无统计学意义,P
2、结 果
通过统计分析623例肝胆外科病人,术后发生切口感染的病例为123例,发病率为19.7%。通过具体的统计学方法χ2检验,发现能影响患者切口感染的确切因素有6个,分别为白细胞计数,手术时间长短,手术出血量,切口类型,医用碘伏消毒程度,术中广谱抗生素用量及种类。
2.1单因素Logistic回归分析
以肝胆外科手术患者有无手术部位切口感染为因变量,以性别、年龄、职业、文化程度、生源地、居住所在地、婚姻状况、经济状况、费用类别、居住状况、工作压力、经济压力、体型、手术季节、术前空腹血糖、术前糖化血红蛋白、术前血红蛋白量、术前血钠水平、术前血清高敏C反应蛋白含量、术前白细胞升高程度、ASA麻醉评分、围术期高血糖、手术时间、术中出血量、胃肠道营养、手术性质(急诊或者择期)、手术方式、手术室各区域布局、切口类型、手术切口长度、切口抗生素冲洗、是否放置引流、术后引流量、术后抗生素使用情况和基础疾病自变量赋值后进行二分类Logistic回归分析,结果发现手术室各区域布局合理、放置引流和抗生素切口冲洗是肝胆外科手术患者手术切口感染的保护因素,高龄、急诊手术、手术时间长、手术切口长和Ⅲ类切口是肝胆外科手术患者手术切口感染的危险因素。
2.2 多因素Logistic回归分析
以肝胆外科手术患者有无手术部位切口感染为因变量,选择本研究进入肝胆外科手术患者手术切口感染单因素Logistic回归分析方程的8个自变量为自变量进行多因素Logistic回归分析,α入=0.05,α出=0.10,结果发现放置引流和抗生素切口冲洗是肝胆外科手术患者手术切口感染的保护因素,高龄、急诊手术、手术时间长和Ⅲ类切口是肝胆外科手术患者手术切口感染的危险因素。
3、讨 论
肝胆外科术后切口感染的危险因素与其他外科切口感染有许多共同点也有其特殊之处,主要特点是其感染的危险因素涉及患者本身与外科医生的操作[3],具体危险因素及防范对策总结如下:
3.1 切口类型 肝胆外科术后切口感染主要原因是受腹腔内肠源性细菌感染,由统计学资料显示,Ⅲ型切口的感染率高达59.4%,但由于肝胆外科的特殊性,常常需要涉及到胆道切开,上消化道分离,肝小叶切除等Ⅱ,Ⅲ类型切口,且统计学显示这两种类型切口感染率均显著高于Ⅰ型切口,所有增加了其术后发生切口感染的概率。因此为了降低其感染率,需要外科医生在术前术后要做好无菌操作;仔细消毒切口;关闭腹腔前仔细冲洗腹腔,用碘伏反复消毒切口;术后放置腹腔引流且时刻保持引流管的畅通;选用抗生素需按照患者的引流液细菌实验室检查做相应的改变。
3.2 手术切口缝合 通过本次研究笔者还发现,切口的缝合好坏直接影响切口是否感染。由主刀医师等经验丰富的医师缝合的切口感染率显著低于实习医生等非主刀医师的缝合感染率。因此肝胆外科的切口感染与医生的缝合经验有密不可分的关系。所以外科医生在缝合切口时因注意减少死腔,争取一次性缝合,打结时松紧度适宜,严密缝合皮缘。
3.3 切口消毒及冲洗 作为所有外科手术,切口消毒都是一种非常简单却行之有效的一种规避切口感染的手段,经过外科长时间的发展,已经被医学界广泛认同,这也是无菌术提高的重要原因。最常用的冲洗液是无菌性生理盐水,用其冲洗切口可以洗净切口的细碎脂肪组织,灰尘,坏死组织的碎片等,可以显著降低切口的带菌量。切口的消毒肝胆外科广泛使用碘伏。碘伏是单质碘与聚乙烯吡咯酮的不定性复合物,医用碘伏浓度较低,其起着光谱杀菌的作用,对大多数细菌有杀灭作用,但其对蛋白质等不起损害作用,所以在医学界被广泛应用。经统计学资料显示,切口经过碘伏消毒可以明显降低其感染发生率。所以将无菌生理盐水与碘伏联合使用,是有效规避切口感染的重要手段。
3.4 术中失血量 由于肝胆外科手术入路的特殊性,肝脏等器官又是人体主要供血器官,所以术中出血极为多见。由于肝胆外科手术时间均长且操作复杂,所以病人可能会长时间的出去,经过大量输注晶体补充液和人工血液,导致组织器官血供不足,组织缺氧,似的组织发生坏死等,降低切口的愈合力,及免疫力,所以迅速精准的操作,对外科医生提出了更高的要求。所以在术前仔细检查,做出正确的手术方案是必不可少的。
综上所述,对肝胆外科术后切口感染的危险因素是多方面的,从笔者此次观察发现的几点危险因素,感染的发生除了与患者本身有关,但更多方面是关于外科医生的操作,因此为了降低术后切口感染的发生概率,需要外科医生严格实施无菌操作,注意细节,操作熟练迅速,最大程度的降低切口感染的发生概率。
参考文献:
[1] 洪锦兰,郝元涛. 手术部位感染相关因素研究进展[J]. 中华医院感染学杂志,2010,20(5):748-750.
关键词:职业紧张;工作要求-自主模式;个体特征;职业类型
An Preliminary Assessment of Job Strain of People in Different Types of Profession in Luwan District WU Jian-hua1,DAI Jun-ming2,YU Hui-zhu3,XU Hui-hua1,LIU Huai-yu1,SHEN Wen-rong1,SHENG Da-ying1,FU Hua2(1.Luwan District Center for Disease Control and Prevention,Shanghai 200025,China;2.School of Public Health,Fudan University,Shanghai 200032,China;3.Shanghai Municipal Center for Disease Control and Prevention,Shanghai 200336,China)
Abstract: [Objective] To assess job strain of people in different types of job in Luwan District. [Methods] Using a working requirement & self-determination questionnaire,targeting at 617 persons from teachers,science researchers,government officials and administrators of building-keeping,to assess the level of their psychosocial job strain. Then use analysis of variance to assess each factor's contribution,and use chi-square test and logistic regression to compare factors which have influence on people's job strain. [Results] Taking“demand”,“control”,“skill”,and“social support”as the factors determining people's strain,their scores are statistical significantly different among age goups,educational background,and jobs,but not significant between sex groups.It shows that 50.2% of the studied group of people are in higher job strain,and it counts as 36.5% for science researchers and government officials,56.3% for teachers,and 50.4% for administrators of building-keeping. Multi-way analysis of variance shows that OR for teachers and administrators of building-keeping are 2.69(1.618-4.454)and 2.30(1.156-4.566)respectively. There's significant difference between different jobs,but not significant between ages,gender and educational background. [Conclusion] Researcher population are in higher job strain than others,in which teachers and administrators of building-keeping need much care.
Key Words:job strain;Working requirement & self-determination;questionnaire;types of profession
近年来随着社会变革与经济的快速发展,人们在工作中所感受到的压力在迅速增加。由于长期工作压力所致职业紧张问题正逐步引起全社会的广泛关注[1]。1994年联合国报告[2]指出:“世界正在变成充满紧张的世界”。卢湾区为中心城区之一,职工的职业类型已经发生了显著变化,原有影响职工健康的生产性有毒有害因素已明显减少,而因工作压力所致职业紧张等社会心理因素正在转化为主要的职业性有害因素。
对职业紧张程度评估中,KARASEK[3,4]提出的工作要求自控(或支配)模式(Job Demand-Control Model,JDC模式)是最有影响的理论之一。JDC模式从个体角度评估职业紧张,认为工作要求高,而工作自控(支配)力低即为引起职业紧张的重要原因,工作的自控(支配)水平高可缓解工作要求的健康负效应。并专门设计了评估职业紧张程度的工作内容问卷调查表(Job Content Questionnaire,JCQ)。THEORELL[5]又对JDC模式进行补充,提出社会支持是职业紧张的修正因素。以工作要求-自控(支配)模式理论为指导的研究,国内开展较少。为了评估卢湾区3种职业类型在职职工的职业紧张程度与健康的关系,即开展该项调查。本文报道其初步调查分析结果。
1 对象与方法
1.1 对象
选择以中学教师、科研与行政管理人员及物业服务员工构成的调查样本为研究对象,并且均知情自愿。该调查表设计了简明导言,由对象自主填写。共发出问卷786份,收回有效问卷617份(应答条目数超过80%者),应答率78.5%。平均年龄37.2岁,标准差为11.67。其中,30岁以下者189人,占30.6%;30至45岁203人,占32.9%;45岁以上的177人,占28.9%;未填年龄的48人,占7.8%。性别分布:男性213人,占34.5%;女性367人,占59.5%;未填性别者37人,占6%。学历分布:初中及以下者60人,占9.7%;高中及中专129人,占20.9%;大专124人,占20.1%;大学本科及以上者281人,占45.5%;未填者23人,占3.7%。
1.2 问卷设计
职业紧张评估调查,以KARASEK’s[3,4]工作内容问卷(JCQ)为基础,参照THEORELL[5]设计的简明工作紧张问卷,结合我国职业人群特点与资深职业卫生专家建议,形成24个条目的简明JDC问卷,其中评估工作要求(Demand)由“我对工作要求非常认真”等6个条目组成。自控(支配)程度(Control)包括自我控制力与工作技能二个子项。自我控制力,包括“我有决定我的工作应该如何做的自由”等4个条目;工作技能(Skill)由“我的工作要求我学习新的知识与技术”等6个条目组成。社会支持(Social Support)包括“我的主管重视我的意见”等8个条目。内部一致性评估Cronbach’sα值为0.80。所有条目答案均采用李氏5级赋值法设定。问卷同时收集相关的个体特征年龄、性别、受教育程度、职业与工作描述等信息。
1.3 统计分析方法
将JDC问卷所有条目均完成(缺一不可)者纳入分析,以保证结果的真实性。对JDC模式各评估因子均分,运用单因素方差分析法进行不同年龄组、性别、受教育程度、职业间的比较。运用四格表与行×列表的χ2检验与非条件Logistic回归分析职业紧张程度的影响因素。所有资料均使用EPI软件建立数据库,进行资料的录入;运用SPSS 11.5软件包完成分析,α=0.05。
2 结果
2.1 不同个体特征间JDC模式评定各因子均分比较
不同年龄组间、受教育程度与职业间,JDC模式中各评估因子均分方差分析比较,差异均有统计学意义。工作要求以低年龄组高学历的教师为高,自主程度得分以年龄30~45岁组、大学本科以上学历、工作要求决定自主技能得分均显著低于其它两个年龄组,而社会支持高于30岁以下年龄组。不同性别间JDC模式中各评估因子均分差异均无统计学意义(见表1)。
2.2 不同个体特征间职业紧张程度分级比较
依据KARASEK的JDC模式理论,根据工作要求均分与自主性均分的比值对职业紧张程度进行分级,工作自主性得分为工作决定自主与工作技能均分的均值,如果比值大于1则职业紧张程度高,反之为低。结果显示:不同年龄组、性别、受教育程度间均未显现统计学意义。而不同职业间统计学差异显著,科研与管理人员职业紧张程度高的比例为36.5%,教师为56.3%,而物业管理员工为50.4%;所有调查对象的职业紧张程度高者为50.2%。
2.3 个体特征对职业紧张程度影响的非条件Logistic回归分析
为控制多因素间的相互影响,引入多因素非条件Logistic回归分析。以职业紧张程度为应变量,紧张程度高为1,低为0;而个体特征变量为自变量。对多分类变量,引入哑变量进行分析。结果显示:不同年龄组、性别与受教育程度间对应变量的贡献无统计学意义。而3种不同职业间差异明显。以科研与行政管理人员为对照,教师组与物业员工组OR值分别为2.69(1.618~4.454)与2.30(1.156~4.566),均有统计学意义。
3 讨论
引用KARASEK设计工作内容调查表来评估职工的职业紧张程度,虽然国际上自20世纪70年代问世以来,得到广泛使用,但国内运用的报道少见,这可能与其为专利问卷而影响到其推广使用。而工作内容调查表是基于JDC模式理论而设计,其对职业紧张程度的评定比较简便。同时由于工作要求-自控(或支配)模式理论在探讨职业紧张程度与健康的关系中,国外进行了大量研究,尤其是在职业紧张程度与心脑血管疾病的关系方面[6],它也是目前在“职业紧张与健康”研究领域中被广泛使用的评估工具。
研究人群选择科研与行政管理人员、中学教师与物业服务员工3种不同职业人群,是基于其劳动类型考虑的,科研与行政管理人员以脑力劳动为主,物业管理员工以体力劳动为主,而中学教师是介于两者之间,其工作中既包括脑力劳动又包括体力劳动。
职业紧张JDC模式各因子得分在不同年龄组、受教育程度与职业类型间比较均显现统计学意义,而男女不同性别间这些因子得分均未显现统计学意义。可以认为年龄、受教育程度、职业类型间职业紧张因子得分差异明显,而不同性别职业紧张因子的得分是一致的。
JDC模式理论是根据“工作要求与自控(支配)力”均分比值来分级,比值≥1评定为职业紧张程度高,分析结果显示不同年龄组间、不同性别间、受教育程度间差异均无统计学意义,而3种不同职业间比较差异有统计学意义。无论是单因素分析还是多因素分析均得到一致结果。说明3种不同职业间其职业紧张程度变化较大。中学教师与物业员工群体的职业紧张程度高的比例明显高于科研与行政管理人员。科研与行政管理人员在本研究中评定其职业紧张度低,可能与公众认识不一致,这与JDC模式的理论假设有关。因为其职业活动中工作自主程度较高。根据JDC模式理论,工作自主性高同时工作要求也高的职业被定为主动性职业,职业紧张程度不评定为高[7]。
从研究人群整体来看,3种职业人群的职业紧张程度高的比例达到50.2%,需要得到职业卫生专业人员及整个社会关注。
参考文献:
钱令嘉.加强我国职业应激研究[J].中华劳动卫生与职业病杂志,2003,21(1):1-2.
CARL Z. Occupational Medicine[M]. 3rd ed. St. Louis:Year Book Inc,1994:945.
KARASEK R A. Job demands,job decision latitude,and mental strain:implications for job redesign[J]. Admin Sci Q,1979,24:285-308.
KARASEK R A,THEORELL T. Health work:Stress,Productivity,and the Reconstruction of Working Life[M]. New York:Basic Book,1990.
THEORELL T,KARASEK R A. Current issues relating to psychosocial job strain and cardiovascular disease research[J]. J Occup Health Psychol,1996,1:9-26.
BACQUER D,PELFRENE E,CLAYS E,et al. Perceived job stress and incidence of coronary events:3-year follow-up of the Belgian Job Stress Project cohort[J]. Am J Epidemiol,2005,161(5):434-441.
戴俊明,傅华.职业紧张评估方法研究进展[J].环境与职业医学,2006,23(3):278-281.
在开展生物医学研究时,研究者通过正确地运用统计学知识,可直接影响研究的质量。统计学设计的任务在于对研究的部署、实施,直到研究结果的解释进行系统的安排,力争做到以最少的人力、物力获得可靠的结论和信息。其目的在于确定某种处理是否会表现出某种特定的效应。在实验设计时应遵循惟一差异原则,即在进行两组比较时,两者之间仅有因处理因素不同而引起的差异,而其他实验条件相关的非处理因素都应保持等同。然而,处理组与对照组在反应上表现出的差别并不一定意味着是处理的结果。另有两种引起差别的可能性,即偏倚和偶然性。偏倚是指系统性差别,它不是因组间在处理上的不同所引起。生物医学实验中统计学设计和分析的目标就是消除潜在的偏倚,减少偶然性[2]。
1.1实验的偏倚和控制
偏倚是在研究中从设计到实验实施和结果分析的各环节存在一些人为的、有系统倾向的非随机误差,它不是由于抽样造成的,而是某种偏性使得实验结果偏离它的真值。从所选择的生物医学问题到研究方案的制订与实施、实验的完成过程、实验的分析与解释,乃至实验结果的发表,均可能存在各式各样的偏倚[2]。这种偏倚常常表现为系统误差。偏倚的大小取决于研究的方法和具体的实验条件。常见的偏倚主要有选择性偏倚、观察性偏倚和混杂性偏倚。必须认识实验过程的偏倚,从实验设计起直到整个研究过程结束均要加以控制。正确的实验设计可控制选择性的偏倚,事前人为控制和采取相应的措施可避免和减少观察性的偏倚。对于混杂性偏倚,可将重要的混杂因素在设计阶段进行分层随机设计,使混杂因素在组间分布均衡;在统计分析阶段将混杂因素作为分层因素或采用有协变量分析方法,以消除混杂因素的影响。只有有效地控制或消除偏倚,方可减少结果的假阳性或假阴性。
1.2减少偶然性的潜在影响
偶然性因素的作用可以减少,但不能完全排除。因为即使是在精心实施的研究中,接受同样处理的动物,其反应也不可能完全一样。适当的统计分析可使实验人员评估出现假阳性的概率,即根本不存在处理效应的情况下观察到差异的概率。这种概率越小,实验者发现真实效应的可能性就越大。为了更有把握地检测出真实效应,有必要减少偶然性的作用,并通过实验设计确保能在“噪声”之上识别真正的“信号”。
1.3实验设计的要素
要消除生物医学实验中潜在的偏倚,减少偶然性,就应对实验对象、处理因素和实验效应这三个实验设计要素,按照对照、重复、随机化和均衡四项原则进行周到的设计与控制[3]。1.3.1实验对象实验中处理因素所作用的对象称为实验对象。不同性质的实验研究需要选取不同种类的实验对象,一个完整的实验设计中所需实验对象的总数称为样本含量。生物医学试验中考虑动物实验对象时应关注以下几个方面:①动物种属的选择:选择实验动物的种属与品系时,尤其需要注意其背景反应的水平。为了将反应“信号”水平最大化,常常意味着应避免选择那些背景反应水平极低的动物种属或品系,但如果采用过度反应的动物种属或品系也同样会出现问题。动物物种选择中的其他问题,无论是实际问题(寿命、体型、易得性、对动物学特征的了解情况)或是理论问题(生化、生理或解剖结构与人的相似性),都需要从专业的角度认真加以考虑和权衡。②动物的数量:虽然从统计设计角度考虑可得出某项实验所需的动物数(样本含量),但所得出的数值往往很大。因此,虽然样本含量估计是保证结论可靠性(精度和检验效能)的前提,但基于实验的可操作性及经济原则方面的考虑,应结合统计学的计算结果与以往的生物医学研究经验予以确定。③动物的体重与年龄:为确保实验对象的同质性,实验中所使用的动物体重与年龄应尽可能相近;动物体重的标准差不应超出平均值的10%;啮齿类等小动物年龄相差不应超出1周,大动物年龄相差不应超出1个月。④动物的分层:为了准确检测一种处理因素引起的差别,各处理组在可能影响实验结果的其他非处理因素方面应尽可能具有同质性。当存在动物亚系间的差别时,有两种方法可得到更为准确的结论。一是在结果分析阶段将亚系作为一个“分层变量”处理,包括对两个亚系的结果进行单独分析,然后将结果综合,得出处理效应的总结论;二是将亚系作为实验设计的“区组因素”,这种情况下可使对照组与处理组中每个亚系动物数量相等。除以上所讨论的“亚系”之外,其他的非处理因素,如性别、窝别、体重段等也可作为分层变量进行局部控制,并据此进行分层随机化分组。1.3.2处理因素设计实验研究时,要明确研究中的处理因素和影响实验效应的非处理因素。研究者希望通过对研究设计进行有计划的安排,从而能科学地考察其效应大小的因素称为处理因素或实验因素;研究者往往忽略对评价实验因素作用大小有一定干扰的重要的非处理因素或非实验因素(如动物的窝别、体重等);其他未加控制的许多因素的综合作用统称为实验误差。实验结果是处理因素和非处理因素共同作用而产生的实验效应,因此如何控制和排除非处理因素的干扰,正确显示处理的效应,是实验设计的基本任务。1.3.3实验效应实验效应是处理因素作用于受试对象的反应和结果,是反映实验因素作用强弱的标志,它通过观察指标(统计学常将指标称为变量)来体现。如果指标选择不当,未能准确反映处理因素的作用,获得的研究结果就缺乏科学性,因此选择好观察指标是关系整个研究成败的重要环节。指标的观察应避免带有偏性或偏倚,要结合专业知识,尽可能多地选用客观性强的指标,在仪器和试剂允许的条件下,应尽可能多选用特异性强、灵敏度高、准确可靠的客观指标。对一些半客观(如尿液pH试纸读数值)或主观指标(行为测量、病理观察),一定要事先规定读取数值的严格标准,只有这样才能准确地分析实验结果,从而提高实验结果的可信度。
1.4实验设计的原则
为了防止结果的偏倚,保证实验结果的准确性和最大化的表达,在进行生物医学实验设计时必须遵循统计学设计的对照、重复、随机化和均衡四个基本原则。生物医学实验中对照组的设置必须具备三个条件:①对等原则,即惟一差别原则,除处理因素外,对照组具备与实验组对等的非处理因素。在相互比较的各组间,除了给予的处理因素不同外,其他方面应与实验组具有一致性,如相同的实验单位来源(动物种属、体重等)和相同的实验条件、操作方式和喂养环境等。②同步原则,对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。③专设原则,任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往结果或其他研究资料作为本研究之对照。
1.5生物医学中常用的实验设计类型
如果需要在同一实验中同时评价几种不同的效应,实验者应该安排能区别各自效应差别的实验设计方法。生物医学中常用的实验设计有以下几项。1.5.1完全随机设计完全随机设计是生物医学动物实验中最为常用的一种实验设计方法,它是一种单因素有k个水平(k≥2)组的实验设计。即实验设计可设置一个对照或多个剂量组的实验方案。本设计保证每个实验动物都有相同机会接受任何一种处理,而不受实验人员主观倾向的影响。本设计应用了重复和随机化两个原则,因此能使实验结果受非处理因素的影响基本一致,真实反映出实验的处理效应。1.5.2随机区组设计随机化完全区组设计,简称随机区组设计,又称配伍组设计,是配对设计的扩展,它将几个条件相同的受试者划分在同一个区组或配伍组,然后再按随机的原则,将同一配伍组的受试者随机分配到各实验组。该设计方法的优点是每个区组内的k个实验单位有较好的同质性,比完全随机设计更容易察觉处理间的差别。这种方法须特别注意的是要求区组内实验单位数与处理数相同,实验结果中若有缺失值,统计分析将损失部分信息。1.5.3拉丁方设计拉丁方设计从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组,是比随机区组设计多一个区组因素的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行区组数=直列区组数=实验处理的重复数。1.5.4析因设计析因实验设计又称全因子实验设计,属于多因素、多水平单效应的设计。它不仅可以检验每一因素各水平之间的效应差异,而且可以检验各因素之间的交互作用。交互作用是指一个因素不同水平间的效应差受另一因素的影响,包括协同交互作用和拮抗交互作用。析因实验主要用于分析交互作用,当因素及水平数过多时,所需的实验对象数、处理组数和实验次数大幅度增加,故一般采用较简单的析因实验。含有较多因素和水平的实验一般采用正交实验设计[5]。
2生物医学动物实验的描述统计学
2.1生物医学实验资料的类型
生物医学实验对实验对象(动物)进行干预后测定的观测指标通常有以下类型:①连续性数据:测定结果表现为有数字大小和单位的数据,统计上称定量资料,如生理、生化指标,体重值,器官重量等。②分类数据:测定结果表现为按某属性划分的定性类别,统计上称为定性资料,具体又可以分为二值资料、多值名义资料和多值有序资料。如某反应为出现或不出现,死亡或未死亡,有畸形或无畸形;病理损害的严重程度(无、轻度、中度、重度)等。
2.2统计描述指标
描述性统计学(或归纳统计学)是对样本观察/测量数据频率分布的定量研究,描述性统计的目的在于:①对测量值或观察值进行归纳浓缩,用统计量、统计图或统计表的形式表现;②估计总体分布的参数。2.2.1资料的整理与探索对于某一测量指标,一般应从文献资料中了解其分布类型。如果没有判断概率分布的理论基础,应重复以大样本测定,绘制样本的频数分布图(理论上样本量要大于100),并经统计学检验拟合其分布。2.2.2数据的描述统计量①连续性数据的频数分布:通过对样本资料编制频数分布表或做茎叶图,以确定资料分布的类型、频数分布的集中趋势和离散趋势、估计总体参数,也便于发现离群值。②中心位置的描述统计量:描述数据分布的集中趋势,常用指标为算术均数、中位数、众数、几何均数等。③离散程度的描述统计量:描述数据分布的离散趋势,常用指标为标准差和方差、极差和四分位数间距、变异系数和离散系数等。④统计学图表:统计图包括连续性数据分布的直方图、茎叶图,表示数据中心位置和离散程度的点杆图(做图时表示均数和标准差)和盒须图(做图时表示中位数、极差、四分位数间距),描述构成比数据资料的百分条图、饼图,描述经时变化趋势的线图,以及预测和检验分布类型的概率-概率图(P-P图)等[6]。统计表具有简单、明了、易于理解、便于比较的优点。编制统计表时原则上应当重点突出、层次分明、避免层次过多或结构混乱。一般的统计表应为三线表,表中只有横线,无竖线和斜线。统计表的标目应层次清楚,不宜过于复杂。
3生物医学动物实验的假设检验
生物医学动物实验中最常见的情况是给予不同受试物后进行组间比较,通过统计学中的假设检验,说明受试物的作用。假设检验时应注意以下问题。
3.1检验方法的选用依据
3.1.1资料的类型和变量的数目不同类型的资料(定量、定性)的组间比较应采用不同的统计检验方法。单变量、多变量的统计检验方法也各不相同。3.1.2实验设计类型应该根据实验设计的具体类型选择对应的统计检验方法,以便得到处理组效应的真实结论。3.1.3检验方法的前提条件选用假设检验方法前,应了解所分析的数据资料是否满足相应检验方法的前提条件,如t检验和方差分析等参数检验方法要求数据满足正态性和方差齐性,χ2检验要求样本含量大于40且理论频数大于5。
3.2正态性检验及拟合优度检验
统计学假设检验须判定样本的频数分布是否符合某一理论分布,如符合要求就可按此理论分布来进行统计学处理。对正态分布可采用正态性检验,其他分布可用拟合优度检验。通常可通过查阅文献,了解实验参数符合何种理论分布。
3.3方差齐性检验
连续性数据未达到参数法统计分析前提的第二种原因即为方差不齐。一般而言,数值愈大,其固有的变异性也愈大。例如,若某组动物的平均反应值为100,其数值范围可能为80~120;而另一组动物的平均反应值为300,其数值范围可能会扩大至240~360。解决方差不齐的措施是进行数据转换。若数据的标准差与平均值成正比,在统计分析前宜将数据转换为对数值之后再进行分析,据此,不仅数据的变异度与平均值大小无关,同时还可确保其更符合正态分布。若数据变异度增加幅度与平均值的关系不太明显,采用平方根转换则更易使数据的变异度与平均值大小无关。某些数据经对数或平方根转换后可能仍存在方差不齐,此时宜采用非参数检验。
3.4单侧检验与双侧检验
检验假设选择单侧检验或双侧检验,应事先根据专业知识做出选择。一般而言,若研究目的仅须了解是否存在组间差异、实验者无法预测组间变化的方向以及实验者希望获得正负两方面的结果时,应采用双侧检验。若事先可预测组间差异的变化方向,实验者仅对某一方面的重要性感兴趣,实验者仅希望了解与对照组差异或正或负一个方向,则应采用单侧检验。此外,剂量设计预试验中应采用双侧检验,正式试验在了解相关信息后可采用单侧检验。
3.5多重比较及多重性问题
生物医学实验经常在处理组和对照组之间做多个变量的比较。即使不存在真正的实验效应,也有可能纯粹由于偶然性而有一个或多个变量在5%检验水平出现显著性差别。除了上述均数多重比较导致Ⅰ类错误概率增加的多重性问题之外,其他的多重性问题还包括多次的中期分析、关注多个结局、亚组间的多重比较。处理多重性问题的原则包括:①预先计划进行多重比较;②限制比较的次数;③多重比较时采用更严格的界值标准;④多重比较具有生物学方面的依据。
3.6观察值或实验对象的独立性
许多统计检验方法要求比较的观察值或实验对象相互独立,如二项分布的率检验、t检验和方差分析等。但是,有的生物医学实验中观察单位并不独立。例如,生殖和发育研究中就存在窝效应:由于遗传因素、宫内的发育环境和药物的代谢环境相似,与异窝胎仔相比,同窝胎仔之间对毒性效应的反应概率趋于系统,即同窝内数据为聚集性数据,这就是一种常见的非独立数据。在统计学分析时,忽略数据的窝内相关性具有潜在的风险;因同窝母鼠所产k个胎仔的观察值存在共性,其所提供的信息不及k个独立的来自不同母鼠所产胎仔所提供的信息;窝内相关性愈大,其信息量愈少。聚集性数据的均数标准误小于独立的数据,因此,若基于观察值独立的统计分析方法,就会增加犯Ⅰ类错误的概率,即假阳性的风险增加,降低实验的有效性。
3.7历史对照数据的应用
某些情况下,尤其是在发生率较低的情况下,单项研究可能提示处理可影响肿瘤发生率,但无法得出明确的结论。可能想到的分析办法之一是将处理组的数据与来自其他研究的对照组动物相比较。虽然历史对照数据具有重要意义,但值得强调的是,众多原因可导致不同研究之间的变异度大于研究之内的变异度。动物来源、饲料及饲养条件,研究期限,研究中的动物死亡率、读片的病理学家等均可能影响最终的肿瘤发生率。故此,忽视这些差异,将处理组的肿瘤发生率与合并的对照组发生率相比较,可能得出严重错误的结果,并进而明显夸大统计显著性水平。Tarone[4]曾对历史对照组的比率数据分析进行过综述。
3.8假设检验的局限性
摘 要:目的:为了了解大学生成人依恋在家庭类型和生源地上的差异现状,为大学生心理健康提供依据。方法:采用大学生成人依恋量表,随机抽取198名大学生进行调查。结果:从家庭类型自变量上看,大学生成人依恋在焦虑维度上的得分,有统计学意义上的差异(p0.05)。从生源地自变量上看,大学生成人依恋4个维度上的得分,没有统计学意义上的差异(p>0.05)。结论:大学生成人依恋在家庭类型方面有一定的差异。
关键词:大学生;成人依恋;家庭类型
前言
成人依恋是指成人对其童年早期依恋经验的回忆和再现,以及当前对童年依恋经验的评价[1]。大学生良好的成人依恋是安全型,安全型依恋的大学生在和亲友相处中,对接近和亲密感到舒服的程度较大以及大学生生活中感到在需要别人帮助时,能有效依恋他人的程度也较大,而生活中担心被别人不喜欢或者不接受及担心被别人抛弃的程度也较小。大学生的早期依恋经验在成长过程中和父母的互动没用改善的话,成人依恋会影响大学生的交往效能感和生活满意度等心理品质。故成人依恋的研究对大学生心理健康的发展很有必要,为了解大学生成人依恋在家庭类型和生源地上的差异现状,调查研究情况如下。
一、对象与方法
(一)对象 随机抽取198名大学生进行调查,获得有效样本198份,有效回收率100%。其中,家庭类型:独生子女家庭有27人,非独生子女家庭有171人;生源地:来自城市的大学生有30人,来自农村的大学生有168人。调查时间为2014年10月。
(二)方法 采用自行设计调查表,调查基本情况,包括班级职务和学历。采用2003年吴薇利编制的成人依恋量表[1],该量表是自评量表,共18个项目,采用五点自评,从“1”完全不符合到“5”完全符合。该量表含4个维度,分别为亲近、依赖、亲近依赖复合维度及焦虑维度。该量表信度和效度良好[2]。并事后做相应访谈。
(三)统计学处理 采用SPSS17.0统计软件进行描述统计分析和独立样本t检验。
1.结果
(1)不同家庭类型、生源地大学生成人依恋差异比较(表1)
表1所示,从家庭类型自变量上看,大学生成人依恋在焦虑维度上的得分,有统计学意义上的差异(p0.05)。从生源地自变量上看,大学生成人依恋亲近、依赖、亲近依赖复合与焦虑4个维度上的得分,没有统计学意义上的差异(p>0.05)。
二、讨论
1.大学生成人依恋家庭类型方面分析
研究发现,独生子女家庭的大学生成人依恋焦虑维度上的得分,显著高于非独生子女大学生;亲近、依赖与亲近依赖复合维度上的得分,没有显著差异。结合事后访谈发现,独生子女大学生生活在父母亲友宠爱较多的环境中,很多事情父母有父母代办或者包办,也没用和兄弟姐妹相处的体验和经验,个性较强与人相处中个人主义较大,更多的关注自我,当他们进入大学后,远离了父母,在寝室关系中和室友相处较难,他们发现以前在家时的相处办法行不通了,同伴不像父母那样宠爱自己了,和同伴相处需要关注对方的感受和需求了,特别是独生子女遇到独生子女时,他们相处和交流更难,生活和学习中遭遇到的拒绝和碰避较多,独生子女就会更多的担心被同学和朋友不接受和不喜欢,甚至担心被亲朋抛弃;而非独生子女则成长过程中相对较独立,有和兄弟姐妹相处的经验,能更多的关注交往对象的感受和需求。故独生子女家庭的大学生成人依恋焦虑维度上的得分,显著高于非独生子女大学生。
2.大学生成人依恋生源地方面分析
研究发现,不同生源地大学生成人依恋在亲近、依赖、亲近依赖复合与焦虑维度上的得分,没有显著差异。访谈中发现,不同生源地的大学生已经很好的融入了城镇生活,原因可能为,其一,大学生适应能力较强,接受新事物的能力也较快,当他们经过几年的大学生活,他们很快适应了城镇生活。其二,国家城镇化进程较快,有些地区实施土地承包,农民从土地中分化出来,这样城乡差距缩小了,相应的随着科技发展,电灯及电话和网络都发展到农村,交流互动便利了,不同生源地的考生差距也减小了。其三,城乡交流较多,人口流动较大,现在社会,很多农村人进城务工,大多数的城市建设有农民工的劳动贡献,有些农民工长期居住在城市工作,为城市建设出力,也有很多城市人到农村参观考察,体验乡土风情,城乡的差距在减小。其四,很多大学生节假日也到城市工厂做工,也是城镇建设中的一员,和社会发展的推动者和促进者。城乡的融合及大学生主动进步发展,故不同生源地大学生成人依恋在亲近、依赖、亲近依赖复合与焦虑维度上的得分,没有显著差异。
(作者单位:新乡学院教育科学系)
参考文献: