美章网 精品范文 医学统计学论文范文

医学统计学论文范文

前言:我们精心挑选了数篇优质医学统计学论文文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

医学统计学论文

第1篇

在各种医学期刊中,半数以上是疗效观察方面的论著。现择其较普遍存在的统计学问题,结合实验设计基本原则加以讨论。

(一)对照与均衡性测定

国内医学期刊有关临床疗效观察的文章甚多,不少杂志刊登了一些事先未设计对照的文章,其结论难以令人信服。如《用柴葛解肌汤治疗上呼吸感染》一文,报道治愈好转率为97.7%,因无对照,无法断定其效果如何,因此,治愈好转率中含有假像。

对照的方法虽有多种,但对照的基本原则是与实验组齐同可比,最好作均衡性测定。

(二)安慰剂与盲法试验

安慰剂与盲法试验是医研(主要是比较性研究)中常用的科研方法,结果准确、误差性小。安慰剂在形、量、色、味等要与实验药物一样,不能给受试者和执行者任何暗示。这种试验就是双盲法试验。但近年来,尚有人用改良的双盲法,此法分两期:第一期(公开期)试验有效者留,无效者弃。有效者进入第二期(双盲试验),以确定疗效是否系安慰剂的作用。在预防效果观察时可采用该法,临床上应用诸多困难,应视具体情况而定。

(三)样本含量与重复原则

没有足够样本的研究结果,是经不起重复试验的,有的论文凭少数病例观实的结果下结论,是不慎重的。如《重症肺炎并发DIC29例》一文,作者观察脑型患者3例,其中死亡一例,就得出“一般脑型病死率高达57%,本组脑型病死率较低,看来及早用肝素阻断DIC过程,对降低脑型病死率可能具有重要意义”的结论。因无对照,结论不可靠。

(四)随机分组与实验设计类型

随机化分组即每个实验对象有同等机会被抽样(分配)到各组去,而不受任何系统因素的影响。常用的实验设计类型有完全随机设计、自身对照设计、交义设计、配偶设计、随机区组设计、拉丁方设计、正文(析因)设计、序贯设计、半数效量实验设计(动物试验),回顾性与前赡性调查研究设计等。科研设计时应根据研究目的要求选择不同类型的实验设计方法,进行相应的统计处理。

第2篇

概率分布(probabilitydistribution)是医学统计学中多种统计分析方法的理论基础。授课内容一般包括:二项分布、Possion分布、正态分布、t分布、F分布等。

借助概率分布常常可以帮助我们了解生命指标的特征、医学现象的发生规律等等。例如,临床检验中计量实验室指标的参考值范围就是依据正态分布和t分布的原理计算得到;许多医学试验的“阳性”结果服从二项分布,因此它被广泛用于化学毒性的生物鉴定、样本中某疾病阳性率的区间估计等;而一定人群中诸如遗传缺陷、癌症等发病率很低的非传染性疾病患病数或死亡数的分布,单位面积(或容积)内细菌数的分布等都服从Poisson分布,我们就可以借助Poisson分布的原理定量地对上述现象进行研究。

在生物信息学中概率分布也有一定应用。例如,Poisson分布可以用于基因(蛋白质)序列的相似性分析。被研究者广泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速将研究者提交的蛋白质(或DNA)数据与公开数据库进行相似性序列比对。对于序列a和b,BLAST发现的高得分匹配区称为HSPs。而HSP得分超过阈值t的概率P(H(a,b)>t)可以依据Poisson分布的性质计算得到。

二、假设检验

假设检验(hypothesis)是医学统计学中统计推断部分的重要内容。假设检验根据反证法和小概率原理,首先依据资料性质和所需解决的问题,建立检验假设;在假设该检验假设成立的前提下,采用适当的检验方法,根据样本算得相应的检验统计量;最后,依据概率分布的特点和算得的检验统计量的大小来判断是否支持所建立的检验假设,进而推断总体上该假设是否成立。其基本方法包括:u检验、t检验、方差分析(ANOVA)和非参数检验方法。

假设检验为医学研究提供了一种很好的由样本推断总体的方法。例如,随机抽取某市一定年龄段中100名儿童,将其平均身高(样本均数)与该年龄段儿童应有的标准平均身高(总体均数)做u检验,其检验结果可以帮助我们推断出该市该年龄段儿童身高是否与标准身高一致,为了解该市该年龄段儿童的生长发育水平提供参考。又如,医学中常常可以采用t检验、秩和检验比较两种药物的疗效有无差别;用2检验比较不同治疗方法的有效率是否相同等等。

这些假设检验的方法在生物实验资料的分析前期应用较多,但由于研究目的和资料性质不同,一般会对某些方法进行适当调整和结合。

例如,基于基因芯片实验数据寻找差异表达基因的问题。基因芯片(genechip)是近年来实验分子生物学的技术突破之一,它允许研究者在一次实验中获得成千上万条基因在设定实验条件下的表达数据。为了从这海量的数据中寻找有意义的信息,在对基因表达数据进行分析的过程中,找到那些在若干实验组中表达水平有明显差异的基因是比较基础和前期的方法。这些基因常常被称为“差异表达基因”,或者“显著性基因”。如果将不同实验条件下某条基因表达水平的重复测量数据看作一个样本,寻找差异表达基因的问题其实就可以采用假设检验方法加以解决。

如果表达数据服从正态分布,可以采用t-检验(或者方差分析)比较两样本(或多样本)平均表达水平的差异。

但是,由于表达数据很难满足正态性假定,目前常用的方法基于非参数检验的思想,并对其进行了改进。该方法分为两步:首先,选择一个统计量对基因排秩,用秩代替表达值本身;其次,为排秩统计量选择一个判别值,在其之上的值判定为差异显著。常用的排秩统计量有:任一特定基因在重复序列中表达水平M值的均值;考虑到基因在不同序列上变异程度的统计量,其中,s是M的标准差;以及用经验Bayes方法修正后的t-统计量:,修正值a由M的方差s2的均数和标准差估计得到。三、一些高级统计方法在基因研究中的应用

(一)聚类分析

聚类分析(clusteringanalysis)是按照“物以类聚”的原则,根据聚类对象的某些性质与特征,运用统计分析的方法,将聚类对象比较相似或相近的归并为同一类。使得各类内的差异相对较小,类与类间的差异相对较大1。聚类分析作为一种探索性的统计分析方法,其基本内容包括:相似性度量方法、系统聚类法(HierarchicalClustering)、K-means聚类法、SOM方法等。

聚类分析可以帮助我们解决医学中诸如:人的体型分类,某种疾病从发生、发展到治愈不同阶段的划分,青少年生长发育分期的确定等问题。

近年来随着基因表达谱数据的不断积累,聚类分析已成为发掘基因信息的有效工具。在基因表达研究中,一项主要的任务是从基因表达数据中识别出基因的共同表达模式,由此将基因分成不同的种类,以便更为深入地了解其生物功能及关联性。这种探索完全未知的数据特征的方法就是聚类分析,生物信息学中又称为无监督的分析(UnsupervisedAnalysis)。常用方法是利用基因表达数据对基因(样本)进行聚类,将具有相同表达模式的基因(样本)聚为一类,根据聚类结果通过已知基因(样本)的功能去认识那些未知功能的基因。对于基因表达数据而言,系统聚类法易于使用、应用广泛,其结果——系统树图能提供一个可视化的数据结构,直观具体,便于理解。而在几种相似性的计算方法中,平均联接法(AverageLinkageClustering)一般能给出较为合理的聚类结果2。

(二)判别分析

判别分析(discriminantanalysis)是根据观测到的某些指标的数据对所研究的对象建立判别函数,并进行分类的一种多元统计分析方法。它与聚类分析都是研究分类问题,所不同的是判别分析是在已知分类的前提下,判定观察对象的归属3。其基本方法包括:Fisher线性判别(FLD)、最邻近分类法(k-NearestNeighborClassifiers)、分类树算法(ClassificationTreeAlgorithm),人工神经网络(ANNs)和支持向量机(SVMs)。

判别分析常用于临床辅助鉴别诊断,计量诊断学就是以判别分析为主要基础迅速发展起来的一门科学。如临床医生根据患者的主诉、体征及检查结果作出诊断;根据各种症状的严重程度预测病人的预后或进行某些治疗方法的疗效评估;以及流行病学中某些疾病的早期预报,环境污染程度的坚定及环保措施、劳保措施的效果评估等。

在生物信息学针对基因的研究工作中,由于借助了精确的生物实验,研究者通常能得到基因(样本)的准确分类,如,基因的功能类、样本归结于疾病(正常)状态等等。当利用了这些分类信息时,就可以采用判别分析的方法对基因进行分类,生物信息学中又称为有监督的分析(SupervisedAnalysis)。例如,基因表达数据分析中,对于已经过滤的基因,前三种方法的应用较为简单。而支持向量机(SVMs)和人工神经网络(ANNs)是两种较新,但很有应用前景的方法。

(三)相关分析

相关分析(correlationanalysis)是医学统计学中研究两变量间关系的重要方法。它借助相关系数来衡量两变量之间的关系是否存在、关系的强弱,以及相互影响的方向。其基本内容包括:线性相关系数、秩相关系数、相关系数的检验、典型相关分析等。

我们常常可以借助相关分析判断研究者所感兴趣的两个医学现象之间是否存在联系。例如,采用秩相关分析我们发现某种食物中黄曲霉毒素相对含量与肝癌死亡率间存在正相关关系;采用线性相关方法发现中年女性体重与血压之间具有非常密切的正相关关系等等。

生物信息学中可以利用相关分析建立基因调控网络。如果将两个不同的基因在不同实验条件下的表达看作是两个变量,相关分析所研究的正是两者之间的调控关系。如采用线性相关系数进行两基因关系的分析时,其大小反应了基因调控关系的强弱,符号则反应了两基因是协同关系(相关系数为正),还是抑制关系(相关系数为负)。

四、意义

生物信息学不仅是医学统计学的研究前沿,更是医学研究由宏观向微观拓展的重要领域,其研究内容已逐渐为多数医学院校的学员了解和熟悉。而如何对新技术产生的生物实验数据进行准确合理的分析,却成为生物信息学研究的主要瓶颈之一。

在医学统计学课堂教学中引入生物信息学实例,而不仅仅局限于常见的医学、卫生领域的例子,将难以理解的统计理论和方法与前沿的生物实例相结合,拓宽了学员的视野,提高了学员的学习兴趣,更可以加深对所学知识的理解;与此同时,使学员掌握了生物实验数据的先进分析方法,扩大了学员的知识面,提高了他们今后开展医学科研工作的能力。

第3篇

 

医学统计学的教学应以提高研究生解决实际科研问题的能力为目标,使研究生形成正确的和严谨的统计学思维方法和技能,帮助医学研究生在今后的科研工作中正确运用医学统计学方法,顺利完成研究生学业以及将来在工作中的科研任务。然而,笔者在教学实践中发现有一些需要改进的问题。

 

一、研究生医学统计学教学中遇到的主要问题

 

(一)研究生统计学基础知识较为薄弱

 

虽然大部分学生在大学本科期间学习过统计学,但多数人仅学习过较简单的统计学基础知识,进入研究生阶段医学统计学学习后,学习比较吃力,并且由于总学时数的限制,教师在理论课的教学中对单个统计学方法的使用讲解较多,而对一些研究生在完成学位论文期间或将来毕业后较为实用的统计学方法却没有时间讲解,这就造成了研究生对学过的统计学方法一知半解,而将来可能用得上的统计学方法却没有学会。笔者在解答一些已经毕业参加工作的研究生的问题时,发现有些问题十分基础,本应该在研究生学习阶段掌握而没有掌握。

 

(二)课题设计统计学缺陷较常见

 

目前,国内大部分高校研究生医学统计学课程一般安排在研一上学期,而研究生应用统计学知识进行课题设计要到研究生二年级才启动。许多研究生在课堂学习阶段对统计学知识本来就没有彻底学透,又要再经过一年多才进入课题设计有实验研究,对学习过的统计学知识已经有一些遗忘,所以在进行课题设计时不能正确运用学过的相关知识,造成课题设计中有较多的统计学缺陷。而课题设计如果不正确,无法保证后续的研究结果的科学性和可信性。

 

(三)学位论文统计学错误普遍存在

 

国内外期刊对论文中的统计学方法要求都很高,因此研究生的科研论文需要正确运用统计学知识对研究数据进行分析、整理。但与此形成鲜明对比的是,很多研究生不能把学习过的统计学知识正确运用到研究论文中。尤其是学习临床专业的医学研究生,很多研究资料和数据来源于人群研究,涉及样本量、对照组的选择等基本的统计学常识,这些基础性错误却在研究生的论文中大量存在。这些问题与现在对高素质人才的培养已经不相适应,需要加以改进。

 

二、对策与建议

 

(一)强化课堂教学,巩固医学统计学知识基础

 

巩固基本统计方法和知识是医学统计学的基础,通过课堂教学,使学生掌握基本的统计方法原理、计算过程和结果解释。在教学中既要注重基本原理和基本概念的讲解,使研究生切实掌握基本的统计学知识,在论文写作中不出现低级的统计学错误。在此基础上,老师在课堂上应该由简到繁,深入浅出,逐步增加难度和深度,讲解一些研究生在学习阶段和将来工作中有用的、较为高级的统计学方法。目前,科学技术更新速度很快,同样统计学的重要工具——统计软件也更新很快,因此,老师要及时更新自己的知识,并向学生介绍最新、最先进的统计方法和软件。

 

(二)注重学用衔接,提升研究生课题设计的科学性

 

研究生的课题设计是科学研究成败的关键之一,教师在教学过程中要向学生强调其重要性,让学生带着课题设计中的问题进入课程学习,让学生结合自己的专业,做好论文前期的准备工作,完成科研选题,为毕业论文开题做好准备。要指出课题设计中应当注意的统计学问题,如样本量、对照组选择等,使学生意识到统计学的基本知识是保证自己课题设计科学性的关键,在今后的课题设计中自觉以正确的统计学方法作为指导,从而保证课题设计的科学性,为其成长为高层次的医学科研人才打下良好的基础。

 

(三)采用实例分析,减少研究论文中的统计学错误

 

在课堂上以一些已经发表的高水平论文为例,详细讲解医学统计学方法的具体应用,使研究生在撰写论文时,减少论文中的统计学错误,减少文章因为统计学问题而被拒稿;教师在课堂上也可以用一些已经发表的、但是有明显统计学错误的论文作为反面教材,给学生进行分析、讲解,使学生从正反两个方面知道避免论文中的统计学错误的重要性。另外,要注意提醒学生,在数据处理和论文撰写过程中,运用统计学方法时要注意其使用条件,切不可误用,对审稿人指出的统计学错误要认真进行修改或答复。