美章网 资料文库 论中医研究中数理统计的运用范文

论中医研究中数理统计的运用范文

本站小编为你精心准备了论中医研究中数理统计的运用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

论中医研究中数理统计的运用

聚类分析是以“物以类聚”为原则的一种统计方法,用数学的方法研究和处理给定对象分类的一种多元统计方法。曲淼等[2]使用该方法对105例抑郁症病人的临床资料进行分析,结论是:聚类分析发现心胆气虚、气虚血瘀、心肾不交、脾肾两亏、肾虚肝郁、气郁化火6个证候涵盖了抑郁症的大部分证候。结构方程模型是一种运用统计中的假设检验对有关现象的内在结构理论进行分析的一种统计方法。

其特点是可证实所假设的先验关系成立与否;可将隐变量和直接测量变量一并考虑;可对变量测量误差及方差做出估计。谢世平等[3]使用结构方程模型从1303例HIV/AIDS病例的45个辨证相关指标中提取了6个潜变量(因子),分别对应于中医的6个证型:痰热蕴肺、肺脾气虚、湿热内蕴、湿热蕴毒、气阴两虚、邪结皮肤,代表着HIV/AIDS的常见临床证型。用于研究HIV/AIDS中医症状、证候及其相互关系。结果是:列出了各证型的主症及次症,显示了各个证型的特征;合理解释了HIV/AIDS的中医证候分型和诊断规律。隐结构模型法是一种基于数据本身的特征、从各种角度对人群进行多维划分的方法,其反映的是蕴含在数据中的规律,具有较强的客观性和定量性。赵燕[4]研究了104例抑郁症病人的临床资料,将100个显变量参与隐结构模型构建,寻到隐变量34个,分为79个隐类,得出结果是抑郁症主要体现的病位类证候要素有:肝、心、胆、脾、胃、肾;主要体现的病性类证候要素有:气滞、气虚、湿、阳虚、痰、火。因子分析即用少数几个公因子去描述许多指标或因素之间的联系的方法。李得民等[5]采用该方法对112例超早期脑梗死患者的临床资料进行研究,结果显示:超早期脑梗死中医证候可分为4类,分别为气虚血瘀证、热结腑实证、肝肾阴虚证、风痰阻络证。在一定程度上揭示了超早期脑梗死中医证型特点。

其各自的局限性在于:聚类结果具有不确定性,且存在聚类的单分配问题,比较适合应用于单一疾病的证候分类。结构方程模型拟合指数的估计的方法决定其要求有较大的样本量,且需要专业知识与数理知识的紧密结合。既使结构方程模型的数据能很好的拟合,也不代表模型完全正确,只能说明不拒绝该假设模型。王利敏等[6]研究2807例亚健康病人的临床资料,构建结构方程模型,在反复拟合之下,排除了肝火证下重要意义的变量,对全面分析亚健康状态的中医证候有一定的影响。在使用无监督数据分析方法时,一定要深入理解各方法运用的理论基础及应用条件,多种方法联合使用,可一定程度上减弱其局限性的影响。

粗糙集理论是处理不精确,不一致,不完整等各种不完备信息的一种新型的有效的数学工具,主要应用于研究不完整数据、不确定知识的表达、学习及归纳。该理论数学基础成熟,不需要提供问题所需处理集合之外的任何先验知识,避免了专家的主观经验。而且该理论与处理其他不确定问题的理论有很强的互补性。吴昊[7]认为,中医诊断实际上也是一种知识模型,它是把机体看成黑箱,直接找出输入、输出的关系。这些关系不是凭空臆造,而是从大量的实践总结出来,能反映一定的客观规律性,在实践中行之有效,其存在的缺点就是缺乏对黑箱的具体分析。而粗糙集理论则是这种黑箱系统的有利分析工具,它利用临床症状进行辨证,从中抽取出确定与可能的规则。粗糙集理论同时也存在一定的局限性未得到很好的解决:1)粗糙集理论中对错误判断的决定性机制非常简单。因此,由粗糙集产生的决策规则很不稳定而且有较差的分类精确性;[8]2)约简的有效计算问题。如何处理数据中的噪音和丢失值问题,连续属性离散化等仍未找到令人满意的方法;3)粗糙集理论所处理的分类必须是完全正确或肯定的,因而它的分类是精确的,只考虑完全“包含”与“不包含”而没有某种程度上的“包含”与“属于”,不能处理模糊分类的问题。[9]4)粗糙集理论只有和专业判断结合才有实际意义。郭建文等[10]采用粗糙集方法研究4077例脑卒中病“阴阳类证”患者的临床资料,得出在粗糙集分析中,健忘与阴虚、火热、气虚的诊断相关,但从中医专业判断来说,健忘跟火热、阴虚、气虚都无必然联系,对证候判断的意义均很有限。要想更好的应用粗糙集理论,要得到精确的决策规则,必须把粗糙集理论和其他数据挖掘方法结合起来。王璐[11]在对基于粗糙集理论的属性约简方法的研究基础上,通过比较分析现有的属性约简算法,提出了一种基于属性作用集差异度的属性约简算法,经过数据集上的实验和测试比较表明所提出的方法是有效的。该方法不仅能得到较小的约简子集,而且在执行效率上具有很大的优势。

模糊数学是研究和处理模糊性现象的一种数学理论和方法。它引用了模糊矩阵复合运算方法,首先对各单项参数进行评价,然后考虑各项参数在总体中的地位,配以适当的权重,再用模糊概念进行推理,经过模糊矩阵复合运算,得出综合评价结果。中医学理论体系普遍存在着的模糊概念,导致了“只能意会,不可言传”等问题的存在,模糊数学的出现,使得这类概念的量化成为可能。谢杰[12]应用模糊数学方法对78例绝经后骨质疏松患者的证型进行研究,得到了PMOP患者诸症证型总体的病情情况,并构建了一个较好的PMOP证型诊断的模糊模式识别数学模型。其局限性在于:模糊集的隶属函数多数是凭经验给出的,带有明显的主观性,在确定分类组数和分类原则时,需要人为引进判别参数和分类标准临界值,在数学理论和实际应用上显得不够严谨,并且不能同时考虑到各个指标对分类的影响权重。[13]目前除了采取联合运用其他数理统计方法外,还未有其他有效的解决方法。

人工神经网络是一种将整体论与还原分析方法有机结合的研究复杂系统的方法,能够有效处理复杂系统中杂乱无章的海量数据,并能够在海量数据中寻找模式及规律,归纳隐含的逻辑关系,发现多个信息单元之间相互关联规则,同时还能从数据的分析研究中进行学科发展预测性研究,因而在中医证候研究领域有着广阔的应用前景。[14]许朝霞等[15]将支持向量机方法和人工神经网络进行比较,将2种方法应用于对心血管疾病的中医临床信息和证候类别之间的关系的分析上,建立模型,观察其证候预测的准确性。得出结果是:经过比较,对于心气虚、心阳虚、心阴虚、痰浊、气滞、血瘀等心血管疾病常见中医证型,OCON网络的识别准确率最高,均在60%以上,其中心气虚和心阳虚证分别高达92.4%82.9%。

作为一种非参数模型,人工神经网络的一切信息只来自于训练集,其训练的结果也就更加不稳定,极容易产生泛化问题,出现过拟合(过学习过训练)的现象,降低泛化能力。通过正则化技术,剪枝技术,逐步构造技术及早期停止技术等可在一定程度上减弱神经网络的泛化问题。[16]一些数理统计方法如卡方检验,频数法等为大家所熟知,因此不在赘述。还有一些数理统计方法,如非负矩阵分解法,多维尺度分析法,复杂系统熵堆积,基于树模型的分类算法研究,由于观点较新,论述文献较少,还需要进行继续研究和探讨。马克思说过:“一种科学只有成功的运用数学时,才算达到了真正完善的地步。”因此,应将多种数理统计方法结合起来,尽快为中医证候研究提供更为适宜的科学方法。(本文作者:杨爽、刘恩顺、孙增涛单位:天津中医药大学、天津中医药大学第二附属医院)