本站小编为你精心准备了数理方法在中医辨证学中的应用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《湖南中医》2017年第4期
摘要:以统计学方法的聚类分析,数据挖掘技术的决策树、关联规则、粗糙集、判别分析等数理方法为例,对其在中医辨证学中的应用进行总结、分析;查阅、整理相关文献,将部分学者对其在中医辨证学中的应用进行回顾;结合中医传统理论及其数理思想和方法,发现其在中医学辨证中有一定的适用性,也存在一定的问题。
关键词:聚类分析;决策树;关联规则;粗糙集;判别分析;中医辨证;应用分析
1可行性分析及应用现状
1.1聚类分析
在中医辨证客观化、标准化的研究中,聚类分析多用于中医证候的分类,在方法学上为中医学的辨证论治提供量化分型依据。聚类分析是一种动态分类的方法,可以把相似的事物归入合适的类别,使同类中的事物尽可能的相似(组内同质性),而类与类之间保持显著差异(组间异质性)。中医辨证即通过把同种病机引起的一系列证候群归纳为一种证型(组内同质性),而证型与证型之间有着显著差异(组间异质性)。因聚类分析属于探索性研究,结果可以提供多个可能的“解”,故在辨证运用中其“解”需结合中医传统理论进行判断分析。纵观文献可知,多数学者认为聚类分析的研究方法与中医学的辨证思维殊途同归,有异曲同工之妙,在中医数理辨证研究中属较成熟的方法之一,结合运用的相关研究较多。
唐雪勇运用聚类分析对白癜风的中医辨证分型规律进行了研究。该研究选取符合纳入标准的200例白癜风患者,首先回顾研究总结出古今医家对对白癜风中医辨证认识的15个证型,结合文献和征询专家意见制定调查表,并通过专业人员进行录入,后应用SPSS16.0软件对所采集的资料进行处理。聚类结果示,白癜风辨证证型可分为:气血不和、肝肾不足、脾胃虚弱、湿热内蕴、气滞血瘀5型,其中前两型最为常见。姜楠对代谢综合征的中医辨证分型进行了聚类分析研究。首先对期刊文献进行检索,按照相关标准对文献证型进行规范,进行频数频率统计,对统计结果进行筛选。将筛选结果进行聚类分析,结果示当聚类为7类时效果较好,且作者认为结果符合临床实际,初步建立了代谢综合征的中医辨证分型。又如,周迪夷运用SPSS13.0卡方检验、SAS8.2统计软件进行系统聚类分析,对临床收集的131例2型糖尿病患者进行中医辨证分型,结果归纳出了2型糖尿病的7个证候类型及糖尿病肾病的7个证候类型。运用聚类分析方法对中医辨证分型研究有较多报道,在此不一一赘述。
1.2决策树
决策树是一种归纳推理算法,采用树枝状来展现数据受各变量影响情形的预测模型,能利用树形图的分割自动确认和评估分割。数据分类是决策树解决的核心问题,根据数据的不同属性归为不同类别。中医辨证论治着眼于证,辨证的过程即为对同种病机引起的症状和体征的病理阶段的辨析,其证候信息数据复杂多样,多为定性的变量数据,决策树具有能够处理大量变量信息、得出比较精确分类、简单明确、处理不完整数据等优点。故运用决策树技术可以将症状和体征与证候(证型)之间的关系进行辨析。徐蕾[4]将406例慢性胃炎患者的调查资料中的88项指标进行了决策树分析。以该88项指标建立数据库,建立以信息熵减少为特征的决策树分类模型,采用决策树C4.5算法。结果筛选出对慢性胃炎辨证有意义的26个变量信息,建立辨证模型,结果示各类模型的灵敏度和特异度较高。有学者对杨志敏教授治疗失眠阳虚型的两个方剂运用决策树技术进行了同症异治辨证思路研究。选取符合纳入标准的病例,收集患者的四诊信息、人口学特征等相关资料。根据资料录入数据,采用SPSS18.0统计分析软件及Clementine12.0进行数据分析,决策树模型选用C&Rtree算法,将有统计学差异的特征进入模型,从中选取相关因素和诊断规则。10层交叉验证模型识别正确率为74.59%。最后归纳出两方的共性适应证,禁忌症的辨证思路。余学杰运用决策树对中医专家辨证的规律进行了提取探析,首先选取803位患者,对其证候信息剔除重复后提取103种证候信息,进行决策树运算分析,结果得出9中证名与证候的规则。
1.3关联规则分析
关联规则用于发现数据中变量间的关系,是最常用的数据挖掘技术之一。关联规则中有两个重要参数:支持度和可信度,该技术其目的就是挖掘出事物内在之间满足一定支持度和置信度的关联现象。面向中医辨证的关联规则,大多数中医学者通过应用该方法对中医的症状、体征之间进行关联,从而客观把握中医的“证”,使其客观与标准,从而达到精准辨证提高临床疗效。如,陈绩锐对480例小儿肺炎的症状、体征进行关联规则运算,从而得出不同证型之间的病机差异和辨证要点,继而对基于关联规则技术的小儿肺炎辨证规律进行了研究。唐伟将临床234例胃脘痛患者进行宏观分为6型,将宏观分型与胃黏膜的微观表现相结合,运用数据挖掘方法,分析探讨二者的相关性。通过胃镜等现代检查手段结合数据挖掘技术,使其客观的把握胃脘痛的辨证特点。刘智认为基于支持度-置信度的关联规则算法,考虑到数据的时间因素以及规则前件与后件的相关问题时,该算法并不是很有效。提出一种新的关联规则框架:时间支持度-时效匹配度,并应用该方法对冠心病舌象、舌质、发病诱因等18个方面与26中冠心病中医证型之间的中医辨证规律进行了研究。黄文金运用“证候-证素-证名”的辨证新新体系结合关联规则数据挖掘对《中医儿科学》教材中辨证分型数据进行运算分析,得出证素之间、证素与症候之间的关联关联规则。结论得出关联规则是挖掘中医儿科学教材辨证诊断经验行之有效的方法。
1.4粗糙集
粗糙集是一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集能在保持相对高质量分类能力的基础上,尽量消除不必要的信息得到较小属性集合,有较好的分类能力。辨证论治是中医学的精髓,辨证的准确与否直接决定施治的效果,辨证不统一最主要原因是医生的主观因素和患者症状的不确定性。针对中医辨证认识的不统一性,粗糙集技术理论有自身的优势,值得在中医辨证数据处理中应用。晏峻峰将粗糙集理论应用于中医证素辨证中,通过阐述粗糙集的思想及在证素辨证中应用所出现的问题和解决办法,结果发现两者有相适应性,从而指出粗糙集理论在中医证素辨证研究中值得进一步深入。孙继佳采用粗糙集与支持向量机结合对293例中医肝硬化患者的症状、体征信息进行统计运算。结果显示该方法辨证平均正确率高于70%,尤其采用粗糙集约减后辨证的准确率为84.4%左右。董国华等运用粗糙集合神经网络技术对哮喘的中医辨证分型进行了研究,并把该项研究命名为粗糙神经网络模型,其结构为:输入→粗糙集处理→神经网络模型→输出,结果示该结合方法准确率较高,优于单纯一种方法。
1.5判别分析
判别分析又称为“分辨法”,顾名思义该技术与中医学的辨证法有着一定联系。判别分析就是研究判断个体所属类型的一种多元统计方法,是一种统计判别和分组技术,就一定数量样本的一个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量信息所属的样本进行判别分组。这种技术与中医辨证有着相似性,故可结合应用。赵宝利收集类风湿性关节炎患者资料436例,按照纳入标准进行证候分类,湿热痹阻型、肝肾两虚型、寒热错杂型各占29.59%、47.93%、22.48%。采用SPSS11.0软件包,逐步判别分析用Analyze-Classify-Discriminant选择逐步向前最大似然估计模块。筛选出13个变量信息是有统计学意义,予变量赋值后发现理论判别与实际资料具有较高的总吻合率,研究中所得到的判别模型与临床实际基本符合。唐旭东将34例再生障碍性贫血患者用统计学方法筛选出53项免疫学指标,对研究对象进行辨证分型,以判别分析方法建立再障辨证分型的判别方程。结果筛选出与再障中医辨证分型最有意义的5个免疫学指标,与再生障碍性贫血免疫学发病机制有密切的关系,说明再障中医辨证分型存在的物质基础。黄小波等对慢性疲劳综合征的中医证型进行了判别分析,结果示慢性疲劳综合征中医证型判别函数与临床实际较为符合,从而指出判别分型能够提高该病的中医辨证分型,应用前景较好。
2问题和展望
由上述可知,以上数理方法在中医学辨证中具备一定的可行性且有了一定层次的研究。辨证论治是中医的精髓,证是中医学所特有的概念,是对疾病某一阶段机体整体反应状态所做的病理概括,一般由一组相对固定的、有内在联系的、能揭示疾病某一阶段或某一类型病变本质的症状和体征构成,同一症状、体征可以出现在同一疾病的不同证型之中。另外,依据中医学的恒动观,辨证过程中应充分考虑证候的时相性和空间性特征,而以上数理方法运用于中医学辨证中都未顾及中医辨证的恒动观念。紧扣中医学辨证论治的传统思维,分析以上几种数理方法的思想,不难发要使两者有较好的适配性,还存在很多问题有待改善。
基于聚类分析的数学和计算机原理,其为得到合理的分类,必须使用适当的指标来定量地描述研究对象的间质性。因聚类分析属定量描述,而中医四诊信息属性为不定量或变量,故聚类分析在中医辨证中具有一定的局限性。根据中医辨证论治思想,同一四诊信息可隶属于不同的证型,而聚类分析过程中,对于这种变量信息计算机不能智能识别,该四诊信息只能出现在一个证型中,这样既有别于中医的辨证思维,又不能够对证型之间进行完全区别;又如,决策树分析过程中,中医四诊信息纳入模型后不能进行灵活的剔除,不能对变量信息进行灵活的选择,分类能力一般,需对分类结果进行修剪,若修剪不当会造成结果的不准确性,容易产生较大误差;再者,关联规则可产生的是症状、体征之间的关联以及各个规则的强度,但对于分类、预测能力均较差。因此该方法适于用来抽取规则帮助理解中医证候内涵,对中医的辨证分型有一定的不适应性,若需应用于辨证还需要专业知识进行分析,带有主观色彩。又如,纵观上述文献发现,基于粗糙集技术的中医辨证学研究尚处于起步阶段,因粗糙集自身的局限性,在中医辨证中应用也多是多种方法相结合;最后,判别分析是已知某事物有几类,从各类中取一样本并设计出标准,从而在样本中都按该标准分类,这种分辨方法需要较强的中医专业知识制定其各型的标准,才能有较高的准确性,同时也带有主观色彩。由上所知,上述数理方法在中医辨证中的应用都有自身的优势和不足。整体来说,数理方法在中医辨证学中的应用尚属摸索阶段,尚未有相应标准去验证其辨证的科学性、精确性,这也是还未被同行业普遍认同的原因之一。在中医辨证走向客观化、标准化道路上,要不断加强中医传统理论的学习,使其占主导地位,将数据为其所用;改善数理方法运算的局限性,依据中医辨证的思维方法设计开发新的计算机软件。只有建立以中医传统理论为主导地位,信息数据和运算软件为中医理论所用的发展模式,才能使中医客观化辨证这条路走的更远。
参考文献
[1]唐雪勇,杨志波,王建湘.白癜风聚类分析的中医辨证分型规律研究[J].湖南中医药大学学报,2012,32(1):72-74.
[2]姜楠,石岩.代谢综合征中医辨证分型的聚类研究[J].光明中医,2009,24(1):1-2.
[3]周迪夷.2型糖尿病中医分期辨证研究[D].北京:北京中医药大学,2010.
[4]徐蕾,贺佳,孟虹,等.基于信息熵的决策树在慢性胃炎中医辨证中的应用[J].第二军医大学学报,2004,25(9):1019-1012.
[5]杨志敏,原嘉民,黄春华,等.基于决策树阳虚型失眠症同证异治方辨证思路研究[J].时珍国医国药,2013,24(5):1219-1220.
[6]余学杰,李书珍,李晓燕,等.基于决策树提取中医专家辨证规律初探[J].辽宁中医杂志,2015,42(1):19-24.
[7]陈绩锐.基于关联规则的小儿肺炎辨证规律研究[D].南宁:广西中医药大学,2014.
[8]唐伟,周正光,王欢欢.胃脘痛中医辨证与胃镜表现的关联规则分析[J].中国中西医结合杂志,2013,33(3):303-306.
[9]刘智.关联规则挖掘方法在冠心病中医诊疗中的应用研究[D].大连:大连海事大学,2012.
[10]黄文金,姚明龙,叶云金,等.关联规则在中医儿科学证素诊断中的应用[J].中医药临床杂志,2015,27(3):329-331.
[11]晏峻峰,朱文峰.粗糙集理论在中医证素辨证研究中的应用[J].中国中医基础医学杂志,2006,12(2):90-93.
[12]孙继佳,苏式兵,陆奕宇,等.基于粗糙集与支持向量机的中医辨证数据挖掘方法研究[J].数理易学杂志,2010,23(3):261-265.
[13]董国华,朱莉乐,李璟健,等.粗糙集结合神经网络的哮喘辨证分型法[J].计算机与数字工程,2015,43(9):1622-1626.
[14]赵宝利,黄可儿,赵敏.类风湿性关节炎中医辨证分型的判别分析[J].中华中医药杂志,2012,27(1):240-242.
[15]唐旭东,麻柔,刘锋,等.再生障碍性贫血中医辨证分型的客观量化与临床意义[J].中华中医药杂志,2008,23(9):780-783.
[16]黄小波,李宗信,陈文强,等.慢性疲劳综合征中医证型判别分析[J].中国中医药信息杂志,2006,13(6):21-22.
[17]孙广仁.中医基础理论[M].北京:中国中医药出版社,2008:18-19.
作者:王志威;艾军;陈升;钟妮;李钢磊 单位:广西中医药大学基础医学院