本站小编为你精心准备了循证医学的移动诊疗技术研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
随着社会的发展和人类的进步,各种各样的疾病也随之而来。由于人们生活水平的提高和健康意识的增强,医疗卫生条件直接影响着人们的生活质量。然而看病难看病贵成为当前中国社会的第一难题,制约着我国的经济发展。目前在日常生活中,看病方式依旧以到医院门诊挂号问诊为主,这种传统的寻医问诊方式存在着缺点和不足。不仅看病过程不够便捷,而且流程也复杂繁琐。
当今医学理论的不断发展,在传统医学的基础上诞生了循证医学。循证医学是慎重、准确地以当前研究为依据,结合医生个人的经验,考虑病人价值和愿望,将三者结合制定出的治疗措施。另一方面,随着移动设备的普及和推广,移动应用的发展也越来越成熟。并且在中医领域进行移动智能诊疗的研究也相对缺乏,使得该方面的研究十分具有价值。综合以上因素,我们尝试将看病的过程智能化,以软件的形式实现便捷科学的诊断方法。笔者介绍了一种基于循证医学理论,以临床记录以及病症信息为诊断依据,经过信息抽取和文本分类两步,将相关数据压缩存储至移动设备,最终在移动端实现寻医诊断过程的智能软件系统。
1诊断过程的智能化
1.1传统诊断过程传统的看病诊断流程分为两大步。首先患者描述自己的症状,医生在了解病人的情况后,根据医学领域的辨症方法并结合自己的行医经验,再对病人的其他症状进行进一步的观测。在得到了足够的信息后,医生重点针对有识别性的症状进行病症的判定。在这个过程中,分为辨症和诊断两步。辨症的过程是从患者的临床表现中获取重要的症状信息,作为诊断的依据。诊断则是根据归纳的症状信息,以医学理论为基础,进行病症类别的判断,下定病症名。在设计智能诊疗系统的过程中,我们对辨症和诊断两步进行抽象模拟,分别对应于信息抽取和文本分类两步,见图1。最终在移动设备上实现寻医问诊的过程,完成智能诊断系统。
1.2信息抽取过程信息抽取是指将用户输入的非结构化的人类自然语言,转化为规范的文本信息,提供给系统进行信息识别所需的特征内容。由于用户在进行症状描述时,使用的是自然语言。自然语言的特点是文字中掺杂着许多冗余的上下文信息。程序在进行症状的识别时,需要从上下文内容中收集有关病症的描述信息。在完成了信息的抽取后,用户输入的自然语言描述分成了症状信息和上下文信息。
1.3文本分类过程文本分类是将提取出来的症状信息,用于病症名判定的过程。系统根据不同的症状集合,划分出不同的病症类别,得出诊断结果。不同的病症有自身的特点,表现出来的症状也不尽相同。通常一种疾病会呈现不同的症状,在诊断的过程中,需要结合多种症状因素进行病症类型的确认。
2模型文件的生成及存储工作
2.1隐马尔科夫模型信息抽取采用的方法是隐马尔科夫模型。隐马尔科夫模型是一种有监督的学习方法,从可观察的参数中确定该过程的隐含参数,应用于对内容的序列标注中,分为模型文件的训练和序列的解码。该模型的主要作用是进行序列标注,将用户输入的信息内容,通过模型的计算,得到文本单元对应的序列类标,再根据类标划分成症状信息和上下文信息。首先将用于症状识别的样本文件,经过隐马尔科夫模型计算,学习得到用于信息抽取的模型文件。此处使用的样本文件是带有类标的文本集,每个字词单元后面有一个对应的标签,表明该单元的属性成分。标签的种类分为三类,B代表症状信息的开始位置,I代表症状信息的中间内容,标签B和相邻的标签I组成了症状信息。O代表上下文单词,相邻的标签O组合对应的上下文信息。隐马尔科夫模型以提供的训练文本集为基础,经过学习得到用于症状识别的模型文件。模型文件主要包括初始状态矩阵、状态转移矩阵和符号发射矩阵三部分,反映了字词信息和类标之间的转换关系。
2.2最大熵模型在文本分类阶段,为了能根据不同症状诊断出不同的病症类别,需要计算出各种症状针对不同病症所占的权重,此处采用最大熵模型。最大熵模型指,当我们需要对一个随机事件的概率分布进行预测时,预测需要满足所有已知的条件,对未知的情况不做任何主观假设,保证了预测风险最小。最大熵模型确保在对症状发生的概率进行统计时,症状概率数据是可靠的。将用于文本分类的样本文件进行最大熵模型的计算,训练得到用于病症诊断的模型文件。此处的样本文件是以类标为首部,症状描述为内容的文本集。在进行最大熵模型的学习过程中,根据训练样本集中首部类标和对应的症状,计算出各个症状信息在不同病症类别下的权重值,并存储为模型文件。权重值的大小代表症状的重要程度。
2.3模型文件的存储信息抽取和文本分类两步产生的模型文件,将用于症状信息的抽取和病症类别的诊断中。在进行模型文件的训练时,由于样本数据集较大,而移动设备的处理能力有限,在模型生成过程中会占用大量的时间,造成长时间的等待。并且模型文件的生成与后续的抽取和分类是独立进行的,因此为了提高系统的运行效率,将模型文件的生成工作放在PC电脑上完成。把训练得到的隐马尔科夫模型和最大熵模型进行序列化,以字节流的形式保存成模型文件。导入两个模型文件至移动端文件系统中,在进行诊断时再将模型文件读取到系统内存中,与用户输入的信息一起处理。考虑到移动设备的存储空间以及系统运行内存的限制,在读取过大的文件时会导致效率低下,甚至造成内存溢出的问题。为了避免这种问题的发生,存储在移动设备的分类模型文件只保存常见的病症信息,既降低了文件大小,也满足了大部分的使用需求。当移动设备中的模型文件无法识别症状时,将输入的信息传递到PC端,通过服务器进行诊断,再将结果反馈到移动设备。
3信息抽取和文本分类在移动设备上的实现
3.1维特比算法解码过程从移动设备的文件系统中读取出模型文件的三个参数矩阵,使用维特比算法进行解码。解码的过程是将用户输入的信息内容进行序列标注,以字或词为单位,标注每一个单元对应的类别。维特比算法是一种动态规范算法,用于寻找可能产生的观测事件序列和隐含状态序列,计算出每个序列的状态标签。根据隐马尔科夫模型的三个参数,计算出输入内容相应序列的BIO标签类别。将标签组合成的症状信息提取出来作为辨证结果,用于病症的诊断。症状的信息抽取过程。
3.2病症的诊断以字节流形式读取出移动端系统中的最大熵模型文件,将信息抽取产生的症状信息转化成模型文件中对应的权重值。根据用户症状的权重,计算出该症状集合在不同病症下的概率值,将计算结果按概率值的大小进行排序,排名靠前或概率值大于指定阈值的病症即为该症状集下最可能的病症名。将筛选出的病症结果集展示到移动端,供用户参考。由于移动端的分类模型中只保存常见的病症信息,并不能满足所有症状的识别。当移动端系统无法识别时,系统将提示用户联网进行服务器诊断。服务器上的诊断与移动端方法相同,由于服务器上的病症信息更加完整,能够识别出更多类型的病症。实现离线移动端诊断和联网服务器端诊断相结合的两种模式,兼顾了使用的便捷性和诊断的准确性。
4结语
对在移动设备上的智能诊断系统进行了分析,介绍了使用自然语言处理方法的信息抽取和文本分类步骤。通过使用隐马尔科夫模型完成信息抽取,从用户输入的非结构化语言中提取出症状信息,再使用最大熵模型进行文本分类,将识别出的症状信息用于病症的诊断,得到可能的患病种类,给定病症名诊断结果。移动端的智能诊断应用改变了传统的看病方式,为用户提供了快速便捷的诊断环境。
作者:王琦琪 袁强 王亚强 文立玉 单位:成都信息工程学院 江西江坞稀有金属新材料有限公司