美章网 资料文库 一体化医学语言构建范文

一体化医学语言构建范文

本站小编为你精心准备了一体化医学语言构建参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

一体化医学语言构建

1语义网络是构建概念相互关系的权威规则

UMLS语义网络是通过135种语义类型,为出现在UMLS超级叙词表中的所有概念提供一种目录组织结构。语义类型之间的51种连接关系为这种组织结构提供构架,并代表生物医学领域中的重要相互关系。语义网络为超级叙词表提供了指定给每一个概念至少一种语义类型的信息,同时语义类型也指定给情报源图谱中特定的数据库,以表达情报资源之间的内在联系。也就是说,语义网络是试图建立一种语义类型及其相互关系的权威规则,用以标引每一个超级叙词概念,或表达概念之间可能存在的相互关系。语义网络的这种权威规则,既在文字上,也从等级关系或非等级关系上界定语义类型及其相互间可能存在的关系与内在涵义。

2构思新颖的语义类型等级结构

UMLS语义网络设计了135种语义类型,这些语义类型的高层分为“物”和“事”两大类,并由此层层展开形成“树形结构”。由全部语义类型形成的等级结构中,每一语义类型除有一个树状等级号之外,还被赋予一个语义类型代码,如〈T071〉、〈T001〉等,这些代码并无实质上的含义。语义类型的等级结构的局部。

3语义关系“链”将语义类型连结成为语义网络

在UMLS语义网络中,语义类型可以看成是有层次结构的“节点”,而把这些节点连成网的连接,称为“链”(Link),“链”所表达的是语义类型之间的“关系”(Relationship)。

3•1isa关系链是语义网络中的基本等级链

UMLS语义网络中最常用的链是isa,它表达语义类型之间的等级关系。也就是说,如果一种语义类型与另一种语义类型之间是“isa”关系,则表示第一种语义类型在定义上比第二种语义类型更为专指。

3•2非等级关系链表达语义类型之间的多样性相关关系

除“isa”关系之外,其余50种语义关系是相关关系链(associated-with),它们包括:物理上相关(physically-related-to),空间上相关(spatially-related-to),功能上相关(functionally-related-to),时间上相关(temporally-related-to)和概念上相关(conceptully-related-to)五类(详见图3)。它们表示语义类型之间的非等级相关关系。语义网络为每一种语义关系设定一个定义,并规定它可链接的语义类型。例如,语义关系“影响”(affects)的定义是:对…产生一种直接的效果。意为对一种存在的条件、状态、环境或物的改变或影响,包括对…起作用、改变、影响,使易感染、催化、激发、调节、抑制、阻碍、增强、有助于…、致使、修订。从上例可见,对语义关系“affects”所下的定义包含了较为宽泛的语义范围,因而能够链接较多的语义类型节点,并分别表达语义类型之间的多样性相关关系。如[解剖学异常affects生物体]表达因解剖学异常对生物体产生的影响,[化学物质af-fects自然现象或过程]表达化学物质对自然现象或过程所产生的作用,[规章或法律affects机构]表达机构对规章或法律的影响或修订等等。

3•3语义关系的等级继承规则和继承阻断

在语义类型等级结构的高层节点之间的语义关系,在任何可能的情况下都是固定的,正如上例所列举的语义关系“影响”链接的这些高层语义类型节点。而且高层语义类型之间的语义关系,一般地可通过等级结构(isa链)继承给这些节点的所有子类。例如在上例中,语义关系affects可链接的语义类型节点,有一对是[解剖学异常affects生物体],这就是说,语义关系“影响”固定存在于“解剖学异常”和“生物体”之间,那么这种语义关系也存在于这两种语义类型的所有子类语义类型之间。其中“获得性异常”是“解剖学异常”的一个子类语义类型,那么“获得性异常”与“生物体”的所有子类语义类型之间都存在语义关系“影响”,例如:[获得性异常affects植物]、[获得性异常affects真菌]、[获得性异常af-fects细菌]、[获得性异常affects病毒]、[获得性异常affects动物]等等。又如,语义关系“…的进程”固定存在于“生物学功能”和“生物体”两种语义类型之间(根据语义关系“…的进程”的定义,它所表达的含义为:生物学功能是生物体的活动、功能或状态),那么,这种关系也存在于“器官或组织功能”和“动物”两种语义类型之间,因为在语义类型等级结构中它们分别是“生物学功能”和“生物体”的子类。也就是说,器官或组织功能也是动物的活动、功能或状态。在有些情况下,如果按照语义类型的等级结构及链的继承规则,会使语义类型与语义关系的连接产生歧义。例如,语义关系“…的进程”存在于语义类型“生物体功能”和“生物体”之间,“生物体功能”有一个子类是“心理功能”,而植物也是一种“生物体”,按照继承规则,心理过程也是一种“植物的活动、功能或状态”,显然,植物不可能有“心理过程”。于是,这种链不能继承。不能继承的链称为阻断(tobeblocked),其方法是只将语义关系界定在直接连接的两种语义关系之间,而使其子类不继承这种关系。

4语义网络使概念之间语义关系的准确细致表达成为可能

语义网络的51种语义关系虽然尚不能表达语义类型之间可能存在的一切关系,但是它比常规叙词表的“词树”所能表达的“属分”、“相关”关系要细致得多。以MeSH词(MedicalSub-jectHeadings,医学主题词)在语义网络中的表达为例,MeSH树状范畴表的若干部分,包括“解剖学”、“疾病”、“精神病学和生理学”的全部以及“生物科学”的一部分,都已标记为等级上下位形式的语义关系。语义网络中的“isa”关系和所有非等级关系的语义关系规则对于这些MeSH语义结构均有效。MeSH词之间所表达的链,除极少数例外,均在语义网络中得到反映。也就是说,如果两个MeSH词之间具有某种关系的话,那么就会采用标引给这两个MeSH的语义类型之间的一种链来表达这种关系。MeSH树状范围表所表达的MeSH上位词与下位词之间的关系,只是简单的较泛指与较专指关系。例如,MeSH“羊水”(Amnioticfluid)是MeSH“胚胎”(Embryo)的一个下位词:EmbryoA16•254AmnioticfluidA16•254•72在UMLS语义网络中,Embryo标引的语义类型是“胚胎结构”(Embryonicstructure),Am-nioticfluid标引的语义类型是“机体物质”(BodySubstance),语义关系标引的是“周围”(Sur-round)。所以“羊水”与“胚胎”之间的关系就被确切地表达为“胚胎结构周围的机体物质”。

5语义类型和语义关系标引规则在词汇控制中的灵活应用

综上所述,语义网络不仅设计了语义类型等级结构和语义类型之间可能存在的语义关系系统,而且对每一语义类型和每一种语义关系都给出了定义、注释和使用规则。它们是构成语义网络的多种要素,也是用于标引具体概念时可供遵循的权威规则。但这些规则在实际应用中需要根据实际情况灵活运用。

5•1语义类型标引的专指性原则

135种语义类型包含的范围是广泛的,可使多学科范围的概念词汇能纳入系统化语义类目结构。通常,指定给一个概念的语义类型,是在等级结构中最为专指的一种。但所谓最专指,只能说是尽可能最专指,因为所设语义类型的数目,不可能无限增加以穷尽一切最专指的概念。例如,语义类型“实质性物”之下有一个子树是“人造物”,在“人造物”之下只有两个子类,“医学仪器”和“研究仪器”,很显然,还有许多不属于这两个子类的人造物,那些既不属“医学仪器”,也不属“研究仪器”的人造物概念则全都给标引为泛指的语义类型“人造物”。这类似于常规分类法所采取的原则。

5•2语义关系标引时的概念个性原则

语义类型之间固定存在的语义关系并不意味着所有标引了这些类型的概念之间均存在有这种语义关系。例如语义关系“…的评价”存在于语义类型“症状”和“生物体属性”之间(根据语义关系“…的评价”的定义,它在这里表达的含义是:生物体的某些属性或过程的程度或值的评判)。但是并不是任何一种特定的症状与任何一种特定的属性之间都能用这种关系来连接。例如症状“超重”和“发热”分别是生物体属性“体重”和“体温”的评价,然而“超重”就不是“体温”的评价,“发热”也不是“体重”的评价。也就是说,语义关系规则只表达语义类型之间可能存在的语义关系,在用于标引个别概念时,须考虑到概念的含义。