本站小编为你精心准备了网络搜索论文:网教资源环境搜索模板透析参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
作者:马骧飞刘淑丽孙滨单位:郑州华信学院信息工程系郑州华信学院图书馆
语义检索体系结构
本文提出的基于Ontology的网络教育资源语义检索模型的体系结构采用B/S模式的MVC架构:数据存储层、业务处理控制层和表示层。体系结构如图2所示。其中存储层包括教育资源Ontology、教育资源及元数据描述信息,应用索引组件索引元数据描述信息而生成的索引库以及利用标注技术生成的语义元数据信息;业务处理层包含语义标注、语义分析、语义推理和语义查询组件;表示层主要处理的工作是提供用户多种查询接口,以及处理查询结果集合的结果呈现接口。
关键技术研究
1教育资源
Ontology构建建立领域Ontology是一个复杂的过程,涉及到该领域的相关概念以及概念与概念之间的关系。爱丁堡大学开发的EnterpriseOntoloyg由一组关于企业的术语和定义组成,主要用于企业模拟。
2教育资源
Ontology的形式化本文使用OWL形式化描述教育资源Ontology,它主要应用OWL定义的表达式对提取出的概念术语及其关系进行形式化描述。教育资源Ontology利用Protégé4.0.2工具构建完成,完成后的Ontology以OWL文件格式存储。下面将介绍使用Protégé4.0.2建设教育资源Ontology的过程。
2.1概念类的形式化
在Protégé4.0.2中,所有用户定义的类都是缺省的OWL:Thing的子类,而领域内相关的根类只需要给出简单的类声明就可以了。如在教育资源Ontology中“学科”类和“教育资源类型”类中的定义如下:类的最基本的构造器是subClassOf,如在描述案例是教育资源类型的一个子类时可以这样描述:此外,为了对某些重要的概念进行说明时,可以使用OWL语言提供的注解标签〈rdfs:label〉来标记对应概念的内容信息,示例代码可表示如下:现代教育技术是指在现代教育思想、现代教育理论的指导下对教育资源、教育过程进行开发设计、评价、运用、以实现对教育教学的优化。上述代码定义了“信息技术教育”概念类,它是“学科”概念的子类,此外,使用标签〈rdfs:label〉对“信息技术教育”进行了解释说明。
2.2类属性的形式化
OWL语言提供了两种类型的属性表达,一种是数据类型(DataType)的属性主要是使用XMLSchemaDataType所定义的简单类型完成,这些简单的数据类型包括char、string、int、float、datetime、boolean等。如下述代码对“关键字”、“持续时间”及“费用”的定义:对象类型的属性主要用来说明类成员属性是有复杂的对象组成。如下面代码表达了“数学”是适合开设“微积分”的“适用学科”。其中“微积分”表示为“代数”学科的一个实例。
2.3实例的形式化
实例的生成是通过声明它是某个类的成员来表达,比如“程序设计”作为“计算机科学”学科的重要“课程”的实例,可以用如下代码表示:
2.4教育资源Ontology的确认和评价
教育资源Ontology构建的正确性取决于基于它开发的系统的正确性和有效性,目前Ontology的正确性的核查还没有统一的方法,常用的检查Ontology正确性的方法是使用推理机软件来核查。例如在使用Protégé工具中集成的推理机Racer来核查教育资源Ontology中定义的两个类:“音频”和“图像”。这两个类在意义上是不相交的,使用OWL语言中的owl:disjointWith关系来描述概念类的不相交关系,代码片段如下:在建设Ontology时,如果不小心把本属于“音频”类的“让我们荡起双桨”(MP3格式)作为实例添加到“视频录像”中,那么在构建信息检索系统时可能会查出不符合用户要求,给系统的推理带来一定的安全隐患。因此,当教育资源Ontology构建完成时,利用推理机,可以很容易发现一些不一致的问题,快速的对构建的Ontology进行维护。
3语义标注技术
元数据是信息共享交换的基础和前提,它通过构成自身的元素来显式地表示资源信息或者帮助提供获取某种信息资源的途径。元数据的主要作用在于识别资源、评判资源,追踪资源在使用中的变化,从而实现高效地管理海量的网络资源数据信息。语义标注是指在Ontology的指导下映射教育资源的元数据。首先通过解析教育资源Ontology,然后有系统提示标注者填写需要标注的内容,系统把这些标注的元数据资源信息映射成Ontology库中的实例,最后系统保存带有标注信息的教育资源元数据RDF文档并存储到数据库中。语义标注涉及到的主要技术包括读取和解析Ontology技术Jena及Ontology查询语言SPARQL。
SPARQL通过调用QueryExecutionFactory.create(query,model)获取该实例。对应较为简单的Select查询,可以调用execSelect()方法返回查询结果集ResultSet。如下给出了查询示例代码:上述示例中,变量path是Ontology文件存储路径,变量express是查询的关键字,而变量queryExpress是构造的查询规则,FILTER则是对查询关键字进行过滤,支持模糊查询。
4语义检索策略
对于检索系统来讲,一个好的检索策略,既使用何种检索方式准确把握用户的检索需求,对领域知识和事实数据信息进行深层次地推理,提高资源检索“查全率”和“查准率”具有举足轻重作用。当前资源检索系统查全率、查准率差的原因主要包括有两个:1)用户需求表达不充分,机器不能理解其真正需求;2)检索系统对检索条件机械匹配,不能进行语义分析和自动扩展。因此提高检索质量可以从两个方面入手:
1)参照Ontology中的概念关系对检索式进行优化,利用教育资源Ontology中的语义关系将用户的检索条件映射成为Ontology的概念和关系,从而实现用户需求和机器理解的一致。
2)利用教育资源Ontology中的概念关系对用户检索的概念进行扩展,当系统中没有满足检索条件的结果时,根据教育资源Ontology中的概念相关程度对检索式中的概念适当进行扩展,形成新的检索概念集,而后再重新查找。
系统原型实现
作为试验系统,我们以教育资源领域中的教学资源为研究对象,首先针对教育资源元数据信息进行组织,建立数据模型。其次,基于Ontology对教育资源元数据进行映射,生成教育资源语义元数据库;第三,设计索引组件,对资源元数据信息建立索引,生成索引库;最后,设计语义分析和查询组件,实现系统的检索功能。由于教育资源Ontology构建和语义标注在前面部分作了说明,这里重点介绍索引组件、语义分析组件和语义查询组件。例如条件检索将该请求转化成逻辑表达式。在实验的原型系统中,用户的条件检索表达式最终由系统转化成对RDF图的交、并、补的操作,如图3所示。
结语
本文研究了Ontology的构建,将其应用到教育资源建设,通过构建教育资源Ontology,可以为网络教育资源提供语义表示机制。在教育资源Ontology驱动之下,提出一个语义检索模型,用于支持知识共享、语义匹配的网络教育资源检索系统的开发,以期解决资源检索中语义匹配问题,提高检索质量和效率。