美章网 资料文库 元数据仓储知识库的几点认识范文

元数据仓储知识库的几点认识范文

本站小编为你精心准备了元数据仓储知识库的几点认识参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

元数据仓储知识库的几点认识

1元数据仓储知识库的构建

开发科技创新决策分析服务系统,其基础性的工作是构建元数据仓储知识库。从科技文献数据库种类来看,包括:科技期刊、学位论文、会议论文、标准、专利文献数据库及科技成果、企业产品、科研机构、科技名人等事实型数据库,从这些科技文献中,挖掘其相互逻辑关系、交叉融合间的沟通脉络是知识获取、知识组织的关键。结合科技文献资源的特性和文献检索导航需求分析,万方软件公司提出了基于“知识获取五要素”的知识组织方法【4】,将学科、主题、人物、机构、基金五要素作为知识获取的分析主题,构成二维空间,组成各个要素之间的相互关联关系。五要素之间的相互关联包含了多种科研信息,从各个角度,各个侧面都有无穷的知识可以去挖掘分析。比如:机构和学科关联,可以获得各个机构的研究学科,以及有哪些机构在研究该学科的分析结果;机构、学科和作者关联,可以获得某个学科在某个机构中有哪些人在做相关研究的分析结果等等。因此从知识的组织角度,在构建元数据仓储知识库时,以五要素知识元为基础,通过对海量科技文献的处理(采集、转换、清洗、质量检测)和对五要素的深度标引,最终构建基于五要素的元数据知识仓储,作为开发科技创新决策分析服务系统的基础。

2科技创新决策分析服务体系架构和功能设计

元数据仓储知识库的构建为科技创新决策分析服务提供了基础保障,在此基础上,运用数据挖掘技术、自动分类∕聚类技术、信息可视化等技术,开发基于WEB的科技创新决策分析服务系统。基于元数据仓储知识库的科技创新决策分析服务主要体现在对科技创新能力的定量评价。主要功能设计如下:⑴主题知识脉络分析。主要对主题关键词所代表的知识点或概念在各年度的研究发展趋势和研究热点进行分析。包括:该主题各年度发文总量趋势;该主题的相关关键词;关注该主题的相关人物、机构以及涉及该主题的重要发文期刊。系统可通过用户输入的主题关键词,在主题知识库中挖掘揭示主题相关的各类科研产出情况,并通过主题相关的创新实体分析,为用户推荐权威的研究机构和行业领域专家。⑵

科研人员科研能力评估分析。主要对科研人员(作者)科研产出情况进行统计分析。包括:科研人员的简介;与作者合作过的相关科技人员信息;作者的研究主题、研究方向、主要发文期刊及参与基金项目情况。系统可通过用户输入的科研人员姓名,在人物库中进行机构汇总,并经过用户筛选科研人员现在或历史所在机构,对作者的科研产出能力和科研绩效水平得出最全面和客观的评估和总结。⑶

论文引用情况分析。主要对被引用情况进行统计分析。包括:该论文被引论文具体信息(期刊、学位、会议、技术报告等)和比例、被引数量、被引用频次等。系统按用户输入的论文标题、作者、关键词进行检索,按发文时间、相关度、题名进行排序,从而可以对该论文进行学术质量的综合、定量的评价。该功能即可独立使用,也可嵌入在科研人员科研能力评估分析系统中使用。⑷机构创新能力评估。主要对机构的期刊论文、学位论文、会议论文、专利、成果及机构承担的国家基金项目进行统计分析,从而反映出机构的总体科学实力和科研绩效水平。系统可通过用户输入的机构名称,通过简称俗称的规范对应,按论文类别、基金类别等方式进行机构科研产出的揭示,得出机构的科研能力和学术定位。

3科技创新决策分析服务系统的应用

科技创新决策分析服务系统目前在科技文献共享服务平台中已开始应用,平台主要为用户提供了作者科研协作关系、主题知识脉络分析、机构科研能力评估三种服务。⑴作者科研协作关系。在作者科研协作关系服务中,可以分析出用户所关心作者的如下信息:①作者合作关系:通过可视化的与合作者的关系呈现,可以分析出作者在科研工作中与合作者的合作关系,节点间的距离越近,表明与合作者合作发表的论文次数越多,合作关系越紧密。②作者科研产出统计:可以统计出作者总体的数量。③作者研究主题和研究方向:可以分析出作者的研究主题和按学科分析的研究方向。④主要发文期刊:可以统计出作者在不同期刊的数量,获得作者关注的期刊情况。⑤作者简介:获得作者单位、职称、职务等基本信息。在知识脉络分析服务中,以用户输入的主题词为分析依据,通过可视化信息展示,分析出主题词所代表的知识点或概念在各年度的研究发展趋势和研究热点。并提供主题词所关联的相关词、相关人物、相关期刊和机构的知识脉络。

4结语

提供面向政府、企业、科研管理部门科技创新决策分析服务的作者科研协作关系分析、机构科研能力分析、主题知识脉络分析服务在一定程度上还需待进一步改进,其中主要是解决元数据仓储知识库的质量的问题。包括知识库中所整合的资源是否涵盖全面、资源的更新是否快捷、简称俗称的规范对应问题、不同分类法的对接等等问题,其二是提高用户分析的响应速度问题。影响响应速度的因素包括用户的网络环境、应用程序处理数据的效率、服务器与客户端的交互方式、元数据仓储库的部署等多方面,其中重点是解决海量元数据仓储库的部署问题。当前科技创新决策分析服务已在山西省科技文献共享服务平台对外试用【5】,并在征求广大用户的意见。随着决策分析服务系统的逐步完善,文献共享和服务平台不仅成为为科技创新提供文献保障的平台,也成为为科技创新提供辅助决策分析的知识服务平台。

作者:刘军,牛争艳   单位:山西省科学技术情报研究所