前言:我们精心挑选了数篇优质科学研究与技术服务文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
[关键词]科学数据 数据生命周期 服务方式
[分类号]G250
进入21世纪,e-Science的产生改变了科研方式,科技创新越来越依赖于对海量数据的再利用。因此,如何融入e-Science环境满足科研人员的数据需求是图书馆界亟需探索的一个问题。国外已经有学者探讨e-Research中图书馆参与数据领域的角色定位问题,本文在总结前人观点基础上,利用数据生命周期(digitallife cycle)模型推演了e-Science环境下图书馆可以开展的科学数据服务方式,并考察各项服务的实际开展情况,辅以案例分析。
数据生命周期是指从数据产生,经数据加工和,最终实现数据再利用的一个循环过程,其实质是依据科研过程来管理数据。本文从来源、类型、基本流程、特色、实质等方面分析了各种数据生命周期理论,从中归纳出数据生命周期的一般基本流程,以此为指导思路探索了e-Science环境下图书馆可以开展的科学数据服务方式。
1 数据生命周期理论归纳
生命周期的概念源于生物领域,科学家描述了寄生物扁虱从一个宿主转换到另一宿主的生命周期过程,宿主为扁虱的整个生命周期提供支撑生存的环境。作为一种比喻,数字对象也可以看作扁虱,从一个数字加工环境到另一环境,最终生成数字产品供用户使用。数字生命周期的提法在IASSIST(International Associa-tion for Social Science Information Services&Technology)2006中多次出现,Ann Green总结了各类数字生命周期理论,并讨论了数字化生命周期的内涵:首先,“生命周期”不同于“生命期”(life span),即从产生到消亡,一个生命周期意味着一种数据加工环境,经过数据管理和长期保存,实现资源发现和再利用。具体来说就是对数字化资源进行保存及长期保存、提供获取,最终用于支持研究、政策制定等再利用活动。本文归纳了各派数据生命周期理论,从来源、基本流程、类型等方面进行列表对比(见表1)。
从各派理论可以看出,科研生命周期是数据生命周期的来源,同时e-Science环境下一个完整的数据生命周期涉及数据加工和知识抽取两个层次,数据加工是知识抽取的基础。其中,数据加工的过程基本达成一致,各家基本都涉及数据收集、数据处理、数据、数据发现等;另外,Liz Lyon的e-Research下的数据生命周期模型中有增加附加值环节,实质上属于数据加工的高级阶段,即再加工;而各家基本都涉及的数据分析则是最高级的数据加工,即知识抽取阶段。
综上所述,从内容层面看,一个完整的数据生命周期包括数据加工和知识抽取两个层次,数据加工是知识抽取的基础。数据加工又包括数据初次加工和数据再加工,前者包括数据存储系列环节;后者则是在一次加工基础上增加附加值。在知识抽取方面,主要在数据获取基础上进行的一系列高级活动,包括数据挖掘等知识发现活动。
2 数据生命周期流程下的图书馆数据服务拓展
由前文分析可以看出,数据生命周期由科研周期发展而来,通过数据生命周期图书馆可以宏观把握科研人员的科学数据需求,结合自身实际开展服务。笔者也试图通过数据生命周期理论推演e-Science环境下图书馆可以开展的科学数据服务方式。在此之前,国外已经有很多学者、机构对e-Science环境下图书馆参与数据领域的角色定位进行了探索,这与科学数据服务方式的探索是异曲同工的,因此本文首先总结已有研究,在此基础上提出自己的服务推演类型。
2.1 图书馆在数据服务领域的角色探索
Anna Gold提到科学研究生命周期理论和学术交流系统结合起来,很容易推导出数据和文献的生命周期流程,具体如图1所示:
笔者以此为线索探索了图书馆员在科学数据服务中可以担任的角色。在前出版阶段,主要角色是:①选择数据集并发放许可;②制作元数据(或标准)描述数据集;③数据保存服务;④评审、挑选长期保存资源;⑤协助用户数据发现;⑥发展数据出版标准和系统;⑦呼吁出台知识产权保护文件;⑧建立学术成果储存库,如数据仓储。在后出版阶段,作者主张图书馆员要争取成为研究者的合作者,如参与创建数据管理原型等。
另外,Liz Lyon也提到科学数据服务中涉及到的各主体的职责,其中,数据馆员可涉及的工作包括数据评估、数据长期保存、协调机构合作、宣传数据服务、发展标准等。一家专门从事学术交流领域咨询的公司也谈到图书馆介入科学数据领域的几种方式:培训研究者的“数据意识”;数据存档和保存;培训和提供数据馆员。Rick Luce也提到图书馆在e-Science环境下参与数据领域可尝试的新角色包括:改变传统的文献和学术交流视野;数据存档、机构库;发现相关资源、数据保存、教育和培训等。
由以上研究可以看出,国外图书馆界已经意识到在数据领域要参与新的分工,并开始将服务边界拓展到传统学术交流的上游即数据阶段。以上各家讨论的e-Science环境下图书馆在数据领域可以尝试的角色存在一定重叠,例如数据保存、数据获取等,这一定程度上是由图书馆存储信息资源的传统和优势决定的;其他如发展标准、知识产权等则是个别学者提出,主要是因为目前数据服务还没有产生成熟模式,讨论这些问题缺乏一定的实践基础。
2.2 基于数据生命周期的数据服务拓展
上述学者在图书馆数据服务探索方面积累了一定成果的同时,也存在很多不足。例如,大部分学者仅发散地列出图书馆员在数据服务领域可以尝试的角色,缺乏理论支持和系统性,只有个别学者按照学术交流系统的流程展开讨论;另外,上述研究没有归纳为服务方式。因此,本文利用数据生命周期模型归纳了图书馆可以开展的科学数据服务方式。如图2所示:
由前文可知,一个完整的数据生命周期应该历经数据初次加工、数据再加工、知识抽取阶段。其中数据初次加工包含数据收集、数据描述、数据存储、数据获取等环节,实际就是数据存储服务,这本质上和图书馆的文献保存性质相似。数据再加工则是对已经存储的数据进行二次加工,以增加附加值;而知识抽取则是在数据加工基础上的服务升华。由此可见,从数据初次加工到数据加工再到知识抽取是一个由低到高的循环过程。笔者在各个服务模块下又划分了具体的服务方式,下文主要讨论每项服务的内涵、开展情况,并辅以案例支持。
2.2.1 数据初次加工服务 数据初次加工的核心服
务方式是数据存储服务,数据存储服务其实是数据管理(Curation)的一个重要环节。Curation是指从数据被生产出来起就开始的管理和促进其被利用的行为,目标是使得数据能够符合现实的需要,或能被用于发现和重用数据。数据存储服务中包括的具体服务形式如数据存储及长期保存、数据发现及获取和数据管理咨询等。具体来讲,图书馆可以探索的服务项目可以包括以下几类:①数据存储服务:服务面向暂时性的数据存储,例如建立机构数据仓储,方便机构内部的数据共享,同时有部分数据可以转移到更高一层的机构库中。例如康奈尔大学图书馆建立的DataStaR就是一个临时的存储库,用户可以上传数据、选定特定同事进行数据共享、选择一个长久保存的机构库、数据出版等,支持小型研究团体的数据共享。普渡大学图书馆的D2C2是一个分布式数据保存中心项目,其中e-Data作为数据管理服务的试验平台。e-Data实现了对远程机构库的以及网格上数据集的分布式存取。其本地存储容量大概是30Tb,图书馆员已经和各个领域的研究者进行合作收集数据。②数据长期保存服务:服务面向永久性的数据存储。长期保存是一种基于存档的活动,数字保存需要解决的问题是即使随着时间的流逝、在技术已经变化了的情况下,还能够对文档的数据进行存取。例如由美国航空航天局(NASA)1990年开始着手建设的国家级分布式数据存档中心(DAAC’s)包含海量卫星观测数据,由于这些数据具有不可重复性,因此必须保证可以永久获取,这对数据长期保存提出很高的要求。在处理技术方面,涉及在原有数据存储基础上增加一些长期保存活动,例如制定长期保存计划;数据评估来决定哪些数据需要长期保存;数据清洗、分配保存元数据、文件格式等。③数据发现及获取服务:帮助用户在海量信息中发现关联信息一直是图书馆的优势所在,类似于检索文献,e-Science环境下图书馆员也可以开展数据发现服务,形式包括数据检索、数据导航、集成融汇服务等。例如加拿大科技信息研究所(CISTI)就提供对加拿大科学、技术和医学数据(STM)的数据导航服务。它整理了加拿大范围的科学数据,进行分类整理、元数据描述,有些还提供科学数据库的链接等。集成融汇方面,2006年以来,中国科学院国家科学图书馆提出并开展科学数据与科技文献跨界集成服务、数据融合技术的研究和开发,利用数据SRU技术实现了科技文献、科学数据、字典等的服务融合。④数据管理咨询服务:除此之外,图书馆还可以提供数据管理咨询服务,数据馆员可以全程跟随科研项目,进行数据管理,从规划、收集到存档、的系列活动。另外,图书馆员也可以在存储格式、存储流程、标准等方面协助科研用户进行科学数据管理。国外的一些科学数据中心会跟随科研团队进行数据管理协助服务,例如美国NASA的地球观测实验室(EOL)。麻省理工大学图书馆就提供社会科学数据、地理GIS数据以及生命科学数据的咨询服务。
2.2.2 数据再加工服务 为了在更大范围内发挥数据的作用,图书馆可以对数据进行再加工,提供数据增值服务。例如数据可视化、文献和数据的链接等。在数据再加工服务方面,已经有图书馆开始探索数据增值的新形式,例如图书馆尝试给科学数据添加注释以及来源出处,实现了科学文献和科学数据的交叉链接。在实践方面,德国国家科技图书馆(TIB)就利用DOI系统,通过分配数据集数字对象唯一标识符,实现文献和科学数据的链接。
数据加工的最高等级即知识抽取活动,包括例如数据挖掘、数据分析、数据融合等。在知识抽取服务方面,将是科学数据服务的未来发展方向。在初期,图书馆可以协助科研用户进行数据挖掘、数据融合等服务,并可以提供相应的数据分析软件等;在后期,图书馆员应该尝试和研究者进行合作,参与到科研的前出版过程,提供数据分析等服务。
3 结论
由前文研究可以得出,数据管理的生命周期源于科学研究的生命周期。数据生命周期实质是将传统学术交流的链条拓展到前出版时期的数据阶段,从数据产生、整理到数据和获取,拓展了图书馆的服务范畴,可以有效地指导图书馆开展科学数据服务。图书馆现在的服务主要围绕已经出版的文献资源,e-Sci-ence环境下图书馆应该将服务链条拓展到上游数据处理阶段,并将知识服务作为未来服务发展的方向。
关键词 科学数据共享 国际科学数据服务平台 共享研究
分类号 G250.73
Abstract This paper introduces the scientific data sharing status at home and abroad, analyzes the basic elements of the scientific data sharing, including the resource elements, the protection of intellectual property rights elements, the shared schema elements, sharing and management mechanism elements. Further more, it presents the International Scientific Data Service Platform, analyzes its data resources, protection of the intellectual property rights, sharing mode, service contents, and browsing method.
Keywords Scientific data sharing. International scientific data service platform. Research of the Sharing.
科学数据是指在科技活动(实验、观测、检测、调查、研究等)中或通过其它的方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据,以及根据不同科技活动需要,进行系统加工整理的各类数据集[1]。科学数据集科学价值和使用价值于一体,并对于科技创新的发展产生了深远的意义。科学数据资源具有准确性、可靠性、非排它性、可无限复制等特点。这些特点和其重要性使科学数据的共享成为必然,只有让科学数据得到共享,才能实现其价值的最大化,同时,又通过科学数据的共享这一过程,发展出更高层次的科学数据,这是一个逐级递进的过程,最终为社会的发展贡献力量。
1 国内外科学数据共享现状
1.1 国外科学数据共享现状
20世纪40年代,国外的科学数据共享方面的研究开始起步,在20世纪80年代得到发展,在欧洲、英国、法国、德国、荷兰和瑞典等国家非常重视数据管理与共享,美国是科学数据共享的倡导者。1975年,美国开发了177个大型数据库,主要服务目标是政府决策和政府启动的重大科研项目[2]。欧盟数据库法律保护指令、英国布加勒斯特宣言和《信息自由法》等,在科学数据的产权归属、共享管理和开发利用等方面均有明确的规定,以保障科学数据共享活动的有序开展。
国际科学数据委员会(CODATA)于1966年成立,是全球最大的科技数据国际学术组织,其宗旨是推动科技数据应用、发展数据科学、促进科学研究、造福人类社会[3]。美国建立了美国航空航天局(NASA)分布式最活跃数据档案中心群(DAACs);日本产业技术综合研究所(AIST)科学数据公开数据库拥有70个主题数据库,全部数据库通过网络提供免费服务,服务于科研机构,也服务于一般工业企业[4]。2007 年3 月,英国了研究报告《发展英国科研与创新信息化基础设施》,提出数据资源数字化长期保存与共享建设规划,重点要建立大规模的国家科学数据中心[5]。
1.2 国内科学数据共享现状
我国的科学数据共享工作起步比较晚,2001年底我国科学数据共享工程启动气象科学数据共享试点,在资源环境、农业、人口与健康、基础与前沿等领域共24个部门开展了科学数据共享工作,已经启动了9个科学数据共享试点,开展了科学数据共享政策法规和技术标准体系的调研工作。先后完成了23项具体标准的编制以及一批管理办法;整合共享了跨部门跨领域超过250亿元国家投入产生的数据资源,建立了若干数据库;积极开展数据共享服务,为科学研究、政府决策提供了坚实的支撑,成效显著[6]。但是与发达国家比起来存在很大的差距,主要有:科学数据共享意识不强,目前科学数据共享工程试点的共享数据多为国家经费资助下科技活动形成的数据,各科研单位主动积极共享意识不强;相关的科学数据共享标准及技术规范没有统一的规定;科学数据类型集中于海洋、地理等少数学科领域。
2 科学数据共享基本要素分析
美国国家卫生研究院(NIH)要求申请资金超过50万美元的项目必须提供数据共享计划或者说明不共享的理由。并且,NIH通过分级方式共享数据,包括可公开获取的数据、通过协议获取的数据和限制使用的“冷冻数据”[7]。据调查显示,科研人员共享电子数据和使用他人数据的意愿都不高,主要因素有:没时间、没资金、没权利、缺标准以及资助者无要求等[8]。科学数据的共享最基本的是要有相关的科学数据,也即资源的来源,而共享工作的开展必然要面对科学数据的知识产权保护问题,其次要根据不同的情况选择不同的共享模式来开展共享活动,共享活动的有序、稳定的开展需要相对应的共享管理机制的保障,所以资源来源、知识产权保护、共享模式以及共享管理机制这四大要素构成了科学数据共享活动的基本要素,它们之间相互联系,缺一不可。
2.1 资源来源
科学数据指在科技活动过程中产生的原始数据,所以资源的来源就是科研活动过程,资源的内容主要有两种:一种是本单位或机构内科研活动过程中产生的数据,二是收集其他单位或研究机构的科研数据。本机构的科学数据,主要是来自于本机构研究人员的自愿自主提交以及数据服务人员提供咨询帮助,如中国气象科学数据共享服务网的科学数据来自于国内卫星通讯系统、全球通信系统收集的全球和国内各类实时和非实时的气象观探测资料[9];第二种主要是与政府机构、科研机构、高校等部门合作,提供途径鼓励这些机构的研究人员同意将他们的相关数据整合到数据中心共享.如基础科学数据共享工程整合中国科学院在物理、化学、天文、空间与生物领域20多个研究所长期以来的基础数据,同时,重点整合国防科工委下属的中国工程物理研究院、中国原子能科学研究院在核物理与原子分子物理方面基础数据,整合国家林业局所属青海湖国家级自然保护区多年来在青海湖区域监测与观测数据[10]。
2.2 知识产权保护
数据的共享首先要考虑的就是其所涉及到的知识产权问题。科学数据共享中的知识产权主要体现为科学数据的版权,版权就是著作权, 是指文学、艺术、科学作品的作者对其作品享有的权利, 包括财产权、人身权[11]。科学数据凝聚了数据开发人的智力劳动,是创造性的劳动成果,同样受版权法保护,具有重大的价值。实施科学数据共享是我国面对全球信息化和知识经济的发展,开展自主创新、建设创新型国家的必然要求[12]。刘闯认为通过数据库共享服务平台进行有偿数据服务而获得的收益,在数据库制作者和相关数据创造者之间按照合同约定进行分配,如无合同约定的自行协商解决[13]。
《全球变化研究数据管理政策声明》提出“联邦政府资助的科学数据,即公共性、基础性的国有数据,必须在没有歧视的基础上以不超过复制和发行成本的费用无限制地使用”[14]。科学数据的开发与获得需要责任人付出巨大的努力,包括精力、时间、金钱上的,不仅仅是数据开发人,还有相关的单位等等,他们对于科学数据做出了巨大的贡献,这些科学数据自然地成为各个单位的财产,受知识产权保护,另一方面这也在一定程度上限制了科学数据的自由共享。所以笔者认为,科学数据的共享需要国家相关法律的许可和一定的限制,对于那些在国家或是地方政府经费等非营利性机构支持下开发的科学数据,采用一定的奖金或是其它奖励的方式来鼓励开发人,如果不危及国家安全和个人隐私,则完全向公众开放或是使用时加以标注,以尊重劳动者的成果,但不能用于商业用途;对于那些由单位自筹经费或是个人、企业自行开发研究的不危及国家安全和个人隐私的科学数据,则要协调好利益的平衡,一般是采用收取一定的费用的方式来保护他们的权利;对于那些对科学数据进行了一定程度的加工的更深一层次的数据及提供的相关服务活动,收取一定的成本。
2.3 共享模式
科学数据共享为科学数据的使用提供了一条更为畅通的道路。科学数据具有无法估量的潜在价值,前人为科学数据的探索与创造做出了巨大的努力和贡献,传承与共享这些科学数据是对于他们的努力的最大尊重与认可。目前国内外采用的科学数据共享的模式主要有四种,分别是国际组织协作共建共享模式、政策驱动型共建共享模式、主题合作共建共享模式和地域协作共建共享模式。
2.3.1 国际组织协作共建共享模式
顾名思义,国际组织协作共建共享模式是指在某种约定或是条约的约束下,国际组织就某一研究方向或是研究主题,共同制定相关的共享策略的一种共享模式,该共享策略包括共享的范围、方式及相关的政策,可以促进同一领域内数据的交流与共享。国际组织协作方式包括国际政府间的合作和国际非政府间的合作,不管是哪种方式,都必须遵循共享的宗旨,为共同的约定所约束,以促进数据在全球的共享,提高各成员国的科技水平。经济合作与发展组织(Organation for Economic Cooperation and Development,OECD)是由30个市场经济国际组成的政府间国际经济组织,旨在共同应对全球化带来的经济、社会和政府治理等方面的挑战,把握全球化带来的机遇[15]。
2.3.2 政策驱动共建共享模式
这种模式是指在国家法律法规政策的强制驱动下推进科学数据的共建共享。美国是这一模式的最早试验者。美国的《信息自由法》和《版权法》是这一模式的法律基础。并在1991年了以“完全与开放”科学数据共享政策为核心的“全球变化研究数据管理政策”,通过这一政策来促进科学数据共享,从而为美国的科学研究提供强有力的保障条件,确保其在21世纪国家发展和科技发展战略目标的实现。
2.3.3 主题合作共建共享模式
该模式是根据主题的不同来进行共建共享科学数据,建立专题科学数据库。如印度科学和产业研究中心(Center for Scientific and Industrial Research,CSIR)及肯尼亚的医学信息共享。肯尼亚医学研究机构(Kenya Medical Research Institute,KEMR I)通过编制肯尼亚医学机构研究和使用的数据和目录来实现彼此联系,共享资源[16]。我国的地球系统科学数据共享平台承担单位是中国科学院地理科学与资源研究所,中科院资源、环境领域的研究所,国内地学领域的知名高校共40多家单位,世界数据中心(WDC)和国际山地中心(ICIMOD),美国马里兰大学等国际组织和机构参与本平台建设与运行服务[17]。
2.3.4 地域协作共建共享模式
该模式把那些参与到共建共享科学数据的单位限定在某一个地理范围内,与国际间组织协调共建共享模式相似,前者范围相对小一些,一般限定在某个地区或是某国内,将共享资源集中存储在某一特定的地点,并在相关单位的共同管理和共同资助下运转共同建设。2004年,科学技术部和财政部整合“国家科技基础条件平台专项经费”“中央级科研院所科技基础性工作专项经费”“科技文献信息专项经费”三个专项经费,统一用于国家科技基础条件平台建设[18]。
2.4 共享管理机制
科学数据具有科学价值、经济价值和社会价值,并且易于复制传播和共享等特点,不同的科学数据由于其属性或是归属性的不同,需要采取不同的管理机制来开展共享工作。目前,国际上采用的共享管理机制有三种:保密性管理机制、公益性共享机制和商业化管理机制。
2.4.1 保密性管理机制
顾名思义,该机制对于科学数据的共享采取不公开的方式。一般这种机制设计到的科学数据是有关国家安全、个人隐私的数据信息,公开这些信息对于国家的安全、人民的生活都会产生很大的影响。同时,参与这些数据信息的开发和管理人员都必须与单位签订保密协议,以进一步确保信息的不泄露,国家情报部门与各个单位安全主管负责检查科学数据和信息的安全性执行情况,同时严格和明确地规定这些数据信息的保密管理。
2.4.2 公益性共享机制
此种机制是采用完全开放的方式来共享科学数据,其中的数据是指除了上述属于保密性管理机制数据之外的政府所拥有的信息和科学数据,包括标准数据库、科技成果数据库等。这些数据都应该依法“公之于众”,采用网站或是其它的方式来向社会完全开放,让公众获取,用户无需支付相关费用或是仅仅支付低廉的复制成本费用。像美国的海洋大气局、国立卫生研究院等联邦政府拥有和生产的数据,中国科学院地理科学与资源研究所产生的地球科学数据,整合、集成科研院所、高等院校和科学家个人通过科研活动所产生的分散科学数据。
2.4.3 商业化管理机制
对于那些完全是为了盈利而投资生产的科学数据,则采用商业化管理机制,对于此类科学数据的共享收取一定的费用。例如, 美国政府批准了空间影像和数字地球两家企业从事高分辨率遥感数据的获取和业务, 然后采取鼓励平等竞争的政策, 通过市场竞争的方式降低数据价格, 达到促进数据应用的目的, 并同时通过税收进行调节和控制[19]。
3 国际科学数据服务平台分析
“国际科学数据服务平台”(见图1)(以下简称“平台”)启建于2008年,由中国科学院计算机网络信息中心科学数据中心建设并运行维护,面向中国科学院及国家的科学研究需求,逐渐引进当今国际上不同领域内的国际数据资源,并对其进行加工、整理、集成,最终实现数据的集中式公开服务。在保护国家安全,尊重知识产权的前提下,秉承完全开放的共享理念,尽可能为用户提供全方位的数据服务,包括在线数据浏览、数据搜索、数据访问与下载、软件工具及文档资料共享等通用数据服务,以及数据预定、委托查询、数据传递通道、在线模型计算、数据使用咨询等特色数据服务。
3.1 数据资源
国际科学数据服务平台收集的数据资源主要集中于地学、遥感、大气海洋等领域,引进了LANDSAT数据、MODIS数据、MODIS_L1B 数据、EO_1数据、DEM数据、NCAR数据等国际原始数据资源,采用国内外权威的数据处理方法或科学数据中心自行研发的数据处理方法对于上述数据开展了深度加工和数据模型的开发,形成了它们独具特色的一系列全国甚至全球领域的特色数据产品,面向多领域科研需求,基于通用的数据模型,充分利用本站超级计算资源,为用户提供可定制的数据产品加工,用户通过在线定制便可以得到自己需要的数据产品。
该平台期望能满足多领域的科研需求,但是资源集中在少数学科领域,深度加工的数据模型目前只限于少数几个,对于平台的宗旨来说有待发展。
3.2 知识产权保护
知识产权保护问题在共享工作的开展中被首先考虑到,国际科学数据服务平台的数据资源在进行镜像之前都和数据所有者进行了充分的沟通,并通过协议、合作或其他方式取得了对应数据的镜像权限,用户可以放心使用。用户复制使用平台中的数据,平台都做了详细的规定,在“完全与开放”的服务宗旨下,一方面尊重知识产权、保障数据作者和数据服务提供者的权益,要求数据使用者在发表成果时注明数据生产者及数据来源(国际科学数据共享平台http:///),未经网站允许,用户不能有偿或无偿转让在该平台获取的数据;另一方面,为了更好地推动数据共享,凡使用“国际科学数据服务平台”数据的用户,需要在一定期限内将数据所支撑的项目或论文产生的相关成果材料提交到“中国科学院计算机网络信息中心科学数据中心”,并允许平台部分可公开成果。通过这样的“交换”方式来提供更深层次的科学数据给用户,一方面也减少了不必要的重复劳动,提高了用户的使用效率。
3.3 服务内容
科学数据的共享离不开数据的再利用,该平台充分考虑到不同用户在不同情况下的各种服务需求,除了提供通用的数据服务,像在线数据浏览、数据搜索等外,还提供数据预定、数据传递通道、数据申请等人性化的特色服务,切实地提高用户使用满意度。
3.3.1 数据预订
用户通过网站对应入口预定可以查询,但是不能在线下载数据,数据服务人员将会根据用户的数据预定清单提供服务。目前,该平台开放“数据预定”功能的只有Landsat数据,用户可以通过数据列表或者数据搜索功能,产生数据预定清单,并直接通过网站入口提交给系统。用户数据预定的所有历史记录以及当前预定的处理状态和下载链接都可以从“用户空间”内查询。
3.3.2 数据申请
这种服务是针对用户不能通过网站直接查询、下载数据,或因数据量巨大,用户不方便通过网站查询、下载的情况,该平台支持用户提出相应申请,数据服务人员进行处理并将结果反馈给用户,一般用户可以根据自己的情况以及数据的需求选择在线数据申请或离线数据申请。
3.3.3 数据传递通道
该服务属于高级数据服务方式,是该平台为大宗数据用户或特殊数据用户开通的,指对于因为各种原因不方便通过网站直接下载数据的用户(比如网络连接受限,数据量过大,或者用户有其他特殊要求等),可以直接通过网站提供的联系方式提出“数据传递通道”的需求,审核通过后将会为用户开通特殊数据传递通道(比如用户特殊授权,光盘邮寄、硬盘直接拷贝等),以便用户及时获取所需数据。
3.4 共享方式
关键词:PubMed;资源检索;学科服务x
中图分类号:G2586文献标识码:A文章编号:1009-5349(2016)07-0093-02
PubMed源于国家生物技术信息中心(NCBI),隶属于美国国家医学图书馆,是当前国际中使用最普遍的学科科研信息资源检索系统。PubMed具有免费开放资源,数据来源权威可靠,搜索功能尤其全面,精准并且功能丰富等优点。此外PubMed还允许外部开发人员基于PubMed 的资源设计再开发,如ClusterMed等系统,都是基于PubMed 检索结果的再分析,再获得。这样使得PubMed系统在操作上更简单易懂。为了令读者更深入地使用PubMed的资源免费功能, 本文主要介绍这个系统的几个功能,包括期刊数据库检索、引文匹配功能、跟踪学科服务进展功能、学科服务平台定制功能等, 旨在对学科服务平台提供有效技术支持。[1]
一、基于PubMed下的学科服务平台现状
高校图书馆的纸质资源和网络资源品种繁多,急需一个可靠的搜索引擎来向读者们展示这些资源,方便读者利用。因此目前已经有多种搜索引擎被开发利用,我们就要从中找到最合适高校图书馆学科服务平台的搜索引擎。目前,在国际上经常使用的检索系统有两种可供用户们学习使用,一种是Google Scholar,一种是PubMed。他们都是综合性较强的搜索引擎,而PubMed在学术文章的检索上更加专业,Google Scholar的使用比较简单但是不能准确地对控制词进行分析,不能给出最新最全面的搜索结果,所以目前比较常用的还是PubMed搜索引擎。好的搜索引擎是高校学科服务平台可靠的资源保证。[2]
二、基于PubMed系统下的学科服务平台特点
? PubMed是十分实用的学科分类服务的平台,PubMed系统中医药学平台就收录了全世界80多个国家5000余种生物医学期刊,这就需要通过学科馆员对大量的学科资源进行再次收集与整理。该系统具有更新速度快,搜索质量高等优点,并且能够提供原文的网络链接,对模糊的检索词可以提供自动匹配功能。[3] PubMed中的资源有一部分也可以免费获取全文。用户在搜索引擎上可以免费查找、检索和下载需要的学术论文。为保证数据库可靠性和权威性,数据库只接收通过国际评审后的期刊。
三、PubMed 下高校学科服务平台的功能
(一)使学科服务平台具有检索词自动匹配功能
高校图书馆需要向PubMed申请账号,然后进行后台登录,填写图书馆名称,联系人等相关信心。审核通过后,就可以获取科研论文全文的电子版或查看相关文章的馆藏信息。该搜索引擎在用户输入关键词或者模糊词的时候,可以进行智能化的分析,进行模糊搜索和更改,列出用户可能用到的链接和文章。比较常用的四种检索途径有:MeSH Translation Table主题词诠释列表,Journals Translation Table期刊诠释列表,Common Phrase List常用词单列表,Author Index作者名题搜索。
因此在高校图书馆学科服务平台使用中,用户可以利用PubMed系统对要搜索的主题内容的概括分析来了解该学科领域的主要研究方向和相关知识。
(二)基于PubMed的学科服务平台定制功能
PubMed系统可以收集建立学科分类的专题文献合集。登录PubMed系统以后,在检索相关关键词时点击
? “Send to”,可以把已知的检索结果保存到系统中的
? Collections中,从而形成个人学科文献集,极大方便了用户的查阅行为。用户根据自己的需求随意分类自己的文献。通过这种个人定制,读者可以实现相关期刊、重要文献、专题内容等等内容的分门别类。
PubMed系统还提供与微博功能类似的RSS内容的格式。通过 RSS格式读者可以直接刷新网站,保持站内文献信息的时效性。Rss浏览十分方便,并且PubMed系统已经具备直接打开该类型文件的功能,RSS 订阅方便可靠,更适合推荐给学科服务平台的读者使用。因此在对学科服务频繁太用户和管理人员的培训时,软件软件操作也是十分必要的。[4]
(三)PubMed系统可以实现跟踪学科服务进展
PubMed检索可以通过分析科研项目的需求及其所涉及的关键词来制定检索策略,然后由用户保存到MyNCBI中,读者可以对自己所需要的文献的更新频率和时间段以及数量来设置,用户也可以设置过滤词或者限定条件。限定条件指的是免费全文、综述等,当然用户也可以针对学科专题进行限定,设置成功以后,系统会针对用户最新设置来推送文献。[5]
四、提高学科馆员和平台用户的操作技巧
高校学科服务平台已经日趋成熟,学科馆员是这个平台稳定发展的重要因素。学科馆员的自身素质需要他们不断地掌握新的操作技能和相关背景知识,在借助PubMed这个系统的服务平台时,学科馆员还应该不断学习相关搜索工具和操作技巧,掌握学科服务的特点和方向,减少实际操作中出现的失误。高校图书馆学科馆员为用户提供见面交流的机会或者对用户进行小规模的辅导,为学生读者更好地使用学科服务平台奠定基础。旨在为学科馆员和读者们营造一个共同学习、交流的平台。
五、基于PubMed的学科服务平台的价值和作用
基于PubMed下的学科服务平台有效加强了学科用户之间的交流与沟通。高校图书馆的学科服务是以用户的需求为根本出发点,以满足读者需求为最终目的。因此基于PubMed下开展的学科服务中的资源建设,特别是各学科的专题文献分类合集的定制、学科领域进展的反馈追踪、学科研究概况分析,都必须以用户的检索需求为出发点来制定相关策略,才可以使为不同学科的用户量身定制的学科服务平台在实际操作中取得更好效果。优秀的操作系统也给高校学科服务平台带来了可靠的资源和便利条件。
六、结语
目前高校图书馆为了与网络时代接轨,已经开发利用了众多服务平台,大学生们对网络的需求和使用正为学科服务平台的开发奠定了基础。借助PubMed系统下提供的免费资源,有效开展学科服务是一个大胆有效的尝试。PubMed 作为国际公认的权威资源,是高校学科服务平台使用中必不可少的工具之一。在图书馆学科服务实践中充分利用PubMed带给我们的便利的同时,也应注意到 PubMed系统的一些缺点,比如PubMed系统下的引文分析功能还相对贫瘠等,因此高校图书馆还应结合其他专业的工具和资源,更有效地开展学科服务工作。
参考文献:
[1]吴健,李秀芝.PubMed 特征栏的功能[J].中华医学图书情报杂志,2003, 06:51-53.
[2]朱鸽昀,郑力,朱东屏,等.PubMed 系统的主要服务功能[J].中华医学图书情报杂志,2008,12:121-123.
[3]Steinbrook R. Searching for the right search: reaching the medical
literature. N Eng J Med. 2006,354(01):4-7.