美章网 资料文库 图书馆生物医学科研数据管理范文

图书馆生物医学科研数据管理范文

本站小编为你精心准备了图书馆生物医学科研数据管理参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

图书馆生物医学科研数据管理

大数据时代,数据密集型科学研究模式的产生和科研数据管理任务的建立不断催生科研人员对科研数据管理支持服务的需求[1]。国外图书馆为了应对大数据带来的机遇和挑战,纷纷探索科研数据管理服务的方法与模式。2012年,科研数据监管被认为是美国高校图书馆十大发展趋势之一[2]。国外图书馆界,尤其是学术图书馆正不断发展支持科研数据管理的基础设施和服务。不同学科的科研人员对科研数据管理服务的需求存在差异[3-4]。在进行科研数据管理服务之前应考虑学科之间的异同,考虑不同学科、不同课题组科研人员在资金、设备、技术、研究方法、原材料等方面的差异,根据特定学科的特定需求提供一系列有针对性的科研数据管理服务。生物医学是关系到人类自身健康的重要领域,是生物医学信息、医学影像技术、基因芯片、纳米技术、新材料等技术的学术研究和创新基地,其科技活动非常活跃,已产生海量数据,并在持续快速增长。一些独特的科研数据是不可复制的,具有重要的研究价值。如何共享、规范、管理和利用这些海量数据是非常关键的。学科馆员通常具备相关学科背景和图书情报的实践经验,并且与科研用户建立了较为密切的联系和信任关系,能够深入科研一线,以综合的视角来研究科研数据的采集、描述、存储、管理和使用等问题[5]。在当前信息大环境下和已建立的学科化服务成果之上,学科馆员进一步深入开展科研数据管理服务已是大势所趋。笔者结合解放军医学图书馆学科化服务对象的学科特性[6],对国外图书馆尤其是医学图书馆开展科研数据管理支持服务的情况进行了调研,以期建立生物医学领域科研数据管理支持服务模式,对学科馆员参与科研数据管理的实践发挥指导作用。

1国外图书馆生物医学科研数据管理服务

在国外,科研数据管理已经成为一种制度。美国国立卫生研究院(NIH)要求申请50万以上基金项目的科研人员都提交一个数据共享计划或者数据不共享的说明[7]。该数据计划包括:数据共享的时间轴、数据集格式、数据分析工具、共享协议、数据共享方式等内容。英国生物技术和生物科学研究理事会(BBSRC)、英国癌症研究中心和英国医学研究理事会(MRC)[8]在资助科研项目时都要求研究人员提交数据共享计划,包括数据领域、类型和格式,标准和元数据,二次使用和数据共享的方法等内容,并为科研人员提供了数据共享计划模板,包括描述数据、数据收集、数据管理、数据安全、数据共享和责任等。澳大利亚政府、国家健康和医学研究理事会(NHMRC)和澳大利亚研究理事会(ARC)联合的澳大利亚诚信科研行为规范[9]中对于研究数据和重要资料的管理提出了明确的要求:研究者有责任保留科研数据,提供安全的数据存储,对数据进行明确标识,明确数据的拥有者以及确保数据的安全可靠性等。高等教育机构开始尝试解决如何支持科研数据管理的问题,有的开展科研数据共享和管理的咨询和培训服务,有的提供专业的数据服务,包括研究管理和计算机服务等。高校图书馆被认为可以在支持科研数据管理中发挥很大作用。但根据2012年一项关于英国大学图书馆正在从事的研究数据管理服务的调研表明,图书馆当前为研究密集型机构高水平活动所提供的科研数据管理服务还远远不够,在技能、资源和文化上仍存在巨大的挑战[10]。图书馆正在努力参与开发科研数据管理政策和服务,并将其视为未来角色的重要组成部分之一。本文选取印第安纳大学图书馆(IndianaUniversityLibraries)和提供生物医学科研数据管理服务的图书馆进行调研,参考借鉴其图书馆员为科研人员提供的数据管理支持服务的模式、内容、方法及工具等。

1.1印第安纳大学图书馆生命科学数据管理服务印第安纳大学图书馆[11]开展了针对生命科学数据的数据管理服务。该图书馆设立了科学数据管理馆员(ScienceDataManagementLibrarian)的职位,专职负责科研数据管理服务与联络工作,免费为本校科研人员提供科研数据云存储和存储介质,或协助科研人员找到能够满足需求的第三方数据存储的解决方案,建立数据管理服务网页,提供针对生命科学领域数据管理的详细指南和服务。具体服务内容主要涉及以下四大部分。

1.1.1记录数据对实验室记录,提供针对生命科学实验室数据记录获取的指南,如保持好的实验室笔记(包括案例和清单)的新手指南,莱斯大学生物化学和细胞生物学保持实验室记录的指南,甚至比较了各种油墨后提出的实验室笔记本选择建议,还有专业研究人员描述他们如何成功地管理专业笔记的书籍等。对于元数据,提供了生命科学科学数据常用的机读标准,如DarwinCore的生物多样性数据标准,生态元数据语言(EML)的生态学数据标准,ISA-Tab的omics-based实验数据标准以及其他的生命科学数据标准等。

1.1.2撰写数据资源管理计划协助制定数据管理计划,提供了一个采用IU-specific语言编写的NSF数据管理计划模板,并且建议使用DMPTool作为计划撰写工具,提供关于数据管理的指南,包括数据管理的一般概念(即记录数据与元数据,如何处理敏感数据等)和链接相关资源,以及提供制定数据管理计划的培训视频等。另外,还提供有关科研数据管理计划的人工咨询服务,由科学数据管理馆员审查核定,确保计划符合基金的要求。

1.1.3存储数据和保护资源印第安纳大学图书馆提供免费的数据长期保存服务,研究人员能够获得50TB的数据存储空间。印第安纳大学科研人员还可以注册一个研究文件系统(RFS)或学术数据档案(SDA)账户,为进行中和已结束的研究提供独立的私人存储数据。它提供的小型开放数据空间,可以上传150M的文件到IU-ScholarWorks平台。它提供的私有数据到开放数据的转换体统,研究人员可以将研究文件系统(RFS)或学术数据档案(SDA)中的科研数据传输到开放数据平台,供他人访问下载,实现科研数据共享。此外,印第安纳大学图书馆还向科研人员介绍了Biosharing.org和databib.org两个科研数据网站,主题领域涉及生物科学、生态系统科学、环境科学和健康与医学科学等。

1.1.4汇集数据管理相关政策提供印第安纳大学和科研数据管理相关的研究政策,如在生命科学领域特殊的研究政策,印第安纳大学关于人类被试研究的标准操作程序,敏感数据管理指南等。1.2马萨诸塞大学医学院图书馆数据管理服务[12]马萨诸塞大学医学院与新英格兰地区的几所图书馆联合开发了新英格兰协作数据管理课程(NEC-DMC)项目。NECDMC课程是科学数据管理最佳实践的教学工具,适用于健康科学的本科生、研究生以及科研人员。马萨诸塞大学医学院图书馆将这套课程上传至网站上,供科研人员和学生学习。课程的案例来自临床研究、生物医学实验室、工程项目和行为医学定性研究等科研数据管理的最佳实践案例。除了MECDMC课程外,马萨诸塞大学医学院图书馆还提供生物医学科研数据管理支持服务,由3名不同专业的图书馆员负责联系、咨询及其他服务。服务内容主要包括四个部分。

1.2.1科研数据管理介绍马萨诸塞大学医学院图书馆大力强调管理科研数据的重要性、为什么管理数据、良好的数据管理是什么样的、数据丢失的结果等。

1.2.2管理数据数据引用:向科研人员介绍为什么要引用数据、数据引用规范、引用数据的工具(DOI引文格式化程序),并列出了若干数据引用规范案例。数据伦理:向科研人员指出什么是负责任的研究行为、什么是数据完成性、如何匿名化定量数据和定型数据、去除识别信息的病人数据使用,并且提供了数据伦理案例研究等。文件管理:提供了文件结构和命名模板,数据文件组织建议等。文件储存和备份:介绍数据存储介质(个人存储介质、网络驱动器、云存储)和存储设备,数据存储、备份和安全的建议及最佳实践。所有权:介绍了知识产权政策、数据所有权和知识产权相关知识。规划:提供数据管理计划政策、程序和指南,数据管理计划制定工具,以及eScholarship@UMM管理平台。政策:提供各类数据政策,如基金自助者数据政策、出版商数据政策、期刊数据政策以及马萨诸塞大学医学院的数据管理政策。数据保留时长:介绍本地数据保留政策、数据保留时间及负责数据保留的部门。

1.2.3提供学校的资源与政策提供了学校的数据管理工具BioTools@UMassMedicalSchool安全的数据云存储、学校的数据管理政策、学校数据分析规划服务、临床资料咨询和解决方案以及研究计算方案和工具等。

1.2.4提供其他开放和可用的数据资源提供了开放以及公开可用的数据(如Bioinfor-maticsTimesaver、Data.gov、Databib、GenomicDataRepositories、HSRIC:Data,Tools,andStatistics、NIHDataSharingRepositories等资源)和可用的生物科学的数据存储库(如Dryad、GenBank、GeneExpressionOmnibus、MouseGenomeInformatics、ProteinDataBank等资源),以及公开的卫生数据集、社会科学数据集和开放数据资源等。从上述图书馆科研数据管理服务来看,生物医学科研数据管理咨询服务占很大比重,除了数据管理政策咨询、数据管理计划撰写指南及模板、知识产权咨询等咨询服务外,具有生物医学领域特色的数据收集方法、元数据标准、数据类型和范围、生物医学数据特有的分析方法和工具、生物医学研究政策、生物医学数据资源以及生物医学研究数据管理的最佳实践案例更成为了服务的重点。科研数据管理服务与文献情报服务有很大差异,需要配备专业的数据管理服务人员。

2对我国图书馆医学科研数据管理服务的启示

2.1以用户为中心无论图书馆如何提供科研数据管理支持服务,科研数据管理的主要责任者仍是科研人员。因此图书馆开展科研数据管理支持服务必须坚持以用户为中心,从用户的实际需求出发。首先在服务范围内对生物医学科研人员进行科研数据管理服务需求的调研,主要内容包括对科研数据管理政策的掌握情况,实际的科研数据管理方法及工具、科研数据管理计划的模板及工具使用情况,元数据格式、转换格式和工具使用情况,数据分析方法及工具的利用情况,科研数据管理目前存在的困难,以及对于图书馆能够提供的科研数据管理服务的需求等。针对以上情况,学科馆员需深入重点课题组,对科研数据管理实际情况进行考察,全面掌握服务对象在科研数据管理方面实际存在的问题,提升模式和对服务的需求。然后根据对调研结果的分析,初步设计出科研数据管理服务思路,结合本单位学科化服务重点服务计划,进一步开展基于生物医学数据生命周期的科研数据管理服务模式的研究和实践。

2.2基于数据生命周期的科研数据管理服务模式科研数据是根据科研工作的流程而产生的,同科研项目一样,也有生命周期。医学图书馆学科馆员为科研团队或科研人员提供科研数据管理服务,必须遵循生物医学科研数据的生命周期,满足科研进程不同阶段对科研数据管理的不同需求,才能有效地提供科研数据管理服务。学科馆员根据数据文档计划(DataDocumenta-tionInitiative,简称DDI)的研究数据生命周期[13],确定基于数据生命周期的科研数据管理服务模型,包括研究设计、数据收集、数据处理、数据存档、数据、数据发现、数据分析及数据再利用8个阶段,并根据不同研究阶段数据管理需求来确定科研数据管理服务的内容和方式。

2.2.1研究设计阶段在研究设计阶段,确定研究任务的同时需制定一份关于未来科研数据管理的规范计划。科研数据管理计划(DMP)是描述研究过程中及研究项目完成后科研数据处理方式的正式文件。清晰完备的数据管理计划不仅使得科研数据生成、保存、共享和利用等操作规范化,也可保证他人分享数据和长期保存数据的完整性和一致性。学科馆员要提供各基金机构数据管理政策、数据管理计划软件、基于科研数据管理计划的制订提供咨询与指导、基于数据生命周期的DMP最佳实践案例以及详细的研究数据管理指南等。

2.2.2数据收集阶段在数据收集阶段,科研数据管理需要确定数据格式、尺寸和命名方式,以及对数据短期进行存储。但生物医学领域的研究由于实验方法、对象、材料等方面存在诸多差异,导致数据收集方法与工具也存在很大差异。学科馆员需协助科研人员创建元数据,提供生物医学数据元数据格式、生物医学数据存储标准、一些分布式文件系统的介绍、其他可用的图书馆数据资源,以及根据情况构建或引入科研数据管理平台。

2.2.3数据处理阶段在数据处理阶段,科研数据管理的任务主要为数据转换和数据重新构建。生物医学领域数据类型比较复杂,需要针对不同类型的数据提供专业数据分析处理工具,学科馆员可以为科研人员介绍高性能计算中心、专业数据处理课程、数据处理方法等。

2.2.4数据存档阶段在数据存档阶段,科研数据管理的任务主要为数据长期保存与管理。目前用于科研数据长期保存的系统主要有公共数据仓储库、各学科领域的专门数据仓储库、各机构建立的数据仓储系统等。学科馆员需协助科研人员进行数据的上传存档,提供生物医学数据归档政策、数据仓库介绍、数据上传归档工具以及数据字典等。

2.2.5数据阶段在数据阶段,科研数据管理的任务主要为数据共享、确保数据安全和权力。数据的和出版是将研究数据视为科学研究活动的产出成果进行和出版,将有助于推动数据共享的进程。学科馆员可以提供生物医学科研数据共享与数据出版政策、生物医学科研数据交换格式标准,以及科研数据安全相关问题咨询等。

2.2.6数据发现阶段在数据发现阶段,科研数据管理的任务主要为数据挖掘和数据利用服务。学科馆员可以帮助科研人员发掘更多可用的数据来源、提供数据引用规范以及科研数据知识产权相关问题。

2.2.7数据分析阶段在数据分析阶段,科研数据管理的任务主要为萃取和提炼科研数据中的信息知识。此时,学科馆员需帮助科研人员对数据进行统计分析,找到数据内在的知识联系,提供生物医学科研数据分析软件(如SAS、SPSS等)及生物医学科研数据统计咨询服务等。

2.2.8数据再利用阶段在数据再利用阶段,科研数据管理的任务主要为数据关联与再利用。学科馆员可以为科研人员提供再利用的政策,并根据新的科研任务提供新的科研数据管理计划等。学科馆员在基于数据生命周期的科研数据管理服务过程中可以使用libguides建立数据管理支持服务平台,提供生物医学领域数据管理详细的指南和服务,重点建设数据计划及元数据标准、生物医学科研数据管理最佳实践、生物医学领域资源等。

2.3馆员能力建设科研数据管理服务的发展对图书馆员带来了极大挑战,如专业领域的科研数据管理服务受知识和技能的限制。有研究表明[14],健康、科学的图书馆员虽然对科研数据管理服务的开发具有兴趣,但往往缺乏提供生物医学科研数据管理服务的有效技能。学科馆员虽然具备一定的学科知识和图书馆实践经验,但对于专业的科研数据管理服务仍需提升各方面能力。在数据管理咨询服务能力方面,需加强理解和把握生物医学科研数据的生命周期,学习生物医学数据管理相关技术知识,熟悉生物医学元数据,掌握生物医学领域科研数据相关政策及规定,熟悉生物医学领域科研数据的范围和存储格式,加强对机构知识库的了解,补充基金申请书写作经验,提升与科研人员合作和沟通的技巧等。另外还需加强开发数据管理软硬件的能力,掌握应用专业软件(如Dspace、Fedora、Eprints等)定制开发特定领域的数据管理平台的能力等。

3结语

目前学科馆员开展科研数据管理支持服务的一个主要难点是缺乏数据标准。不同的科研领域,不同的管理方式都会产生不同的数据格式,缺乏数据标准使得已产生的海量数据因为兼容性问题难以实现共享和分析。学科馆员在协助科研人员进行科研数据管理初期应充分参考该领域的最佳实践案例,尽量使用国际通用标准,以避免之后调整数据标准的麻烦。在生物医学科研数据管理服务过程中存在一系列问题,如数据重构、数据分析、数据出版等,需要服务人员对生物医学和数据管理两个领域都具有较深的造诣[15]。学科馆员需要投入大量的时间和精力去学习新的研究方法、政策、工具等知识,才能很好地为科研人员提供生物医学科研数据管理服务。科研数据管理服务对学科馆员而言既是机遇也是挑战,优质的生物医学科研数据管理服务可以帮助培养新的研究、新的发现以及获得更好的科研成果,但需要更加深刻地把握学科领域研究数据的特性,开发更为便捷可靠的工具,不断优化的服务模式,持续地在数据挖掘、知识服务等方面进行深入探索。

作者:李芳薇 程瑾 张群 张萌 张孟子 张晓燕 陈建青 单位:解放军医学图书馆