美章网 资料文库 浅谈大数据下的信息资源管理创新范文

浅谈大数据下的信息资源管理创新范文

本站小编为你精心准备了浅谈大数据下的信息资源管理创新参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

浅谈大数据下的信息资源管理创新

摘要:【目的/意义】根据大数据环境下信息资源管理的特征,对信息资源管理模式进行创新探索,进一步挖掘信息资源深层次价值,实现更健康有效的信息资源载体的支持。【方法/过程】以大数据背景的信息资源特征为基本研究出发点,挖掘数据科学与信息资源管理的关联,利用数据挖掘和数据分析以及新兴的智慧服务,构建较为系统的信息资源管理模式。【结果/结论】通过本文的研究,构建了大数据背景下信息资源管理三种创新模式:①“物联网+大数据”创新模式;②“数据挖掘技术+信息资源”融合模式;③“技术框架+用户核心”的信息服务模式,为大数据时代信息资源管理的可持续发展及研究提供知识参考依据。

关键词:大数据;信息资源管理;管理模式;模式创新;智慧服务;融合模式

1引言

伴随着科学的不断进步,技术的不断发展,大数据处理技术与机器学习技术应运而生。大数据中的信息资源被迅速大量的积累,挖掘隐含在大数据信息资源中的潜在隐含的知识具有重要意义。大数据环境下信息资源管理领域的重点主要集中在知识组织、价值发现和精准信息服务等方面。信息资源指数的增长使得用户难以对信息资源的来源进行准确、高效的提取与利用,最终会导致网络资源利用率降低。因此,为达到对信息资源更高效利用、用户得到更为准确有效的信息资源载体的目标,对大数据环境下信息资源管理特点及问题进行分析并提出相应的对策建议变得尤为重要。大数据时代的到来,尤其是数据科学的出现,为信息资源管理带来了新的机遇与挑战。机遇主要体现在包括信息资源在内的大数据重新受到广泛重视,而挑战在于信息资源管理模式的创新,因此在大数据时代我们需要改变思考模式和研究范式。本文根据大数据背景下信息资源特征,挖掘数据科学与信息资源管理的关联,并针对性地提出信息资源管理的创新模式。

2大数据背景下信息资源特征

信息资源管理有狭义和广义之分。狭义的信息资源管理是指对信息本身即信息内容实施管理的过程。广义的信息资源管理是指对信息内容及与信息内容相关的资源如设备、设施、技术、投资、信息人员等进行管理的过程。大数据产生和发展的特点可以归纳为“4V”,即Volume(海量)、Velocity(高速)、Variety(多样)、Value(价值)。

2.1数据量大

进入Web2.0时代后,用户主导而生成的内容互联网产品模式成为主流,以此生成以人为本的创新2.0模式在互联网领域的典型体现,是由专业人员织网到所有用户参与织网的创新民主化进程的生动注释,由此生成海量的、复杂的数据集合。与此同时伴随着各种随身设备、物联网和云计算、云存储等技术的发展,人和物的所有轨迹都可以被记录,数据因此被大量生产出来。互联网的核心网络节点由网页转化为用户,每个用户都成为数据制造者,短信、微博、照片、录像都是其数据产品;数据来自无数自动化传感器、自动记录设施、生产监测等设备,因此大数据的起始计量单位不仅仅是人们现在熟知的G、T,还可能是P(1P=1024T)、E(1E=1024P)或Z(1Z=1024E)这些数量级。大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十TB到数PB不等。

2.2速度快速度快,时效性强

大数据最为显著的一个特点是可以实时地从不断变化的动态数据中抽取用户所需要的信息且创建和移动数据的速度较快。在当代高速发展的网络环境下,软件性能优化促使了电脑处理器和服务器的升级,可以实现创建实时数据流的目标。信息资源管理不仅包括数据存储与检索的过程,还包括数据快速处理、分析数据并反馈给用户的过程,以满足用户的实时需求。大数据的多层结构使得大数据呈现出具有多种形式和类型的特点。其中,数据资源中的业务数据随时间的推演具备统一标准的格式,这种结构数据可以被专业的数据分析工具识别和分析。和传统的业务数据相比,大数据环境下的数据资源具有不规则性和模糊性等特点,如何从多种形式结构的复杂数据中挖掘所需要的资源是一个重要挑战。

2.3数据类型多种多样

当下,多种类型的数据源产生丰富多样的额数据类型和格式,早已不拘泥于传统意义上的结构化数据。数据类型主要包括结构化、半结构化和非结构化数据,其中,半结构化、非结构化数据逐渐占据了数据的主要部分。结构化数据是以二维表结构来实现逻辑表达的数据,其具有严格地数据格式与长度规范,可以使信息资源以更为标准化的形式展示在搜索结果中;结构化数据相较于普通纯文本结构性更强,在利用和提取方面,用户可以得到显著的便利;非结构化数据,是与结构化数据相反的,包括所有格式的办公文档、XML、HTML、各类报表、图片和咅频、视频信息等,在全文检索和各种多媒体信息处理领域被广泛应用。由于非结构化数据的非限定结构形式,使得这些数据较为灵活且丰富。因此,综合看来,在信息资源管理中,针对多样性的数据要求对数据的分析处理能力的方法也要多元化。22.4数据价值面密度低据价值面密度低,精确性不够用户所产生的信息中,有价值的信息数据所占比例很小,具有价值密度的高低与数据总量的大小成反比的趋势。相比于传统的信息资源管理模式,创新模式应体现在通过从大量不相关的各种类型的数据信息,挖掘出对未来趋势与模式预测分析有价值的信息,并利用机器学习、人工智能或数据挖掘等方法进行系统分析,挖掘其中的隐含的规律和知识,并在农业、金融、医疗领域进行广泛的应用,最终达到提升社会治理能力、提高生产效率、推进科学研究效果的目标。同时,来自不同数据源的社交数据、企业内容、交易与应用等数据逐渐兴起,信息资源管理的目标重点逐渐转向保障信息资源的真实性和安全性等方面。

3数据科学与信息资源管理的关联

3.1数据科学

1974年,著名计算机科学家、图灵奖获得者Peter首次明确提出了数据科学(DataScience)的概念:“数据科学是一门基于数据处理的科学”,并提到了数据科学与数据学(Datal⁃ogy)的区别——前者是解决数据(问题)的科学而后者侧重于数据处理及其在教育领域中的应用。从图1中可以看出,数据科学的各组成部分的成熟度不同:R的成熟度最高,已广泛应用于生产活动;其次是模拟与仿真、集成学习、视频与图像分析、文本分析等,它们正在趋于成熟,即将投入实际应用;基于Hadoop的数据发现可能会消失;语音分析、模型管理、自然语言问答等已经度过了炒作期,正在走向实际应用;公众数据科学、模型工厂、算法市场经济、规范分析等正处于高速发展期。

3.2数据科学对信息资源管理模式的影响

3.2.1思想意识的影响云计算、物联网、移动计算等新技术的兴起拓展了人们的数据获取、存储和计算能力,促使大数据时代的到来,成为数据学科诞生的必要条件。而新技术的应用意味着数据科学对信息资源管理模式的认识发生了根本性变化——不仅开始接受数据的复杂性,而且信息管理的理念从传统的完美主义转向现实主义,“数据在先,模式在后或无模式”的信息资源管理范式、BASE原则以及CAP理论等新理念已成为信息科学的基本共识。其次在大数据时代,数据成为一种重要力量,如何组织、挖掘和利用数据成为现代信息组织的核心竞争力,因此开拓大数据思维模式,意识数据的主动属性,重视数据的积极作用,形成数据驱动型应用、数据业务化、数据洞察和以数据为中心的思维模式

3.2.2信息技术的影响从知识体系看,信息资源管理主要以统计学、机器学习、数据可视化以及(某一)领域知识为理论基础,主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数据产品开发,如图2所示。基础理论主要包括大数据背景下的信息资源管理的新理念、理论、方法、技术及工具等。数据加工是为了提升数据信息质量、降低数据计算的复杂度、减少数据计算量并提升数据处理的精准度,对原始数据进行一定的加工处理工作包括数据审计、数据清洗、数据变换、数据集成、数据脱敏、数据归约和数据标注等。在大数据背景下,数据信息的计算模式发生了根本性的变化:从集中式计算、分布式计算、网格计算等传统计算过渡至云计算。数据管理是在完成“数据加工”和“数据计算”之后,还需要对数据进行管理与维护,以便进行“数据分析”以及数据的再利用和长久存储。数据分析通常以开源工具为主,与传统数据分析有着较为显著的差异。目前,R语言和Python语言已成为数据科学家应用较为普遍的数据分析工具。数据产品开发是数据科学的主要研究使命之一,具有以数据为中心、多样性、层次性和增值性等特征。

3.2.3主要应用场景的影响传统信息资源管理是在信息资源比较稀缺的时代背景下产生的,其应用场景是信息资源稀缺且被组织机构,例如政府、企业、图书馆等认为是其主要资源。但是,大数据时代的到来改变了信息资源管理理论的主要应用场景。首先在大数据时代,信息与数据不仅仅是一种“资源”,而是已成为“资产”。因此,信息资源管理应将信息资源作为一种“资产”来管理,而不能仅仅停留在“资源”层次的管理。资产和资源的区别在于,前者具有法律权属、劳动增值、财物价值和可直接市场交易等属性。因此,信息资源管理不能脱离于其人文、法律、道德、市场、经济环境。其次,信息和数据不再处于供给不足状态,开始进入一种富足供给的应用场景。因此,传统信息资源管理中重视的信息资源搜索、组织和检索等问题,已经不再是社会关注的主要问题。相反,如何在信息与数据富足供给时代,从大数据中快速洞见有价值的信息,并将其转换为行动才是新的关注点。因此,信息资源管理的应用场景已从信息资源的“搜索与检索”转向“洞见与增值”。最后,人们的信息需求不再局限于文书、文献、记录类数据,已拓展至图像、多媒体、视频、音频、富媒体等不同载体的信息资源。传统信息资源管理在文献载体类信息的管理方面取得了较大的成就,但是对其他载体类型的信息资源管理研究并不深入。因此,信息资源管理研究的应用场景已从“文献信息资源”的管理转向“大数据信息资源”的管理。

4信息资源管理模式创新

4.1“物联网+大数据”创新模式

物联网是面向全球的连接物品的信息基础设施,它是物与物之间、人与物之间的信息交换网络。继互联网之后,物联网急速扩展,渗透到人们生活的每一个角落。这一模式是由物联网和大数据等技术为支撑,以此面向信息服务,同时也是信息资源管理的一个重要组成部分。使用智能化设备替代人工,以及替代人工也不容易完成的工作,通过使用物联网、互联网、移动互联网技术,建立起一个智能化,低人工的智慧平台。该平台主要由5个部分组成:基础设施与感知单元、网络单元、数据处理单元、平台单元和应用单元。其中,智慧平台建设最基础的内容为基础设施与感知单元,由两个方面组成,即基础设施层和感知层。平台中产生的所有数据信息实体构成了基础设施层,而感知层的作用则是对各种数据进行识别、采集、监控,其通过芯片、可穿戴设备、传感器、摄像头等手段实现这一目标。所获取的数据通过网络层传入平台,网络层主要包括物联网的承载网络、广域互联网、局域网、移动通信网,网络设备等。网络层中获取到的数据由数据层进行管理。技术支持平台与外部接入平台组成了平台层。技术支持平台的功能主要包括两方面,一是实现感知系统的数据管理功能,二是执行业务过程中的引擎功能,三是传输、处理、转换业务应用方面的感知数据。其中,外部接入平台是电子商务中各种信息服务接口与信息系统对接的场所,其功能为实现各平台信息资源高效的共享与利用。应用层为基础设施层、网络层、数据层、平台层各个部分实现智慧应用的过程。应用层可以实现为用户提供辅助决策和决策建议的功能,向用户提供所需要的决策产物。最终,通过“物联网+大数据”模式提高信息资源管理的智能化与自动化程度,实现信息生态系统的动态平衡。

4.2“数据挖掘技术+信息资源”融合模式

数据挖掘与数据分析是大数据时代下充分利用信息价值的关键步骤。利用数据挖掘和智能分析等技术来提炼信息资源内在隐含的价值,以优化信息服务质量。海量的数据及复杂的数据结构,导致用户搜寻相关信息的能力受到了前所未有的挑战,用户在选择和利用数据的过程中遇到了知识迷航、信息巨量等问题,因此用户更希望以更加简洁高效的工具手段准确获取信息,这就要求结合数据挖掘、云计算和智能分析等大数据技术,在资源组织整合以及信息提供等方面实现高效化和智能化;数据价值密度低给大数据时代信息资源的输入端带来巨大的挑战,因此需要仔细甄别才能挖掘出有效数据以保证数据的真实可靠性,提升数据的利用价值;用户量陡增及其对信息资源的需求质量不断严苛是输出端所面临的问题,因此信息资源管理需要基于用户需求进行服务模式的转型。“数据挖掘技术+信息资源”的融合模式中,数据挖掘技术对于难以数字化的数据进行深度提取,发现隐含价值,通过高效利用数据来实现其最大价值。同时,云计算技术利用多个计算机对信息资源进行数字化组织和整合,使得信息的搜寻效率更高,更精确,最终满足用户需求,提升用户体验。

4.3“技术框架+用户核心”的信息服务模式

在信息爆炸的背景下,用户行为数据具有巨大的潜在价值,分析挖掘这些数据可以确定和划分用户的行为特征进而实现准确识别和把握用户需求的目标。根据不同用户的个性化需求,向其提供有针对性的需求服务。信息资源服务的核心目标是将大数据资源、技术与用户需求紧密结合,并采用合适的方式提供给用户。在新型技术框架和用户核心相结合的服务模式下,秉承以满足用户需求、精准信息推送为目标。技术框架由信息资源的信息服务集成创新技术、基于用户行为数据的信息服务界面创新方法、基于全网舆情数据的信息服务传递创新技术三部分组成。信息服务集成创新技术是归纳共性数据源的一种技术,其在跨模态数据创新服务整合的基础之上,集成所获取的核心数据集并对其进行综合分析,创建一种模型和方法将不同领域、不同结构数据按照同一标准融合集成进而提供针对性服务。基于用户行为数据的信息服务界面创新方法,这种技术可以构建Web挖掘分析模型,主要包括在线服务用户需求时空分布模型、需求满足度模型、页面点击行为模型、页面跳转行为模型、栏目关联度模型等,根据用户的个性化需求对服务内容进行改进、通过不同的用户行为对服务界面进行改进的方法体系。基于全网舆情数据的信息服务传递创新技术。这种技术主要由中文信息处理、社会网络分析、新事件探测、情感分析等舆情分析方法组成,通过指定方法实现信息传播中的关键节点的识别,高效精准的推送服务信息,提升互联网信息的推动力和影响力[9]。技术框架及以用户核心相结合的信息服务模式可以挖掘和识别用户的真实需求,会推动信息服务中以用户为中心的个性化信息服务的实现。

5结语

本文以大数据背景的信息资源特征为基本研究出发点,挖掘数据科学与信息资源管理的关联,并针对性地揭示和分析了大数据背景下信息资源管理的三种创新模式:①“物联网+大数据”创新模式;②“数据挖掘技术+信息资源”融合模式;③“技术框架+用户核心”的信息服务模式。在信息资源建设和资源服务方面的基础性研究相对比较成熟的基础上,充分利用正处于积极探索时期的数据挖掘和数据分析研究范式,以及正处于萌芽期的智慧服务,构建较为系统的管理模式,为大数据时代信息资源管理的可持续发展及研究提供知识参考依据。

参考文献

1朝乐门,邢春晓,张勇.数据科学研究的现状与趋势[J].计算机科学,2018,45(1):1-13.

2叶鹰,马费成.数据科学兴起及其与信息科学的关联[J].情报学报,2015,(6):575-580.

3孟广均.信息资源管理导论[M].北京:科学出版社,2008:89-121.

4朝乐门.信息资源管理理论的继承与创新:大数据与数据科学视角[J].中国图书馆学报,2019,45(2):26-42.

5黄双颖.大数据环境下网络信息资源的管理与利用研究[J].科技情报开发与经济,2014,24(21):102-104.

7屈芳,郭骅.“物联网+大数据”视阈下的智慧养老模式研究[J].信息资源管理学报,2017,7(4):51-57.

8赵丽梅,张花.我国大数据时代数字图书馆研究前沿分析——基于共词分析的视角[J].情报科学,2019,37(3):97-104.

9于施洋,王建冬,童楠楠.大数据环境下的政府信息服务创新:研究现状与发展对策[J].电子政务,2016,(1):26-32.

10崔金栋,杜文强,宋伟杰.信息生态视角下微博信息传播机理研究——以里约奥运会中国女排夺冠为例[J].情报理论与实践,2018,41(8):65-71.

11卢小宾,张淑君.我国信息资源管理专业人才培养模式研究[J].情报科学,2011,29(10):1452-1456.

12赵丽梅,张花.我国大数据时代数字图书馆研究前沿分析——基于共词分析的视角[J].情报科学,2019,37(3):97-104.

13任全娥.大数据背景下的文献计量学研究进展与学科融合[J].情报理论与实践,2019,42(1):48-52.

14蔡明灯,聂小武,谭震,张艳.借鉴新加坡图书馆管理模式促进株洲职教城信息资源共享的策略[J].图书情报工作,2018,62(S1):44-47.

15李月,董慧梅,侯卫真.动态环境下的跨系统信息资源管理模式研究[J].情报资料工作,2016,(2):51-57.

16李明子,丁其祥,陆太宁.基于卡方分析的图书馆非书信息资源管理模式比较研究[J].现代情报,2013,33(11):52-55.

17刘雅琼.国外高等教育信息资源共享的模式与运行管理[J].图书与情报,2013,(2):118-123.

18常永平.华东政法大学图书馆特色文献信息资源创新管理模式的探索[J].上海高校图书情报工作研究,2013,23(1):1-3.

作者:韩丽华 魏明珠 单位:吉林大学