本站小编为你精心准备了基于大数据的网络信息论文参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
网络信息资源是指计算机或信息终端等以通信为手段通过网络再现出来的集声音、文字、图像于一体的各类信息资源的总和,其实质是电子出版的高级形式,大数据的到来构成了网络信息资源的多个来源,特征如表2所示。由于我国网络信息资源建设相对较晚,虽着手进行资源调优,但在挖掘有效的网络信息方面,还存在着诸多问题,如:数据结构的处理不健全、缺乏深层挖掘研究、度量模型的不健全或缺失等。
2相关概念
本节以“文献”为例,介绍大数据时代下网络信息资源所呈现的社团模式及其概念。定义1.文献网络信息资源(LNIR)LNIR=<ArtID,ArtN,AutN[],Abst,Keys[],Clc,Doc>,其中,ArtID是文献编号,具有唯一值;ArtN是文献名字;AutN[]是文献作者及其相关信息,可具有多个值;Abst为文献摘要;Keys[]为文献关键词,可具有多个值;Clc为文献的中图分类号;Doc为文献的标识码。定义2.作者社团(LNIRAS)设LNIRi与LNIRj组成一个作者社团当且仅当(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.AutN[]∩LNIRj.AutN[]≠NULL)。定义3.关键词社团(LNIRK)设LNIRi与LNIRj组成一个关键词社团当且仅当(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.Keys[]∩LNIRj.Keys≠NULL)。定义4.主题社团(LNIRAN)设LNIRi与LNIRj组成一个主题社团当且仅当(LNIRi.ArtID≠LNIRj.ArtID)∩(Compare(LNIRi.ArtN.getString(),LNIRj.ArtN.getString())≠NULL)。定义5.分类号社团(LNIRCL)设LNIRi与LNIRj组成一个分类号社团当且仅当(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.Clc.trimNums()=LNIRj.Clc.trimNums())。
3网络信息资源社团及模型
由于大数据时代网络信息资源的急剧暴增,使得网络信息资源的价值密度备受关注。将网络信息资源分类整理,不仅信息量过于庞大,而且由于学科之间的交织或科研需要,各个分类之间也是紧密联系的。现本文就文献网络信息资源所形成的模型做简要介绍。假设有5篇文献,根据定义1,设这5篇文献如图1所示;可分别形成作者社团(见定义2)、关键词社团(见定义3)、主题社团(见定义4)、分类号社团(见定义5)。本节列举作者社团与关键词社团,其中,设作者社团的度为1,即可以形成以1个或以上的作者为中心的社团;设关键词的社团为2,即可以形成2个或以上的关键词为中心的社团。图2列举了图1中A1、A2、k1、k2、k3形成的社团如图2所示。由图1可得,作者社团有:LNIRAS(A1,A2)={LNIR1,LNIR4};LNIRAS(A1)={LNIR1,LNIR2,LNIR4};LNIRAS(A2)={LNIR1,LNIR3,LNIR4,LNIR5};关键词社团有:LNIRK(k1,k2,k3)={LNIR1};LNIRK(k1,k2)={LNIR1};LNIRK(k2,k3)={LNIR1,LNIR5};LNIRK(k1,k3)={LNIR1,LNIR3}。由此可以清晰得看出各个网络资源及其之间的关系,为海量数据的挖掘提供了便利。
4结语
本文首先介绍了大数据的概况与网络信息资源目前的概况,然后提出了本文所描述的相关概念,最后举例说明了大数据中网络信息资源的社团模型,为后续对大数据中关联数据的处理及有效信息的挖掘提供了模型。
作者:冯秋燕单位:河南财经政法大学