美章网 资料文库 借阅数据的图书推荐研究范文

借阅数据的图书推荐研究范文

本站小编为你精心准备了借阅数据的图书推荐研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

借阅数据的图书推荐研究

【摘要】本文以哈尔滨商业大学图书馆为例,通过对图书管理系统借阅数据进行聚类分析,揭示读者群体的需求结构,了解其文献利用情况,归纳其用户偏好模型,以提高推荐策略的准确度,有针对性地为读者提供个性化服务。

【关键词】数据处理;聚类分析;读者群;个性推荐

随着数字化信息量的成倍增长,图书馆服务质量也受到影响。读者面对海量的信息,需要花费更多时间找到自己真正所需。怎样高效、迅速、主动地为读者提供其所需信息,已成为当今图书馆建设过程中亟待解决的问题。数字图书馆的个性化推荐是通过主动服务的方式,根据读者的不同需求,有针对性地提供服务,使读者能够快速、准确地发现自己所需要的图书[1]。它主要通过跟踪和分析读者的行为记录,建立读者的借阅偏好模型,并区分读者群,有针对性地进行书籍推荐,这样既能帮助读者快速、准确地找到所需信息,同时也提高了图书馆的馆藏利用率,增加了读者对图书馆的满意度[2]。

1研究方法

1.1数据预处理在进行数据挖掘之前,需要对原始数据进行预处理,对数据进行清洗,把数据中不正确的、不完整的、不一致的、格式不同的进行处理,处理成为标准的数据结构和格式,如图1为原始数据需要做预处理的流程[3]。数据预处理是构建数据仓库的第一步,在数据挖掘过程中是非常重要的步骤。它可以改进数据质量,有效提高数据挖掘的精准度。

1.2聚类分析方法聚类分析主要是根据读者的共同偏好划分读者群,清晰掌握读者群体的信息需求,把资源进行合理优化。利用读者群,能够更好地为读者开展个性化推荐服务;根据读者群可以很好地了解读者对信息资源利用状况的活跃度,为图书馆信息资源的宣传与培训提供依据[4-5]。读者群聚类可以分别基于图书类型和图书借阅频次进行[6]。基于借阅图书类型聚类是从读者需求角度进行细分,基于借阅频次聚类是从读者活跃度的角度来实现读者细分。

2实例分析

本文样本是哈尔滨商业大学图书馆借阅数据,包含读者数据、图书数据、借阅情况等,是反映读者信息的重要依据。

2.1读者数据预处理读者数据包含姓名、年级、院系、专业等属性,这些属性是对读者划分的重要依据,可以将读者区分为不同群体。

2.2聚类分析我们把读者信息数据和借阅信息数据作为对象,利用上面模型进行读者聚类分析。经统计,哈尔滨商业大学图书馆从2016年3月到2017年3月借阅人次13686,提取原始借阅记录248491条,有效读者29842人。图书馆图书管理系统数据库为ORACLE,依据聚类分析流程图,将预处理后的数据转换为标准数据结构,然后利用SPSSClementine平台进行聚类分析[9]。

2.3图书推荐可以清楚地看出每类书籍的热门排行。依据聚类分析结果,每位读者的类属关系和兴趣,进行相应图书的批量推荐。

3结论

随着信息量的剧增,为了给读者提供更加精确的个性化推送服务,本文以图书管理系统数据为研究目标,利用聚类的方法对读者群体进行划分;建立用户偏好模型,根据数据库中读者的借阅、续借和归还等操作行为所产生的记录,对这些记录信息进行综合分析,了解读者的图书借阅喜好,建立不同的读者群,按照兴趣度,根据各类图书排名进行相应的图书推荐。通过聚类分析结果,哈尔滨商业大学的读者群体以文学类、社科类、经济管理类书籍需求量为最大,其中文学类书籍利用率最高。通过此种推荐策略,能够更好地为读者提供个性化服务。

参考文献

[3]柴彦.基于共词聚类分析方法的知识管理国内研究述评[J].情报科学,2015(4):149-153.

[4]闵超,孙建军.学科交叉研究热点聚类分析———以国内图书情报学和新闻传播学为例[J].图书情报工作,2014(1):109-116.

[5]熊海涛.面向复杂数据的推荐分析研究[M].北京:北京理工大学出版社,2015:15-16.

[6]郭秋萍.企业数据挖掘理论与实践[M].郑州:黄河水利出版社,2005:54-56.

[7]腾广青,毕强.基于概念格的数字图书馆用户市场细分———数字图书馆用户的概念聚类分析数字图书馆[J].现代图书情报技术,2010(2):7-11.

[8]朱东郡,等.基于标签聚类和兴趣划分的协同过滤推荐算法[J].计算机工程,2017(11):146-151,160.

[9]李新广.数字图书馆的用户偏好模型及个性化推荐研究[D].武汉:武汉大学,2011.

作者:闫俊霞 单位:哈尔滨商业大学图书馆