本站小编为你精心准备了谈免疫原理下纸质资源差异性需求参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
摘要:[目的/意义]针对需采集评价体系指标数据进行二次处理的传统纸质资源评价方法,提出一种基于免疫原理的差异性需求实时提取模型。[方法/过程]对借阅记录分类号编码,进行连续位匹配阴性选择,系统将生存期内达到活化阈值的需求提交确认,得到纸质资源采购需求库。[结果/结论]经验证,该方法能及时发现用户新需求,模型应用较传统方法实时有效。
关键词:纸质资源;差异性;用户需求;免疫原理
引言
随着网络技术和用户终端技术的快速发展,网络承载的信息量不断扩大,阅读也呈现泛在化趋势,但是这并不代表纸质资源可以消亡。纸质资源凭借着对客户端的零投入、零依赖、随时随地,成为图书馆读者不可取代的资源获取方式。在高校评估的各种体系指标中,都有对纸质图书的具体要求。[1]如何采购到读者需要的纸质资源是一个值得探讨的课题。要了解随着专业建设和热点不断变化的纸质图书使用情况,就需要对用户群体借阅中新增需求进行实时跟踪。[2]传统的资源评价方法通常是通过建立评价指标集,采用直接问卷调查法或模糊综合评价和层次分析法(AHP)[3]对所采集的评价体系指标数据进行处理。这些方法能够较好地对资源使用情况进行综合评价,但是却无法及时发现用户的实时需求变化。差异性用户需求提取就是对新产生的不符合预期需求的用户特征进行提取,以便分析当前纸质资源使用用户的新需求。本文提出一种基于免疫原理的纸质资源差异性用户需求提取的新方法。该方法借鉴自然免疫系统识别“自我”和“非我”的原理,将符合预期的用户群体特征作为“自我”,不符合预期的新增用户群体特征作为“非我”,通过图书分类号非我选择等机制实现纸质资源差异性用户需求的快速检测提取。
1基于免疫原理的差异性用户需求识别
1.1差异性用户需求识别中应用的免疫机制
在生物免疫系统中,病原体包括病毒、细菌等对人体有害的物质。面对病原体对人体的入侵,人类进化出了适应的、多样的、分布的维持生存和健康的机制,这就是免疫系统。免疫系统最为关键的机制,在于机体了解病原体特征,能够识别“自我”和“非我”。目前,我们考虑在纸质资源差异性用户需求识别中借鉴的免疫原理有[4]:(1)决定簇序列识别机制。生物多样性由其所构成蛋白分子的结构决定。氨基酸序列的排列组合,构成平面或三维空间的决定簇。决定簇的各种组合表达了正常细胞受体模式。(2)多样性受体编码模式。基因库编码重排,生成所有可能的多样性受体,从而产生对每一种病原体进行特异性识别的受体。这是一种全覆盖的多样性模式编码方法。(3)高度局部化的阴性选择检测机制。生物体淋巴细胞针对病原体抗原产生免疫反应,淋巴细胞在识别受体后通过阴性选择过程,将识别的自身抗原淋巴细胞程序性死亡,保留非自身抗原的识别,并采用局部产生局部处理的分布式即时方式。
1.2编码设计纸质资源的差异性
用户需求提取模型,设计了以纸质图书中图分类号为分子结构的“抗原库”。用于差异性特征识别的抗原由ILAS图书自动管理系统中纸质图书流通借阅记录中的分类号编码组成。中图分类法第一大类为A~Z,总计22个。按二进制编码方式,总计长度5位(如表1所示)。在中图法第二级分类中,一般范围为0~9,仅T类(工业技术)的二级分类为B~V,最多个数为16个,依次为00001~10000,长度为5位;第三级、第四级分类均为0~9,共10个小类,依次为0001~1010,长度均为4位;第五级、第六级、第七级分类均为1~9,共9个小类,依次为0001~1001,长度均为4位。综上,在该模型中纸质图书中图分类号编码长度共计30位。[5]
1.3基于免疫原理的差异性
需求提取模型设计在纸质资源差异性用户需求提取中,我们研究了Forrest,Hofmeyr小组基于免疫机制的入侵检测模型。[6]纸质资源用户需求抗原库为最近T天内借阅记录中,中图分类法分类号按上述二进制编码的定长为l(本模型为30位)的集合S.检测子与抗原的特异性互补判断,是以定长l位的连续位匹配函数来模拟。设p是判断2个二进制位串连续位是否匹配函数,r为最小连续位匹配长度,F为长度为l的所有二进制中图分类号编码字符串集合。[7-8]基于免疫原理的差异性需求提取模型结构如图1所示。设r=30,进行全位匹配。当有纸质资源新需求分类号记录出现时,就会有通过阴性选择过程的成熟阴性检测子{d│d∈F,坌s∈S,p(d,s)=0}生成。将产生的差异性阴性检测子识别的有效需求模式元记录放入“记忆需求集”中,并分布于图书自动化管理系统。我们给“记忆需求集”定义一个生存周期,如果在生存周期中,某个模式元计数达到成熟活化阈值lim时,系统发出识别差异性用户需求信号,由纸质资源采购人对系统需求信号进行确认后,该差异性用户图1基于免疫原理的差异性需求提取模型结构需求模式进入纸质资源采购需求库,明确为误报的模式元直接舍弃。若采购人在“记忆需求集”生存周期中,未对模式元进行回应,那么新产生的模式元将取代“记忆需求集”中出现时间最早的记录。设置动态“记忆需求集”的作用在于发现学科专业建设及技术发展对纸质资源最新持续性递增的真实需求,排除纸质资源临时突发的“一次性”需求。
2模型系统搭建及实现
2.1系统结构
基于免疫原理的纸质资源差异性用户需求提取模型,对流通分类号进行七级分类编码,通过连续位匹配函数阴性选择,对生存周期中活化需求进行记录,最终形成纸质资源采购需求库。我们在VisualStudio.NET2008环境中,使用C#编程语言,实现了模型主要功能。对分类号编码模式元均采用字符串类型string,对七级分类编码表的第一级和第二级由于其特殊性,采用字符串数组进行定义,第三级至第七级为“0”到“9”可通过计算依次递增编码。其中第一级和第二级特殊编码数组定义,如图2所示。分类编码中的第一级和第二级长度为5位,第三级至第七级长度为4位。逐位取分类号,通过查找记录编码位置,用C#函数Convert.ToString()转换为对应的二进制编码,对于位数不足的情况,定义函数privatestringfillZero(stringstr,intlocation),在高位用“0”进行填充。将实时的图书流通分类号编码后,与近期流通分类号编码集合进行字符串比对string.Compare(),有差异的需求进入记忆需求集,对生存周期进行判断,在生存周期的模式元计数加1,达到活化阈值后提交采购人,确认后的结果放入纸质图书采购需求库。
2.2模型应用
在VisualStudio.NET2008环境中,模拟最近120天内纸质图书借阅记录集为抗原库,生存周期为30天,模式元活化阈值为100,进行纸质资源差异性用户需求提取。在达到设置标准后,模型发出信号,显示预期的编码模式元及所属分类号,提交采购人确认(见图3),确认后的结果进入采购需求库(见图4)。在模型运行期间,正值全国职业院校技能大赛广东赛区信息安全管理与评估、电子产品芯片级检测维修与数据恢复和互联网金融赛项进行阶段,其中TP393.08计算机网络安全、TP309.3数据备份与恢复、F830.49信息化与新技术的应用,是我校参赛项涉及的主要参考纸质资源。根据运行结果,基于免疫原理的纸质资源差异性需求模型能自动识别新产生的不符合预期的阶段持续性用户特征,发现读者的实时需求变化,形成有效的需求集。
3结语
针对纸质资源需求识别需要采集评价体系指标数据进行二次处理的传统方法,本文研究了免疫原理中的识别机制、编码模式和选择检测机制,对纸质图书流通借阅记录中的分类号进行编码建模,进行连续位匹配阴性选择,系统将生存期内达到活化阈值的需求提交确认,得到纸质资源实时采购需求库。该方法能及时发现用户纸质资源新需求,无需再次收集分析评价指标数据,提高了纸质资源需求获取的时效性和文献采访的有效性。
参考文献
[1]赵勇,李晨英.高校图书馆纸质资源建设效率评价方法研究:基于教育部高校图书馆事实数据库统计指标的实证分析[J].图书馆建设,2012(6):26-30.
[2]朱前东.美国高校图书馆资源发现系统评价实践与分析:以美国2所高校图书馆为例[J].国家图书馆学刊,2015(1):94-99.
[3]邵然.基于层次分析法的图书馆数字资源服务质量评价体系构建[J].图书馆学刊,2017(3):25-28.
[4]周光炎.免疫学原理[M].3版.北京:科学出版社,2013:14,405.
[5]辑委员会国家图书馆中国图书馆分类法.中国图书馆分类法[M].5版.北京:国家图书馆出版社,2010:18,1019.
[8]赵俊忠,黄厚宽,田盛丰.免疫机制在计算机网络入侵检测中的应用研究[J].计算机研究与发展,2003(9):1293-1299.
作者:伍星 张俊威 单位:深圳信息职业技术学院图书馆