本站小编为你精心准备了学术期刊影响力影响因素研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
学术期刊作为传播科研成果和展现科技水平的重要媒介,在促进科学知识的创新、科技成果的转化以及社会科技的进步等方面发挥着重要的作用。学术期刊影响力反映的是期刊所发表的学术成果能够促进学术研究和应用之发展的能力,准确地分析其影响因素,有利于了解影响因素指标间的内在结构关系,对期刊的评价工作和发展建设具有重要的意义【1】。
自美国已故著名学者加菲尔德博士提出将影响因子作为期刊排序指标以来,许多学者将影响因子作为衡量期刊影响力的指标,认为影响因子越大,期刊影响力就越大。将影响因子作为评价期刊影响力方面,于挨福等【2】利用面板数据建立多元回归模型,分析了期刊基金论文比、期刊的类型等指标对期刊影响力的影响;俞立平等【3】利用散点图、回归分析和分组统计的方法,系统研究了基金论文比、平均引文数、引用半衰期等指标与期刊影响力之间的关系;俞立平等【4】基于分位数回归模型,分析了期刊时效性等指标对期刊影响力的影响关系。有研究认为,影响因子衡量期刊影响力存在一定的缺陷,因此一些改良的新型影响力评价指标被陆续提出。Braun等【5】首次将h指数用于衡量期刊的学术影响力,李启正等【6】对纺织学科期刊的h指数、总被引频次和影响因子进行相关性和回归拟合分析。Egghe提出的基于h指数改进的g指数【7】用于评价期刊影响力,张垒等【8】则利用灰色关联分析法和相关性分析法分别研究h指数、g指数和影响因子与载文数、被引频次等指标的相关关系。特征因子的概念由Bergstrom【9】等提出并用于期刊的影响力评价,俞立平等【10】采用面板数据模型研究了期刊影响因子、总被引频次等文献计量指标对特征因子的影响关系。我国学者邵作运等【11】在载文量的基础上来计量被引频次,提出了一种新型指标f(x)指数评价期刊影响力,然后采用Spearman相关系数分析了f(x)指数与总被引频次、影响因子等指标的相关性。中国科学文献评价研究中心在2015年的《中国学术期刊影响因子年报》中,提出一个全新的评价指标:学术期刊影响力指数(AcademicJournalCloutIndex,CI)。该指标是评价各期刊影响力大小的综合性指标,它能够兼顾期刊的质量、规模、历史等因素,可以科学客观地反映出学术期刊的影响力【12】。丁筠【13】首次对期刊影响力指数进行了分析,并采用Pearson相关系数研究了CI与影响因子等传统指标的关联性。
根据以上研究,从影响力评价指标来看,期刊影响力指数作为一个新型文献计量指标,用于衡量期刊的影响力是科学合理的,因此本研究利用期刊影响力指数表征期刊影响力。从影响因素研究方法上看,多数学者采用相关系数或者线性回归的方法分析影响力与影响因素之间的关系,相关系数法忽略了指标之间的相互影响关系,普通线性回归方法又无法克服指标间多重共线的难题【10】。面板数据模型用于分析期刊影响力影响因素是一个很好的思路,但面板数据是一个时间维度上的二维数据,而期刊影响力指数在时间维度上能获取的数据有限。偏最小二乘回归(PartialLeastSquaresRegression,PLSR)模型适用于多变量、少样本的数据,同时能很好地解决指标间多重共线性的问题,是一种具有稳健分析效果的新型多元统计方法【14】,而在期刊评价分析领域,PLSR模型的应用还十分有限。基于此,本文通过建立期刊影响力的影响因素指标体系,运用PLSR模型对期刊影响力的影响因素进行系统的定量研究。
1指标构建及数据选取
期刊的影响力是多个方面因素的综合影响结果,其影响因素指标体系是由一系列具有内在关联的评价指标所构成,能够从多个层面反映出期刊影响力的实际情况,建立一个科学有效的指标体系对研究期刊影响力有重要的意义。本着科学性、完备性和适用性的原则,本文参考俞立平等【15】和黄贺方等【16】的研究成果,从期刊质量、期刊规模和期刊特征三个层面分析影响期刊影响力的因素。①期刊质量。期刊质量是表现期刊所发表成果的质量高低,质量越高,则认为期刊的影响力越大。期刊质量可以从文献被引用的情况反映,本文选取影响因子、五年影响因子、他引影响因子、即年指标和被引半衰期五个指标。其中,被引半衰期是一个反向指标,被引半衰期越短,时效性则越强。②期刊规模。期刊规模反映的是期刊所发表成果的规模情况,一般而言,期刊规模越大,其影响力也越大。本文主要选取复合总被引、可被引文献量、可被引文献比和总下载量四个指标。③期刊特征。期刊特征是期刊自身的一些特点,在这里选取基金论文比、平均引文数和Web即年下载率三个指标。同样,期刊特征指标越高,期刊影响力越大。
2PLSR模型原理与方法
PLSR是一种集多元线性回归、典型相关分析和主成分分析优势于一体的新型多元统计分析方法,最早由S.Wold和C.Albano等人于1983年提出并用于解决化学领域的相关问题【18】。PLSR模型在提取成分过程中,不同于主成分分析仅仅考虑解释变量的信息,还同时考虑到被解释变量的信息,能有效地提取系统中解释性最强的变量,从而得到更加可信的分析结果。相比传统回归模型而言,该方法不仅能够实现多因变量对多自变量的回归建模,在最终模型中还包含所有解释变量的信息,同时还能较好的克服因变量间的多重共线性和样本数据过少的问题【19】。近年来,随着PLSR理论的不断完善及计算机数据分析软件的推广,PLSR模型在诸多领域得到了较广泛的应用。
3实证分析
本文以期刊影响力影响因素指标x1~x12为解释变量,期刊影响力指数y为被解释变量,基于SPSS21.0和SIMCA13.0软件建立PLSR模型并进行实证分析。
3.1多重共线性的诊断
多重共线性是指解释变量之间存在的线性相关性质,在实际工作中,指标间的多重共线性是普遍存在的。如果在回归模型中存在自变量高度相关,即使自变量对因变量的解释效果很好,但是其回归系数的检验很可能是不通过的,会造成其估计量的不可信。
3.2成分的提取
PLSR模型只需要自变量X中的k个成分,这k个综合变量能最好地反映X中的信息,而且对Y的解释性也最强。
3.3特异点的识别
特异点的存在会对模型产生强大的拉动作用,能够显著地影响回归拟合效果。33.4回归模型的建立在SIMCA软件计算过程中,会自动对所有数据进行标准化处理,因此可以得到标准化后数据的PLSR模型。
3.5指标重要性的确定
指标投影重要性(VIP)用于衡量每个自变量对因变量作用的重要程度,指标的VIP值越大,说明其对因变量的解释能力越强,也反映出指标越重要。
4结果分析与讨论
为了分析影响期刊影响力的因素,本文以期刊影响力指数作为被解释变量,将解释变量分解为期刊质量、期刊规模和期刊特征三个层面共12个指标建立PLSR模型分析。实证结果表明,PLSR模型拟合效果很好,能够克服相关系数法和普通回归法的缺陷,有效地解决了少样本、多变量且指标多重共线的难题,分析结果与实际情况相符合。根据指标重要性大小可知,复合总被引、五年影响因子、他引影响因子和影响因子是最重要的影响因素,这反映出期刊质量是决定期刊影响力的关键因素;其次为总下载量、web即年下载率和基金论文比,同样能显著影响期刊影响力;即年指标和平均引文数不是主要因素;可被引文献量、可被引文献比和被引半衰期对期刊影响力的作用效果很小。
根据以上指标重要性的分析,可以为期刊提升影响力途径及期刊影响力评价指标选取提供一定的理论依据。根据以往学者的研究发现,在对期刊影响力与其他计量指标之间的关系进行研究时,都忽略了一个重要问题——样本特异点的筛选。本文在对图书情报类期刊的研究过程中,发现了中国图书馆学报和科技情报开发与经济两个特异点,作为指标严重偏离整体平均水平的样本,在分析时应该慎重选择。因为特异点的存在会很大程度上拉动分析结果,造成分析结果的不可信。比如综合人文社会科学领域的中国社会科学、经济学领域的经济研究等期刊,其影响力在相关领域拥有绝对权威,这类期刊某些指标会严重偏离整个领域的整体水平,应该作为特殊样本单独进行分析。另外还有一些期刊为了提升期刊影响力而采用加大发文量和自引率等手段,这样的结果会导致某些指标会很高并严重偏离整体水平,但其他指标相比整体水平仍然偏低,这类样本并不能客观反映出期刊影响力,同样应该剔除并单独分析。本文只是处于初级探讨阶段,还有待于进一步的深入研究。