美章网 资料文库 社会学理论下社会学网络的模型研究范文

社会学理论下社会学网络的模型研究范文

本站小编为你精心准备了社会学理论下社会学网络的模型研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

社会学理论下社会学网络的模型研究

摘要:社会网络的发展使人们的沟通变得越来越便捷,对社会学网络模型的研究不仅具备理论价值,它还具备极高的应用价值。但是,由于社会学网络中的数据是以稀疏形式存在的,再加上噪音数据与数据缺失等现象的普遍存在,这使传统的数据处理技术存在很大弊端与不足。同时,现阶段社会学网络的研究还尚未形成较为完善的社会学理论支撑。为此,本文便基于社会学理论和稀收学习方法对社会学网络模型进行深入的研究,以此有效处理社会学网络中所存在的稀疏数据之间的内在关系及其交互,为社会学网络模型提供足够的社会学理论支撑,以此帮助相关人员克服社会学网络模型中存在的技术难点。

关键词:社会学理论;稀疏学习;社会学网络;模型 

一、社会学网络的主要特征

社会学网络可以看作是虚拟世界的一种延伸形式,它相比于传统的信息网络来说,具备以下几个主要特征。首先,社会学网络具备社会性,社会性普遍存在于社会网络环境当中,其是与社会网络呈现共存关系的,它将社会网络环境中不同个体所具备的影响力与权威性之间的差异作为用户所自有的社会性特征。其次,社会学网络具备多维度特征,它可以从不同侧面对相同用户进行描述,进而使用户具备明显的多维度特征,同样,对于相同群体来说,也同样具备明显的多维度特征。再次,社会学网络具备较强的关联性特征,在社会网络中,用户与用户之间的差异使不同用户在行为上具备一定的联系,并借助于网络拓扑结构来实现不同用户之间的相互影响,进而使用户具备了较强的关联性特征。最后,社会学网络具备演化性特征,在社会网络的发展中,用户的状态及关系并不是一成不变的,而是处于不断更新中,这也使网络能够不断的产生新的信息,用户也能够对个人状态进行不断更新,同时建立新的社会关系,这也使社会网络中的用户具备了演化性特征。通过演化过程,能够使信息在社会网络中的传播得到不断扩大,进而使其在非常短的时间内就能进行大面积传播。虽然社会学网络的发展给人们带来了新的商业机会与沟通渠道,但由于社会网络自身所具备的这些特征,也使其在数据挖掘方法及分析技术方面和传统方式产生很大的不同,并且在社会网络不断发展的同时,也给人们带来了一系列需要攻克的技术难题,如符号网络的链接预测问题、短文本的主题识别问题、信任关系稀疏问题等,因此,需要利用新的方法并充分结合多种理论来对社会学网络模型进行深入的分析与研究,克服现有的技术难关,使其能够更好的满足用户日益增长所带来的社会需求。

二、稀疏学习方法及模型

1.稀疏学习方法近些年来,社会网络的发展与大数据的推广,给传统的机器学习带来了巨大的挑战,例如数据缺失、数据的规模庞大、数据的稀疏性等。数据的稀疏性在各个研究领域中普遍存在,例如在社交网络领域中,虽然用户是大量存在的,但这些用户之间的社会交互与社会关系相比于数据集合来说仍旧较为稀疏。机器在学习过程中,由于数据所具备的数据量大、冗余性、稀疏性等特征,使训练学习模型变得越来越复杂,并且所耗时间也越来越长,这也使其在适用性上越来越差,因此必须要找出相应的方法来解决上述问题。所谓稀疏学习方法,是将实际生活中的应用问题所具备的数据特征利用维度约简来进行稀疏表示,进而构建出解决问题的模型,利用稀疏学习方法能够有效提高与改善学习模型性能,从而使学习模型成为一种更加高效的数据挖掘与机器学习工具。

2.稀疏学习模型分析稀疏学习模型主要分为三种类型,分别是主成分分析模型、Lasso模型及矩阵分解。主成分分析模型能够从大量数据中对数据冗余及噪音进行有效去除,使获得的原始数据能够对事物特征进行最本质的反映,进而达到数据的降维处理与压缩目的。Lasso模型是在上世纪60年代提出的,它是LeastSquares模型的变体,该模型能够有效弥补传统特征选择方法中存在的不足,它通过惩罚函数的构造来建立相应的学习模型,并利用压缩系数对某些回归系数进行变小处理,这也使其具备子集选择与岭回归的优势。矩阵分解能够使矩阵分解以后变得更容易处理,矩阵分解具备很多性质,这也使其能够适用于不同的分解技术。最常见的矩阵分解技术主要有非负矩阵分解技术、奇异值分解技术、概率矩阵分解技术及低秩矩阵分解技术等。

3.稀疏学习算法分析在机器学习领域,除了需要具备能够对问题进行解决的模型以外,还要具备相应的优化算法。传统的优化算法能够使机器学习效果得到显著提高,但大数据时代的来临,使机器学习模型难以对数据稀疏及数据规模大这两大问题予以有效解决,这也使传统优化算法难以针对大数据的特点进行有效处理。而稀疏学习优化算法则是在传统优化算法的基础上演变出来的,它针对损失函数及正则化项的特殊构造含义及其作用,能够适用于大数据的特点来对优化问题进行有效解决。

三、基于社会学理论和稀疏学习方法的社会学网络的模型研究

1.LASSO稀疏学习模型研究在短文本主题识别方面的问题主要存在于短文本的信息量较少、表达语法不规范、关键特征较为分散、数据量大、更新速度快等问题,这也使经典机器学习方法难以对短文本进行有效处理。为此,本文通过构建稀疏学习模型来对噪音文本及短文本的分类问题进行形式化表示,然后对社会学理论文本关联关系及文本内容进行模拟,最终提出对短文本及噪音文本进行主题识别的相关解决方案。首先,采用Lasso稀疏学习模型中的多类别分类器来对多分类问题进行解决。为了使文本表示能够更好的应用到主题识别当中,应对文本进行预处理,如对停用词的移除,提取词干等。然后通过文本特征选择模型来对文本内容的特征空间进行表示。采用的特征空间主要有三个,分别是Unigram模型、TF模型及TF-IDF模型。为了对稀疏学习模型进行进一步的扩展,并通过社会情境来对主题进行识别,为此采用了两个社会学理论应用到主题识别当中,分别是偏好一致性正则化与社会感染正则化,并求解这两个社会学理论的目标函数。按照上述两个社会学理论的定义来建立主题识别的社会学框架,进而实现利用社会学理论并通过社会情景来对短文本及噪声文本进行主题识别的目的。

2.信任预测模型研究对于信任预测模型,应采用特征向量中心性方法来对用户的社会等级进行计算,然后对用户的社会等级进行排序,并根据社会等级理论来提出相应的社会等级正则化方法,并最终建立信任关系预测模型sTrust,通过上述步骤,能够有效解决社会网络在进行信任数据预测时所产生的稀疏性问题。具体内容如下,首先利用矩阵分解技术将原矩阵分解成三个低维非负矩阵,然后重构信任关系网络矩阵,即,这时由于信任关系网络矩阵过于稀疏,因此需要添加正则化项来避免出现过度拟合问题,在社会等级正则化中,要给出所应用的基本符号,并利用低秩矩阵分解方法来对用户与用户之间的信任关系建立的可能性进行分析,以此找出最小化社会等级的惩罚项,然后根据社会等级理论进行建模。

3.链接预测模型研究在矩阵符号网络预测模型中,需要将符号网络当成矩阵,然后采用矩阵分解方法与信任传播方法来对符号属性进行预测,该模型是以低秩矩阵分解法,结合社会学理论中的社会等级理论、结构平衡理论及交互情感理论来对相应的符号网络预测模型进行构建,进而达到对链接关系符号属性进行预测的目的。首先用邻接矩阵形式对构建符号网络进行表示,然后采用矩阵分解方法分析低秩逼近的相关表达方法,利用低秩矩阵相乘的方式来对符号网络矩阵进行重构,并将原矩阵中的缺失值进行补齐,由于这时的符号关系矩阵比较稀疏,因此需要添加正则化项方式来对过度拟合问题进行避免,进而达到对链接关系符号属性进行预测的目的。

四、结语

综上所述,虽然我国在社会网络中的情感分类、符号网络、信任关系预测及主题识别等方面取得了一系列的阶段性成果,但在社会学网络中仍旧存在许多问题需要得到进一步探讨。在未来的社会学网络研究工作中,将主要集中在对多数据源融合技术与垃圾用户识别方面,而这也需要众多学者的共同努力才能完成。当然,本文仅仅只对基于社会学理论和稀疏学习方法的社会学网络模型进行了浅要的研究,并没有对有效性进行验证,这也需要在后续的工作中逐步得到完善。

参考文献:

[1]黄立威,刘艳博,李德毅.基于深度学习的推荐系统[J/OL].计算机学报,2017:1-29.

[2]赵海燕,韩松,陈庆奎,曹健.考虑社会关系影响差异和动态性的社会化推荐[J/OL].计算机应用研究,2018(9):1-2.

[3]王鑫,王英,左万利.基于交互意见和地位理论的符号网络链接预测模型[J].计算机研究与发展,2016,53(4):764-775.

作者:王勤 单位:安徽省合肥市肥东县委党校