本站小编为你精心准备了电子商务消费行为论文参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
一、粗糙集理论
(一)粗糙集的下近似集和上近似集K=(U,S)为给定的知识库,U表示论域,S为U上的等价关系簇,则XU和U上的一个等价关系R∈IND(K),子集X关于知识R的上近似和下近似的定义分别为。其中,U为论域,表示整个区域包含的元素;论域在等价关系R下的分类模式U/R表示图1中的所有方格组成的集合;R为等价关系,图中为划分整个区域的横竖线。
(二)知识约简知识库中的知识并不是同等重要的,有些知识是冗余的。知识约简是将一些无关或多余的特征丢掉,在不影响其原有的分析预测功能的前提下,将信息量减少,即在不影响原知识分类的情况下,将n维信息空间{x1,x2,…,xn}减小为m维{x1,x2,…,xm}(m<n)。通过知识约简,将得到的特征信息进行重新组合而产生新的决策规则,利用该规则进行推理得到的结果与约简前的特征信息所产生的决策规则推理得出的结果一致(张艳荣,2012)。以下为约简与核的定义,它们是知识约简中两个最基本、最重要的概念。对于知识库K=(U,S)和K中的一个等价关系族PS,任意的GP,若G是独立的,且IND(G)=IND(P),则称G是P的一个约简,记为G∈RED(P)。其中,P的全体约简组成的集合用RED(P)表示。令P为一个等价关系族PS,R∈P,如果IND()P=INDP-{R()}成立,则称R为P中不必要的;对给定的知识库K=(U,S)和知识库中的一个等价关系族PS,对任意的R∈P,若R满足INDP-{R()}≠IND()P,则称R为P中必要的。P中所有必要关系组成的集合称为P的核,记作CORE(P)。
(三)知识表达系统在智能数据处理中,知识表达占据极其重要的地位。知识表达系统是粗糙集理论中主要的知识表示方法,其基本成分是研究对象的集合。我们可以采用指定对象的基本特征和属性来进行描述,表示为S=(U,A,V,f),通常用S=(U,A)来代替。其中,U表示对象的非空有限集合,即为论域;A表示属性的非空有限集合,即为属性集;V=∪a∈AVa,Va表示属性a的值域;f为U×A→V是一个信息函数,其为每一个对象的每个属性赋予一个信息值,即a∈A,x∈U,f(x,a)∈Va。这样定义的知识表达系统可以方便地用表格表达来实现。知识的表格方法可以看成一种特殊的形式语言,它用符号表达等价关系,这样的数据表成为知识表达系统。
(四)决策表若知识表达系统S=(U,A,V,f),其中A=C∪D,C∩D=,C表示条件属性集,D表示决策属性集。决策表是具有条件属性和决策属性的知识表达系统,如表2所示。
(五)属性重要度每一个决策表中的属性在做决策和数据分类时,其角色是不一样的,所起到的作用也不尽相同。为了更好地计算这种属性的重要度,我们可以采取的方法是逐一去掉每个属性,进而检测这个决策系统在做决策和分类时,是否会因为移掉了这个属性而发生明显的改变。如果去掉该属性后,整个系统的决策发生了明显的改变,那么这个属性就具有相当的重要性,计算的重要值越大,表明该属性越不可删除;反之计算的重要值越小,其删除该属性的可能性越大。下面用正区域概念来表达这种思想:关于由属性集C引入的分类,其属性子集B''''B的意义就是重要度的描述,用这种差来表示:dB''''-B(c)=rB(c)-rB''''-B(c),该式表明,如果去掉这个属性子集B'''',用属性B的方法分类个体,其正区域是如何被影响的。若B''''是一个属性,则说明丢掉这个属性,其正区域是如何被改变的。
粗糙集作为一种数据处理的分析方法,可在保持知识分类能力不变的情况下,通过对知识进行约简,得出问题的分类或决策规则(张宇、韩春怡,2007)。故本文将粗糙集理论应用到电子商务顾客消费行为的预测中,利用约简算法删除冗余的条件属性,对电子商务消费行为的条件属性集进行约简,得到必要的条件属性集;利用改进的消费行为预测的规则约简算法对电子商务消费行为预测的规则进行提取并进行约简,得出电子商务顾客消费行为的决策规则。基于粗糙集理论的电子商务顾客消费行为预测具体操作过程如图2所示,主要包括以下几个步骤:(1)通过对电子商务消费数据的收集、完备化及离散化,完成对电子商务顾客消费行为预测基本数据的预处理;(2)去掉电子商务顾客消费行为的冗余数据信息,完成对顾客消费行为预测的条件属性集的约简;(3)通过对电子商务顾客消费行为预测的规则进行提取与约简,得出必要的消费行为预测规则集;(4)通过计算规则的置信度与覆盖度,进行规则过滤,得到电子商务消费行为预测的决策规则。
(一)模型构建与算例1.粗糙集理论模型利用粗糙集理论对电子商务消费行为预测数据进行分析之前,首先要对数据进行预处理,收集有效数据,建立电子商务消费行为预测信息表。将所有的消费行为预测数据汇总到一个信息系统里,其可以用二维表来表示。信息表的行对应各对象及其各属性的值,列对应各属性及各对象的属性值。进而将需要处理的数据放在汇总的信息表里。本文根据电子商务消费行为预测过程以及预测的特点,建立了电子商务消费行为预测知识表,进而构建电子商务消费行为预测体系。在此之前,将顾客消费行为预测的参数值汇总到一个知识表之中。汇总后的电子商务消费行为预测信息表的格式如表3所示。2.算例原始数据选取和离散化处理本文以电商网络平台记录的顾客特征作为应用实例来介绍粗糙集理论在电子商务消费行为预测中的应用。经过优选,选出相关程度较好的3个购买因子,即顾客年龄、教育水平和收入,以此作为条件属性,研究2005~2013年某电子商务平台顾客购买产品特性,并推测未来该电商平台顾客购买产品的特性。根据粗糙集理论的要求对各个属性的数值进行离散化。对每组数据采取高、中、低分类,高用Y表示,中用H表示,低用N表示。年龄分为高、中、低3个等级,40岁以上为高,20-40岁为中,20岁以下为低;教育水平分为高、中、低3个等级,硕士及以上为高,大学(本科、专科)为中,高中及以下为低;收入水平(月收入)也分为3个等级,10000元以上为高,5000-10000元为中,5000元以下为低;购买商品类别为1和2类。初始决策见表5。
(二)条件属性集的约简1.约简算法描述采用差别矩阵方法对属性集进行约简。考虑到差别矩阵中如果含有单属性元素,则不能求出约简的决策表,因此本文对电子商务顾客消费行为条件属性集的约简采用一种改进的基于差别矩阵的属性约简算法。该算法首先通过计算决策属性对条件属性的依赖度来对决策表中的数据进行初步处理,再充分利用差别矩阵的优点,快速计算决策表的核,并依据属性的重要度及约简可信度的值,获取合理规则。通过上述过程可知,在电子商务消费行为分析中,可在知识系统分类能力不变的前提下,对不必要的属性进行约简,再对规则进行提取与约简,最后得出确定性的规则,这样企业可以很清晰地知道哪些属性是需要深刻掌握的,哪些属性并不能明显地影响到顾客的购买行为,以避免企业在制定电子商务营销决策时对这些属性投入过多的精力。通过粗糙集电子商务消费行为的预测,我们可以帮助企业制定更加契合实际的电子商务营销决策,把有限的人、财、物用于提供更加具有竞争力的产品,从而满足顾客需求,创造最大化的顾客价值。
三、结论
本文采用了一种改进的基于差别矩阵的属性约简算法对电子商务消费行为预测条件属性集进行约简,并对产生的规则进行提取与约简,得出了一种新的基于粗糙集理论的电子商务消费行为预测方法,该方法取得较好的实际效果。
作者:张艳荣于晶赵志杰单位:哈尔滨商业大学计算机与信息工程学院黑龙江省科学技术馆