本站小编为你精心准备了原燃料结算的数据挖掘论文参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
1问题定义
对原燃料结算方式进行数据挖掘的目的是为了控制结算成本,采用的方法是根据超出我方检斤检质结算量属性对原燃料进行分类,构建原燃料结算控制模型。
2数据准备
数据收集:需要严格控制我方检斤检质的过程以作为判断的依据,同时尽可能多的从事物数据库中收集各种原燃料按不同结算方式所得到的结算量属性值。数据预处理:首先根据经验去掉明显有误的数据;其次根据原燃料结算方式,选择与数据挖掘相关的属性。数据变换:对数据进行相应的变换,从初始特征中找出真正有用的特征。在本次数据挖掘中原燃料属性主要包括:原燃料种类,供方检斤检质结算量,我方检斤检质结算量,供方检斤检质与我方检斤检质之间的结算量差别。然后根据我方检斤检质结算量与供方检斤检质结算量之间的差别作为分类的依据,对上述属性进行归一化[1],得到表1、表2数据。SupQty表示供方量,SupH2O表示供方水分,Qty表示我方量,H2O表示我方水分,SupInsQty表示供方检斤检质量,in-sQty表示我方检斤检质量,calculQty表示供方检斤检质量与我方检斤检质量之间的差值。
3数据挖掘
通过编程实现K均值聚类方法[6]来处理表2数据。此K-均值算法是发现给定数据集的k个簇的算法,每个簇通过其质心(centroid),即簇中所有点的中心来描述。首先,随机确定k个初始点作为质心,然后将数据集中的每个点分配到一个簇中,具体来讲,就是为每个点找距其最近的质心,并将其分配给该质心所对应的簇。这一步完成之后,每个簇的质心更新为该簇所有点的平均值。根据实际情况,本文K均值法采用3个初始点作为质心,按归一化我方检斤检质和归一化超出我方检斤检质量作为分类属性,得到3个类的质心坐标,结果如表3,同时得到每种原燃料的分类图,如图1。
4结果解释和评估
从分析结果可以得出,原燃料C、D、E属于第0类,F、H属于第1类,A、B、G属于第2类。其中第2类是结算量严重超出我方检斤检质的量,对于这类原燃料,企业需要重点关注,这类原燃料可能是市场供应商较少,但是企业需求量较多的,所以企业需要采取相应的措施,增大采购寻源的范围,与供应商可以签订长期的采购合同已降低采购成本,并提出另外两种结算方式:供方检斤我方检质、我方检斤供方检质的结算方式,从而达到降低此类原燃料的采购成本。第1类原燃料是结算量小于我方检斤检质的量,对于此类原燃料可能是市场供应量大于企业需求量,企业需要跟此类供应商进行长期合作。第0类原燃料是结算量稍微超出我方检斤检质的量,对于此类原燃料,企业需要在与现有供应商保持合作的同时,去寻找其他供应商,尽可能地降低采购成本,提高企业的经济效益。
作者:汪光阳赵睿高天单位:安徽工业大学计算机与技术学院