本站小编为你精心准备了随机森林的半导体排产思考参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《电子器件杂志》2014年第三期
决策树是随机森林算法的基本单元,决策树的构造是由一个随机向量所决定。随机森林算法的本质是组合多个弱分类器(决策树),使其误差减小的一种分类算法,一般采用二叉决策树作为基本模型,其模型如图1所示。由于二叉决策树只能对数据进行2分类,针对多类数据需对二叉决策树进行节点多分叉,形成每个节点多次分叉的过程,从而构造了多叉决策树模型。随机森林的生成过程分以下4步:Step1(Bagging过程):假设每类训练集中有N个样本,有放回地随机抽取n个样本,作为一棵决策树的训练样本。Step2(分裂属性选择过程):假设特征向量是m维,选取m1维作为子集指定给每个节点,从m1中选择分类效果最佳的一维特征作为接点的分类属性,且保证在随机森林的生长过程中m1保持不变。采用信息熵作为判断节点分裂属性选择的依据,设数据集种类为m,任意一个数据集的分类概率为Pi,则信息熵表达式H(X)为从以上步骤可以看出,随机森林算法的误差更为稳定,克服了单一决策树的不足,体现了多个弱分类器合成强分类器的优势。
2算法的实现
粗日排产控制的主要任务是根据周计划投产品种和数量信息,进行日投产品种和数量的确定。企业中常用的粗日投料策略主要有两种:基于投产品种平均分配的投料策略和基于品种投产量平均分配的投料策略。基于投产品种平均分配的投料策略,对周计划以品种为单位进行拆分,确定日投产品种;基于投料量平均分配的投料策略,将周计划中的各个品种的投产数量平均分配到每日。该两种方法都未考虑品种更换对生产的影响,导致实际生产“改机代价”较大。本文提出采用基于随机森林的排产控制策略,以降低改机代价为目标,首先对周计划投产品种进行聚类分析,然后在此基础上,采用基于品种平均和投产量平均的综合策略,确定每日投产品种和各个品种的投产数量。
2.1分类因素提取与确定(1)分类属性及权重确定。分析半导体生产中,“改机”影响因素有:圆片尺寸、装片胶、框架型号、模具、塑封料、等。不同属性影响品种更换的代价不同,如模具更换需要约4h的时间,而塑封料更换仅需要15min左右的时间,利用赋权的方式对各个属性的“改机”代价影响程度进行给定,假设单位改机时间代价为t,各个因素的权重因子为ω1,则各因素的“改机”代价如式(2)所示:(2)分类类别个数m的确定。我们将周计划中投产的不同半导体作为分类依据,根据不同的半导体种类进行类间分类,设半导体的类别个数为m。(3)投产量对分类结果的影响。一般来说,车间中各个类型的产能基本均衡。本文假设半导体生产工序的各个类型的产能均衡,考虑品种投产量对品种划分的影响,对每一类别内品种投产量总和进行限定,保证聚类后,各个类别的投产量也基本均衡,则每个类别中的总产量约为。
2.2基于随机森林的排产模型我们以品种名称、投产量、交货期和所属类别作为半导体排产的特征信息,设Xi是每类半导体的特我们将半导体的生产类别个数m作为分类数量,将不同种类的半导体特征向量作为训练随机森林的训练集,具体步骤如下:Step1:根据半导体生产种类确定分类数,进而确定随机森林的分叉数m,对每类半导体选取nx作为训练集,总共mnx个训练样本。Step2:将不同的半导体训练样本分别标记模式类别(1~m)。Step3:从训练样本中随机抽取0.7mnx个训练样本,按照第2节所述构建半导体分类决策树。Step4:重复step3,构建多颗决策树,生成随机森林。Step5:将待分类的半导体排产数据通过训练完成的随机森林进行完全分类,确定每个半导体排产数据的模式类别。Step6:对分类后各个类别的投产品种分别进行排序,交货期越早,排序越靠前,需进行优先生产。Step7:针对交货期不紧张的生产订单,则根据半导体数据分类结果进行合理的投产。
3实验评估
3.1分类准确性实验实验选取7种不同型号的半导体进行研究,投产信息如表1所示。按照2.2节所述,将实验的每种型号的半导体信息转变为特征向量,将7种型号的半导体特征向量作为分类依据,从而完成随机森林的构建。设每类半导体的投产量为niz,算法准确分类数为nii,平均分类准确率为pt,则将其定义。表2表明:本文算法对不同品种的半导体的分类较为准确,其平均分类准确率高达98.4%,从而验证了算法在半导体排产中的数据分类可行性。
3.2“改机”时间比较实验按照2.2节所述的算法流程,对待排产的半导体进行合理安排,为了方便比较不同类型的半导体粗日投料对生产的影响,假设生产车间只有一道工序,每种类型的产能各有一台机器,改机单位时间为10min,分布对基于品种平均分配的投料策略、基于投产量平均分配的投料策略和本文提出的基于品种分类的综合投料策略控制下的生产过程进行比较,其实验结果如表3所示。由实验结果可得:本文所提出的基于随机森林对半导体品种进行分类算法能够很好的减少改机时间代价,从而缩短生产周期,提高生产速率。为了方便计算,实验给出的规模较小,一般在半导体实际生产中,周投产品种达上千种,本文算法在规模庞大的实际应用中更能发挥其优越性,假设背景企业中,采用该算法后,生产周期缩短了约27h,即改机时间代价降低了约27h,大大提高了生成效率。
4结束语
本文针对半导体排产问题进行深入研究分析,提出一种基于多叉树随机森林的半导体排产算法,该算法首先将半导体的品种名称、投产量、交货期和所属类别转化为特征信息,将其输入到构建完成的随机森林,从而进行数据的完全分类,利用得到的数据分类法则进行排产的评估,确定日投产的半导体种类和数量。实验结果表明:该算法能够有效地降低半导体排产过程中的改机时间代价,从而提高设备的利用率,大大缩短生产周期,提高生产效益。今后的工作是对现有的随机森林纯度分类依据进行深入研究,优化属性选择原则,从而提高算法对各类数据的适应能力。本文创新点在于首次将随机森林算法应用到工业排产研究中,开拓了机器学习的应用领域。
作者:王玉单位:中国科学院沈阳自动化研究所中国科学院大学