前言:我们精心挑选了数篇优质常用的统计分析文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词:自由分布 随机性 独立样本
众所周知,通过统计调查获得的样本资料只能部分地显明总体数量特征,要想全面而深入认识总体,就需要在对样本进行观测而获得数据资料的基础上,用样本已知的有关的“量”来对总体相应的“量”加以推断估计而作出结论,这即是推断统计。传统的统计推断都要对总体的分布形状加以某些限定,如假设样本所出自的总体必须是正态分布,或者假设两个样本取自具有相同方差的总体等等。这些限定无疑过于苛刻,在我们的抽样调查实践中是难以满足的。如果采用自由分布统计检验来进行统计分析,即对样本所出自的总体分布具体形状不作假设,是基于样本的特性来检验统计量,这种方法在实践中行之有效。
一、Kolmogorov-Smirnov单样本随机性检验
Kolmogorov-Smirnov单样本检验,涉及一组样本观测结果的经验分布同某一指定的理论分布之间是否一致的问题,适用于确定顺序分类数据的样本观测结果是否有理由认为它是来自具有指定理论分布的总体。
该数据取自调查样本《核心能力调查表》的某一项目重要程度数据
取显著性水平α=0.01,检验该样本的被调查者对该项目的重要程度等级排序具有同等区分。
首先提出原假设H0与备择假设H1:
H0 :P1=P2=P3=P4=P5=0.20
H1:P1≠P2≠P3≠P4≠P5≠0.20
具体检验步骤如下:
第一步,求期望频数。对每一种排序号用总频数n乘以H0成立时的概率P,即得期望频数fe 。已知H0 :P=0.20,fe=24×0.20=4.8。
第二步,求观察频率(f0/n)和期望频率(fe/n)。
第四步,确定检验统计量Dn=max|Fn(X)―F(X)|=6.6/24=0.275。
第五步,求临界值Dnα。由Kolmogorov-Smirnov单样本双侧检验的临界值得:在n= 24,α=0.01时,Dnα=0.343,由于D35=0.275<D350.01=0.343,故不能舍弃H0 ,即结论是可以认为,在显著性水平α=0.01时,该样本的被调查者对该项目的重要程度等级排序具有同等区分,所测定出来的差异仅是由于样本的随机性波动所造成的。
二、多个独立样本的中位数检验
由于中位数作为一组数据集中趋势的代表,不易受到极端数值的影响,其稳定性是其最显著的优越性。因此,通过对多个独立样本中位数是否来自同一个总体的假设检验,可以判断该总体中位数的数字特征。
现有抽样调查《专业技能调查表》某一项目重要程度的四个随机样本,给出如下数据:
样本Ⅰ :2,9,23,5,6
样本 Ⅱ:5,6,8,1,1
样本 Ⅲ:3,5,19,10,1
样本 Ⅳ:0,6,10,18,4
取显著性水平α =0.05,检验这四个随机样本是否来自共同中位数的总体。具体检验过程如下:
(一)建立假设
H0:四个随机样本所属总体中位数没有显著性差异
H1 : 四个随机样本所属总体中位数存在显著性差异
(二)取显著性水平α=0.05,双侧检验
(三)统计检验
由于随机样本彼此独立,K=4,其观察值表现为顺序数据,适合采用 检验法来评价总体中位数的差异。
(四)将数据按由大到小混编排列
求出公共中位数后将各样本分别“+”,“-”计数,填入4×2表。
求得公共中位数为5.5[=(6+5)/2]。凡大于该中位数者归入“+”得计数,凡等于或小于该中位数者归入“-”计数,得4×2表如下:
(五)计算 值
期望频数等于每一格相应的两个边缘频数乘积除以总频数,fe=10×5/20=2.5。于是:
(六)求临界值
查 临界值表,在α=0.05,df=k-1=4-1=3相应栏中找到临界值为7.815。
(七)判定
0.8<7.815,故不应舍弃H0。即可认为,在显著性水平α=0.05下,这四个随机样本所属总体中位数没有显著性差异。
从以上分析中可以看到,自由分布统计是基于样本特征为研究出发点,而不对总体分布形状加以限定。同时,这里的 “自由”是相对的,即它与传统限定分布统计方法(Distribution-SpecifiedStatistical Methods)而言是自由的。该方法在市场调研分析中具有较强的应用价值,值得我们深入研究。
[参考文献]
[1]颜金锐.科研中常用的统计方法―自由分布统计检验[M].中国统计出版社,2002.
关键词: 转移矩阵 转移概率 齐次性 占有率
马尔可夫链是一类常用的随机过程,它在管理科学、可靠性理论等学科中被广泛的应用。对离散状态的马尔可夫链,其转移概率是一个重要的工具。为了处理的方便,常常假设马尔可夫链式齐次的。
一马尔可夫链的转移概率的确定
考虑齐次马尔可夫链。如何根据样本序列作出马尔可夫链的一步转移概率的估计呢?在实际问题中,有时,所研究的过程已有了一步转移概率阵的估计,那么是否可以接受呢?这要根据样本序列来得出结论,即检验假设:
假设由样本序列得到转移频数矩阵其中,表示从状态转移到状态的次数。由此,可以得到一步转移概率的估计:这里,。
取检验统计量 这里。,若有某些项则在上述和式中去掉这些项。
可以证明:当成立时,服从自由度为的分布,其中,是矩阵中零元素的个数。当大时,自然倾向于拒绝,因为成立时,=,因而,也很小。在显著水平下,假设的拒绝域由下式决定:
二 齐次性检验
设马尔可夫链的状态空间。
记,。为在第次过程的转移中由状态转移的次数。由此得到第次过程的转移中转移频数表格
的估计为这里,。
如果马尔可夫链是齐次马尔可夫链,那么,记其一步转移概率为。
检验马尔可夫链具有齐次性,就是要检验假设,。取检验统计量可以证明:当成立时,服从自由度为的分布。
将改写成 当与接近时,倾向于接受,而此时近似于0,因而较小时,倾向于接受,由此得到的拒绝域由下式定出:
三 实证分析
某地区有三家商场A,B,C共同竞争市场的占有率。现在A,B两店已陆续开展了以一些促销方式,如给优惠券等。而C店为了搞清A,B两家店的促销是否有效,请人做市场调查,共选取300名顾客为调查对象,假设开始时每家店各有100名忠实的顾客,调查进行6周,前三周时未进行促销活动,尔后三周是在有促销的情况下进行的,现把调查得到的转移频数表格列出
首先,我们来研究A,B,C三家商场促销前的市场占有率,我们先求出转移频数矩阵
用频率来估计概率,就得到一步转移概率阵由于中无零元素,所以由定理可以知道此马尔可夫链式遍历链,且极限分布可以通过解方程组得出所以得出A,B,C三家商场的市场占有率分别是37.2%,32.7%,30%。
然后,我们来研究A,B促销后,三家商场的市场占有率的变化。促销后的转移频数矩阵为: 进而得到转移概率矩阵为:,所以由定理可以知道此马尔可夫链是遍历链,且极限分布可以通过解方程组得出所以得出A,B,C三家商场的市场占有率分别是28.3%,42.1%,29.6%。
最后,我们通过总的转移频数矩阵和总的转移概率矩阵及五个转移频数调查表计算出
取显著水平,由于
所以拒绝,即不能认为本例中的马尔可夫链具有齐次性,因此认为A,B二店的促销确实产生了效果。
参考文献
[1]王梓坤.概率论基础及其应用.北京:科学出版社,1976 185-187
[2]何迎晖 钱伟民.随机过程简明教程.同济大学出版社,2004
[3]刘次华.随机过程(第二版).华中科技大学出版社,2001
关键词:6 Sigma质量统计技术;298轴承盖;统计量
中图分类号:F203 文献标识码:A 文章编号:1006-8937(2013)21-0013-02
在现场中,影响某一事物的因素往往是很多的,例如,对于多名职工在一台设备上(或者一名职工在多台同类设备上)加工一个配件时,同一个质量特性值的分布情况因系统误差和随机误差的影响,应是不同的。但这只是定性地分析,无法准确地区分系统误差和随机误差的影响。
利用6 Sigma质量统计技术中的方差分析方法,可对上述两种情况进行定量地分析:不同的职工的加工水平或不同的设备的质量保证情况(即分析质量问题发生原因用的因果图中的人、机、料、法、环、测中的“人”和“机”)。区分出随机误差和系统误差(严格的数理统计基础上的、一定的置信度下的数据),从而分别采取措施进行消除和控制,为质量改进提供理论依据。
1 方差分析的有关概念
主要有试验指标、因素、水平等。试验指标――在试验中,我们将要考察的指标称为试验指标;影响试验指标的条件,称为因素(或因子);因素所处的状态,称为该因素的水平。
2 项目的选择
针对产品轴承盖(298)的13号CTQ尺寸,进行方差分析试点,具体的尺寸要求为:Φ342.9130-0.038,考虑用方差分析手段对三名职工在同一台设备上加工的产品的质量状况进行衡量,这里试验指标为298轴承盖13号CTQ尺寸的质量;因素为三名职工的加工水平;水平值为30。这是一个典型的单因素三水平试验。
3 工作步骤
①数据搜集。要保证数据的独立性和真实性,且在相对短的时间内。本例收集数据90件,每个水平下有30个数据。
②假设检验的原假设和备择假设设定。主要是假定三个水平下,每个总体数据均为正态分布且方差相等情况下,三个职工加工的尺寸平均值相等,如H0:μ1=μ2=μ3;H1:μ1、μ2、μ3不全相等。
③计算假设检验的统计量F。根据原假设情况,分别求出所有数据的总离差平方和ST、组间平方和SA(即系统误差)、组内平方和Se(即随机误差)。并分别求出各自的自由度④根据卡方分布和F分布理论,判断统计量F是否落在拒绝域,进而判断因子是否显著,即三个职工加工的产品质量有否明显的差异。
⑤参数估计。分别估算平均值和方差数据。
目的是运用质量统计技术进行一系列的计算,定量分析职工加工产品的质量状况,变定性分析为定量分析,为质量改进提供一个有力的工具。
4 数据收集情况
表1中的数据分别是三个不同的操作者在同一台车床上加工的轴承盖298的13号CTQ尺寸值。
5 检验假设和统计量F:H0:μ1=μ2=μ3;H1:μ1、μ2、μ3不全相等
6 假设检验的拒绝域
根据原假设和相关统计理论知识,我们知道:当H0不真时,即加工水平有很大差异时,统计量分子有偏大的趋势,而分母的分布与H0无关,其数学期望值E(Se/(n-r))总是σ2。因此,可知方差分析的拒绝域为:
10 结 论
统计量F的值没有落在拒绝域,也就是说,原假设是正确的,三名职工加工的产品没有显著性差异。说明三个操作者的操作水平没有明显的差异,因为轴承盖全部由数控车床加工,由人员引起的加工误差不显著,差异属随机(偶然)误差,属于质量控制的范畴,不属于质量改进的范围,也就是说,没有必要进行工艺或质量改进。
通过以上6 Sigma质量统计技术的运用,统计计算结果和现场一直讲的“数控设备质量保证能力强的观点”是相吻合的,不同的是,平常人们讲的为定性的分析和基于经验得出的结果,而方差分析则用统计知识进行科学的分析计算,定量地对这个结果进行验证。
这个结论的取得,应该和现场的情况非常吻合,也给6 Sigma应用小组增添了信心。这次分析的结果不同于职工在同一台设备上加工,没有显著差异。下一步,应有针对性地分析同类设备上加工的产品,从而找出同类型设备的差异(即因素为设备)。设想是:设备与设备之间应该或多或少有系统的差异(当然,针对现场已经出现问题或者怀疑有问题的设备,找出差异值,可用于设备调整),也即找出具体的系统误差值(SA),从而可以有效地避免,促进工艺和质量改进。