当前位置: 电热水壶 >> 电热水壶优势 >> 假设检验的初步了解,这一篇就够了
大家好我是试题小讲。今天为大家带来一篇关于假设检验的初步了解的文章。可能有些地方描述不恰当。
1假设检验时代发展
首先对于假设检验,科学技术的不断创新,不仅促进了社会的进步,还改善了人们的生活水平。与此同时,社会生活中待检验的事件日渐增多。为此,当我们去检验这些事件的真实性时,就要用到统计论断中的假设检验。当前已广泛应用于医学、气象、地理等领域,比如,医学的制药行业。在其他领域也有不错的发展前景,尤其是在经济领域中产品的质量管理方面。假设检验已经成为一种不可或缺的数学工具,因而,需要对假设检验的基本思想以及应用进一步认识和感知。
统计假设是关于总体分布函数的某些未知参数、分布的类型特征以及独立性等的论断或观点。假设检验基于样本观察数据或试验结果所提供的信息数据,去推断这个“看法”(或假设)是否成立。在参数假设检验中常常把我们没有太多理由支持的重点考察的假设取为原假设H0,,将其否定的陈述假设称为备择假设H1,对原假设做出正确或不正确的推断,称为对H0作显著性检验。
2假设检验
假设检验的概念和本质
我们都知道点估计的思想是利用样本数据去估计得到我们所要的母体分布中的参数,之后将得到的估计值与母体参数的真实值作比较,检测一下两个值之间的偏差是大是小或在统计意义上是否一致,偏差越小,估计量就越好。那么假设检验是怎样的呢?首先对于这种比较需要建立在子样数据的基础上,我们按照样本观测数据或实验结果提供的信息去判断某个结论是否正确,称为统计假设检验问题。利用统计假设检验的方法,我们可以解决日常生活中的许多问题。
假设检验是先根据问题描述对母体分布中的某些不知道的参数,分布函数的类型等提出特定的假设,而后利用问题所给或随机抽样得到的样本数据去检验这些关于母体的特定假设是正确还是错误的。简而言之,是对我们提出的特定的假设(包括原假设和备择假设)判断哪个是正确的假设,这就是假设检验问题。假设检验的基本思想将在下面通过具体事例进行详细说明。
例1某郊区一工厂生产电热水壶,经过技术人员调查,电热水壶的使用时间服从正态分布N(u,),且电热水壶的平均使用时间为u=小时,现在从外面引进一种新技术后,将工人正在生产的电热水壶中随机抽查64只,计算的电热水壶的平均使用时间为小时,问采用新技术后电热水壶的使用时间与之前产品相比有没有较大提高?
这个问题就是要判断现在生产的电热水壶的使用时间符合哪一种情况:一是采用新技术后电热水壶的使用时间是服从u的正态分布,则使用时间有较大提高;二是采用新技术后和原来的旧电热水壶的使用时间相同且服从u=的正态分布,那么使用时间没有较大提高。所以,按照上述情况我们提出两个假设:原假设H0:u=u0=和备择假设H1:u。
首先我们要考虑的问题是如何根据随机抽样得到样本数据来判断原假设是真还是备择假设是真。因此我们根据定义在样本空间上的函数制定了检验准则,将样本空间(C1,C2,……,Cn)分成两部分D和D*,且分成的D与D*互不相交,当我们从事件中抽到的子样的观测点(x1,x2,……,xn)属于D,就认为原假设H0是错误的,并认为备择假设H1是正确的;如果从事件中抽到子样的观测点(x1,x2,……,xn)属于D*,则否定备择假设H1,坚持原假设H0正确。这里我们把子样空间的其中一部分D叫做检验的拒绝域。然而,由于子样空间是n维的,我们在实际中总是寻找一个检验统计量,而我们所得到的这个检验统计量将问题从n维问题转换为一维问题,更好的解决了假设检验问题,也使问题得到了简化。
在这道题中我们如果是原假设H0:u=u0=为真,在新的技术下电热水壶的使用时间分布为N(,),我们还知晓样本均值X的分布为N(,),则这64个电热水壶的平均使用时间服从N(,)分布。那么这组样本的观测值应该会在附近,而不会偏离太远。假如我们认为备择假设H1:u是真,那么样本均值X大于原先均值u0=的机率就增大。所以我们可以这样认为当计算求得的样本均值X偏离原先均值u0=很大时就拒绝原假设。我们为什么可以利用上面这样的分析方法呢?可以看到是利用了无偏估计的性质,在无偏估计中我们知道子样均值X观测值的大小是可以大体观测母体u的大小的。
但是,做出判断的理由是我们所取的样本数据,而样本是随机抽查的,我们在进行抉择时,当H0为真时,我们所取的样本观察值可能会落在子集D,根据检验规则我们认为原假设H0是错误的,这是第一类错误。还存在第二类错误,即当H1正确时,我们所取的样本观察值落在子集D*中,我们接受原假设H0。由于这两种错误无法避免,但是我们可以使犯错误的概率控制在一定范围内。也就是说,我们常设定一个很小的数字a,把犯错误的概率限制在a内。因为很难发现最佳的检验规则,在这里我们仅对犯第一类错误的情况进行讨论,即P(拒绝H0/H0为真)=a,这时我们称a为显著性水平(a一般取0.05,0.1,0.01)
如前所述,现在就是要根据检验规则构造一个检验统计量,接下来就是检验统计量的构造步骤,也是最重要的环节。我们以上面的例题为例子,我们知道,当原假设H0是正确时,我们可以得到统计量
。之后,当给出a时,有
。我们取a=0.05,按照标准正态分布表可得
,因此我们可以得到拒绝域
。这样,我们可以将问题中样本数据代入上面的检验统计量做出判断,当u属于D就认为原假设H0错误并认为备择假设H1是正确的。否则反之。上题我们可以得到u=41.65,,于是我们认为原假设H0是不正确的,而备择假设H1是正确的,也就是说,我们认为新的技术下电热水壶的使用时间有了较大提高。
从上例可以看出,我们给出拒绝域的原则是什么呢?答案是运用了小概率原理的方法。也就是说,假设检验是利用了概率很小且接近于0的某一事件在一次实验或观察中几乎不会发生的思想原理。由大数定律我们可以知道,在n次重复试验中,某一事件发生的频率靠近概率,不会偏离太远。在进行假设检验时(原假设成立)我们可以认为概率很小且接近于0的事件在一次试验或观察中几乎不会发生,但是我们这个概率接近于0的事件却发生了,所以在把第一类错误的概率限制在a内的前提下,认为原来的假设是错误的。
电热水壶