第二节 假设检验与参数估计方法
本节将讨论如何通过样本去推断总体,由样本推断总体是以各种统计量的抽样分布为基础的。对总体的推断,可以通过两个途径来实现。一是首先对所估计的总体提出一个假设,例如假设这个总体的均值?等于某个定值?0,然后以样本为依据,以统计量为工具去推断这个假设是否可以接受。如果可以接受,说明总体均值???0;否则,说明???0。二是
通过统计量去估计总体参数。前者称为统计假设检验,后者称为总体参数估计。
1. 假设检验原理和方法 在生物学试验研究中,要检验某种试验方法的效果、某个品种的优劣、某种药品的疗效等,所得试验数据往往存在着一定的差异,这种差异是由随机误差引起的,还是由试验处理的效应造成的?这个问题必须经过一番分析才能给出答案,因为在试验结果中往往是处理效应和随机效应误差混在一起,从表面上看,不易区分开,因此必须通过概率计算,采用假设检验的方法,才能作出正确的推断。
1.1 假设检验的基本原理 例:用某种动物作试验材料,要求动物的平均体重??10g,若??10g需要再饲养;若??10g则应淘汰。又知动物体重服从正态分布,且由以往经验知??0.15g。现从一批试验的动物中,随机抽取10只,称得体重(g):为
9.93,9.89,10.15,10.10,9.96,9.87,10.22,10.08,9.98,10.09
问这批动物能否供试验用?
解:若用X表示这批动物的体重,显然X~N(?,?),其中?未知。 针对样本观测值如何推断??10g还是??10g,我们做如下分析; (1) 对所研究的总体提出一个假设
为了得到对总体均值?的推断,可以假设总体均值?等于给定的值?0,即 原假设: H0: ??2?0 或 H0:???0?0
与原假设相对立的假设称为备择假设,备择假设就是当H0被拒绝后,可供选择的假设;
1
H1: ???0; 或 H1:???0; 或 H1: ???0
备择假设的提出要视具体问题而定。
(2) 在上述假设下,选择一个样本统计量又称检验统计量,用以作为检验H0的工具,并考查该统计量的分布。我们选择统计量 U? 这里?X??X?? ??/n??XX?????/n 称为样品的标准误,这里???0?10g,而且X?10.03g,n=10,
???0.15,由样本观测值可以算出该检验统计量的值
U?
(3)确定原假设H0的拒绝域
前面算出的U=0.6325,是在承认H0成立的前提下得到的,但是,现在我们还不知道实验动物体重这个总体是否真的符合该假设。
如果上面算出的U值是不合理的,就表明我们所做的原假设H0是不合适的,这时我们就应该拒绝或否定原假设。使得我们拒绝或否定原假设H0的U值的全体叫做原假设H0的拒绝域。拒绝域的确定关键在于分清哪些U值是“合理”的,而那些是“不合理”的。它们的依据是人们在实践中广泛采用的“小概率原则”。所谓“小概率原则”是指小概率事件在一次观测或试验中一般是不会发生的,如果发生,就认为这个现象是不合适的。
由前面分析我们知道,给定??0,(0???1),对于标准正态分布,我们总可以找到这样的临界值u?,使得
210.03?10?0.6325
0.15/10P(U?u?)??
2 如果把?取得相当小,如??0.05,通过查标准正态分布的临界值表,得到
u??1.96,即
2 P(U?u?)?P(U?1.96)?0.05
2如果在一次观测中,上述时间发生了,即满足条件
U?u??1.96
2按小概率原则,就应该拒绝否定原假设H0,也就是得到了H0的拒绝域;
2
???U?1.96? 或 ?X???0.093??
??由于拒绝域U?1.96分布在?0的左右两侧,所以称这类检验为双侧检验,又称U检验。 在实际问题中,还经常需要检验?? H0: ?????0是否成立,此时在显著性水平?下,检验假设
?0 H1: ???0
是否相容,选统计量
U?X??0??~N(0,1)
X?对于给定的水平?,查标准正态分布的上侧临界值u?,使得
P(X?????u?)??
X?从而得到H0的拒绝域为;
????X????U?u?????u??
?????X?这时H0的拒绝域在?0的一侧,称为单侧检验。 (4) 对原假设进行推断
在以上例题中,由样本观测值算得U=0.6325,它没有落入拒绝域:U?1.96,因此,我们可以认为H0是相容的,即???0?10(g),故这批动物可供实验用。
否则,若算得 U值落入拒绝域,就有理由怀疑H0的真实性,而接受备择假设
H1:???0。
需要说明的是,对原假设进行推断与?的选取有关,在??0.05的水平下否定原假设,称差异性是显著的;而在??0.01的水平下否定原假设,称差异性是极显著的,以上检验称为显著性检验。
1.2 假设检验的方法、步骤 从以上的讨论中,可归纳出假设检验的方法、步骤如下:
3
(1) 提出假设:根据问题的实际意义,或重点考察的内容,提出原假设H0和备择假设H1,写明其具体内容。如H0:???0,H1:???0等等;
原假设是假设检验的基础,它可能有以下几个来源(a)依据以往的经验或某些实验的结果;(b)依据某种理论或某种模型;(c)根据事先所做的某种规定提出的。
与原假设对立的备择假设,是总体参量中除去原假设参量取值之外的某个值或某些值,其可能来源是:(a)除原假设外的可能值;(b)希望出现的值;(c)担心会出现的值;(d)有重要经济意义或其它意义的值。
(2)选择检验H0的统计量,并确定其分布(依据所要检验的参数?,?2等,选择合适的统计量);
(3)确定拒绝域:在给定的水平?(0???1)下,查所选统计量服从的分布表,求出临界值,并根据小概率原则确定H0的拒绝域;
关于显著性水平?的选择,要根据实际问题而定。
(4)作出判断: 由样本观测值计算出检验统计量的观测值,若其值落入拒绝域,就拒绝H0;否则,就认为H0是相容的。 当H0相容时,对于原假设???0可以有以下几种解释:
(a)原假设是真实的,并抽出一个我们所见到的样本; (b)?可能非常接近?0;
(c)抽样结果符合原假设的值?0,检验统计量的值与?0的差异是由偶然因素造成的。 若拒绝H0,可有如下解释: (a)?不可能接近?0;
(b)若原假设是真实的,抽到一个我们所见到的样本可能性很小;
(c)抽样结果不符合原假设的值?0,检验统计量与?0间的差异(在?水平上),不能用偶然因素解释,表明该差异还有处理效应的作用。
4
2. 正态总体参数的假设检验
2.1 单个正态总体均值的假设检验 2.1.1 方差?2已知,总体均值?的检验—U检验 现在给出检验的基本步骤:
1)从方差?已知的正态总体N(?,?2)中,抽取容量为n的样本; 2)提出原假设 H0: ??2?0
备择假设可区分为以下三种类型:
(1)H1:???0 (已知?不可能小于?0) (2)H1:???0 (已知?不可能大于?0) (3)H1:???0 (包括???0和???0) 3)确定检验统计量
U?X??0??~N(0,1)
X?4)对于给定的显著性水平?(0???1),求出H0的拒绝域(分三种类型) (1)?U?u?? (2)?U??u?? (3)?U?u??
????25)把检验的统计量的观测值计算出来,视其是否落入拒绝域,作出拒绝或接受H0的结论。
例: 已知豌豆籽粒重量X服从正态分布N(37.72, 0.33)(单位:g);在改善栽培条件后,随机抽取9粒,测得平均重量x?37.92。若标准差仍为0.33,问改善栽培条件是否显著提高豌豆籽粒重量。 解:按以上解题过程;
2
(1) 已知豌豆籽粒重量X~N(37.72, 0.33),且?已知
2
? 5