更好。事实上
D(X)?故有;
?12?, D(X1)??2 nD(X)?D(X1)
以上结果说明,用X作为?的估计量比X1更有效。 一般的,若
都是参数?的无偏估计量,且D(?1)?D(?2),则称?1比?2更有效。 (3)一致性
在样本容量n一定的条件下,我们讨论了估计量的无偏差性,有效性。当容量n无限增大时,估计量?(X1,X2,...,Xn)接近待估计参数的可能性会更大,估计也越精确,这就是估计量的一致性。可以表示如下:
设?(X1,X2,...,Xn)是参数?的估计量,如果对于任意给定的??0,均有
^^^^^??limP(?????)?1
n??^^则称?是参数?的一致估计量。
4.2 正态总体均值?的区间估计 对参数进行估计的另一种方式的区间估计,一般做法是,确定一个区间,并给出该区间包含总体参数的概率。?的区间估计依?已知和未知有所不同。
24.2.1 ?2已知 从正态总体N(?,?)中,抽取容量为n的样本,样本的均值X~N(?,2??2n),标准
化的样本均值U?X????~N(0,1),U值落入任一区间的概率可通过标准正态分布函数
X?值查表得出,如U落入区间(-1.96, 1.96)的概率为 P(-1.96 < U < 1.96)=0.95 或
26
P(X?1.96?????X?1.96??)?0.95
XX??4.2.2 ?2未知 ?2未知时,可用其无偏估计量S2代替?2,变量T?布,由
X??服从自由度为n-1的t分S?X?P(?t?(n?1)?2X???t?(n?1))?1?? S?2X?可以得到?的1??的置信区间为
(X?t??S?,X?t??S?)
2x2X??
4.3 两个正态总体均值差?1??2的区间估计
这是在一定的置信水平下,估计两总体均值?1与?2相差多少,估计方法依两总体方差是否相等而不同。
4.3.1 在两个正态总体方差是否已知或方差未知的大样本时 设两个正态总体方差分别是?21和
?,这时两总体的样本均值X1和X2(容量分
2?12?222??别为n1,n2)将分别服从(或近似服从)均值为?1,?2,方差为而两样本均值之差
n1n2,的正态分布,从
X1?X2~N(?1??2,???12n1?2?2n2)
于是不难得出?1??2的置信水平为1??的置信区间为
(X1?X2?u???2??X1?X2??,X1?X2?u???2??X1?X2??)
其中u?是正态分布的临界值,而
2?X1?X2????12n1?2?2n2
27
若两个总体的方差未知,但样本容量n1和n2充分大时,由中心极限定理可知,
2S12S2X1?X2将近似服从正态分布N(?1??2,?),若记
n2n2??2S12S2? n1n2S?X1?X2??则?1??2的置信水平为1??的置信区间仍然为
(X1?X2?u??S?2??X1?X2?,X1?X2?u??S?2??X1?X2?)
cm,S1?4.07cm;而另一品种120例: 测得100头某品种牛的体高,得到x1?133cm,S2?2.92cm,问该两种牛的体高至少能差多少,至多能差头牛的体高均值x2?131多少?
解:由于两个样本的容量都很大,故可看成大样本的情形,这时
??S?X1?X2??2S12S24.0722.922????0.4865 n1n2100120对于??0.05,查标准正态分布临界值表,得到u0.025?1.96,于是?1??2的0.95的置信区间
(X1?X2?u???2??X1?X2??,X1?X2?u???2??X1?X2??)
,2?1.96?0.4865)?(1.046,2.965) =(2?1.96?0.4865即在置信水平95%下,两个品种牛的体高至少差1.046cm,至多差2.953cm。
24.3.2 两个总体方差未知但相等?12??2??2时 ?? 设两个样本的容量分别为n1,n2,X1,X2为它们的样本均值,若记
2(n1?1)S12?(n2?1)S2S??
n1?n2?2S?X1?X2??S?11? n1n228
可以用t分布函数表示
T?(X1?X2)?(?1??2)~t(n1?n2?2)
S??X1?X2??对于给定的置信水平1??,查分布表可得t?(n1?n2?2),使得
2P(T?t?)??
2从而得出?1??2的置信水平为1??的置信区间为
(X1?X2?t??S?2??X1?X2?,X1?X2?t??S?2??X1?X2?)
例2:甲、乙两种稻田分别播种在10块试验田中,每块试验田甲、乙稻种各钟一半,假设两稻种产量X,Y均服从正态分布,且方差相等,收获后10块试验田的产量如下(单位kg):
地块 品种 1 2 3 4 5 6 7 8 9 10 甲种 乙种 140 135 137 118 136 115 140 140 145 128 148 131 140 130 135 115 144 131 141 125 求出两稻种产量的期望差?1??2的置信区间(??0.05) 解:由样本观测值计算,得;
x1?140.6,S?16.93,n1?10;x2?126.8,计算得:
?21?2S2?71.96,n2?10
S??6.67, S?X1?X2??S?11??6.67?0.447?2.98 n1n2查t分布表得t0.025(18)?2.101 由公式(X1?X2?t??S2??X1?X2??,X1?X2?t??S?2??X1?X2?),得到?1??2的置信水平为
1??的置信区间为(7.536, 20.064)
29
习题: 1.
某种饮料每瓶中维生素含量服从正态分布,按规定平均每瓶含量必须大于30毫克方为合格,现从中取16瓶,测得x?31.2mg,s?4,问这批饮料是否合格?(??0.05)
2.
某渔场按常规方法所育鲢鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm.为了提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm.试问新育苗方法与常规方法有无明显差异?(??0.05)
3.
已知豌豆籽粒重量(10g)服从正态分布N(37.72, 0.33),在改善栽培条件后,随机抽取9粒,其重量平均数x?37.92,若标准差仍为0.33,求出豌豆籽粒平均重量的95%的置信区间。
4.
已知玉米单交种单105的平均穗重300克,随机抽取9个果穗,其穗重为:308,305,311,298,315,300,321,294,320克,求?的95%的置信区间。
5.
两组类似的大鼠,一组做对照,另一组做药物处理,然后测定血浆,结果如下:
对照组: n1?12,x1?109.17,s1?97.430 药物组: n2?8,x2?106.88,s2?7.268. 问药物对大鼠血浆含量的波动是否有影响? 6.
从某种灯泡中抽取50只做寿命试验,测得寿命如下(单位:天)
?2?2?-2
?2寿命区间:X?1010?X?5050?X?100100?X?200X?200 频数 n1 : 5 15 11 12 7 经计算:x?100,?s?98
(1) 检验灯泡寿命是否服从正态分布? (??0.05) (2) 检验灯泡寿命是否服从指数分布? (??0.05) 7.
某中药厂从某种药材中提炼某种有效成分,为了提高得率,改革提炼方法,对同一质量的药材采用新旧两种方法各作10次试验,其得率分别为:
新方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3 30
旧方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1 2设两个样本相互独立,分别是来自正态总体N(?1,?12)和N(?1,?2),试问新方法的得率
是否比旧方法的得率高?(??0.01)
(得率=药材中的有效成分的量/进行提纯的药材总量)
31