第六章 相关与回归分析
一、单项选择
1.B 2.B 3.A 4.D 5.B 6.C 7.C 8.A 9.A 10.C 11.D 12.D 13.B 14.C 二、多项选择
1.AC 2.DE 3.ABC 4.AB 5.AC 6.BC 7.BC 8.AD 9.ABD 10.CD 11.AD 12.AC 13.AD 14.AC 15.ABC 16.AB 三、判断
1.× 2.√ 3.× 4.× 5.×
6.× 7.× 8.× 9.√ 10.× 11.√ 12.√ 四、简答
1.相关关系是一种不完全确定的随机关系,在相关关系的情况下,自变量的每一个数值都可能有若干个因变量的数值与之对应。因此,相关关系是一种不完全的依存关系。相关关系与函数关系的不同表现在:(1)相关关系的两变量的关系值是不确定的,当给出自变量的数值后,因变量可能会围绕其平均数出现若干个数值与之对应;而函数关系的两变量的关系值是完全确定的,即当给出自变量的数值后,因变量只有一个唯一确定的数值与之对应。(2)函数关系变量之间的依存关系可用方程y=f(x)表现出来,而相关关系则不能,它需要借助函数关系的数学表达式,才能表现出现象之间的数量关系。
2.就一般意义而言,相关分析包括回归和相关两方面的内容,因为它们都是研究变量之间相互关系的。但就具体的方法所解决的问题而言,回归和相关又有明显的区别,二者的区别主要表现在以下几方面:(1)进行相关分析时不必事先确定两个变量中哪个是自变量哪个是因变量,而进行回归分析时,则必须事先确定自变量和因变量。(2)相关分析中的两个变量都是随机变量,而回归分析中的两变量只有因变量是随机的,自变量是可以控制的量。(3)计算相关系数的两变量是对等的,改变两者的位置并不影响相关系数的数值,而回归分析中,对于一种没有明显因果关系的两变量,可以求得两个回归方程,一个为Y倚X的回归方程,另一个为X倚Y的回归方程。(4)相关分析只能分析两变量的相关程度和方向,而回归分析要比相关分析更深入,更具体,它要分析因变量是如何随着自变量的变化而发生变化的。二者的联系主要表现在:回归分析和相关分析是相互补充的 ,密切联系的。相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切的关系,进行回归分析求其相关的具体形式才有意义。 3.一般来讲,拟合回归方程的要求是:找出合适的参数a和b,使所确定的回归方程能够达到实际的Y值与对应的理论值Yc的离差平方和为最小值。即:Q=
22????y?y?y?a?bx=最小值 。回归方程中参数a和b的经济含义是:参数a??c代表直线的起点值,在数学上称为直线的纵轴截距,它表示X=0时Y的常数项。参数b称为回归系数,表示自变量X增加一个单位时因变量Y的平均增加值。回归系数的正负号用来判断两变量相关的方向。
4.(1)在定性分析的基础上进行定量分析,是正确运用回归分析的必要条件。构造直线回归方程,首先要通过理论分析判断,对确有因果关系或密切相关关系的变量,确定自变量和因变量,因变量。
(2)具有足够的样本数据。
(3)数据分析表明,因变量与自变量具有显著地线性相关关系。
(4)拟合直线回归方程要找出合适的参数a和b,使所确定的回归方程能够达到实际的Y值与对应的理论值Yc的离差平方和为最小值。即:Q=
22????y?y?y?a?bx=??c最小值。
5.估计标准误是表明回归方程理论值与实际值之间离差的平均水平的指标。此指标的作用有 以下几点:
(1)它可以说明以回归直线为中心的所有相关点的离散程度。
(2)它可以说明回归方程的理论值代表相应实际值的代表性的大小。 (3)它可以反映两变量之间相关的密切程度。
6.(1)在定性分析的基础上进行定量分析,是正确运用回归分析的必要条件。在确定哪些变量作自变量,哪些变量作因变量之前,必须要对所研究的问题有充分的认识。若对本来没有内在联系的现象,硬性进行相关分析,将导致“虚假相关”的错误。若在此基础上据以进行回归分析,并用以指导实际工作,必将会造成失误。要搞好定性分析,必须熟悉所研究的领域,有足够的理论知识、专业知识和实践经验。
(2)回归预测适宜于内插预测,不宜用于超过一定范围的外推预测。这是因为我们建立的回归模型,一般都是根据一定范围的有限样本资料得到的经验公式,其有效性只适用于内插预测和较短时期的外推预测。例如,增加施肥量和耕作深度可以提高亩产,但若施肥量过多,耕作太深,亩产不但不会提高,反而会减少。
(3)在回归模型中,回归系数的绝对值只说明自变量与因变量变动的比例关系,不表示变动的密切程度,因为回归系数的大小受变量计算单位大小的影响。
(4)在进行回归分析时,为了使分析结果更准确、可靠,对于同一资料可以配合多种回归方程,分别计算估计值(理论值)和实际值的估计标准差,选择误差最小的方程式作为进行回归分析的方程。
六、计算五、计算题
1.有14个同类企业的生产性固定资产年平均价值和工业总产值资料如下:
企业编号
生产性固定资产价值(万
元)
工业总产值(万元)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 合计
2.8 2.8 3.0 2.9 3.4 3.9 4.0 4.8 4.9 5.2 5.4 5.5 6.2 7.0 61.8
6.7 6.9 7.2 7.3 8.4 8.8 9.1 9.8 10.6 11.7 11.1 12.8 12.1 12.4 134.9
(1)计算两变量的相关系数并说明两变量之间的相关方向,0.956,正相关。
(2)建立直线回归方程,并说明其参数的经济意义。(SPSS:A=3.1,b=1.448)EXCEL(a=3.1,b=1.448),b=1.448表示生产性固定资产价值增加1(万元),工业总产值平均增加1.448(万元)。
(3)估计生产性固定资产(自变量)为10万元时,估计总产值(因变量)的可能值17.549万元。
2.某公司对10户家庭进行调查,获得以下资料:
某种商品的月需求量和价格调查表
家庭号
6 7 8 9 10
家庭号 需求量(kg) 价格(元) 1 2 3 4 5
1.0 3.5 3.0 2.7 2.4
5.0 2.0 2.0 2.3 2.5
需求量(kg) 价格(元)
2.5 2.0 1.5 1.2 1.2
2.6 2.8 3.0 3.3 3.5
要求:(1)计算相关系数,r=-0.8621该商品价格与需求量之间具有高度负相关性。 (2)建立回归模型,Yc=4.495125-0.82591X,并说明其参数-0.82591的经济意义是,价格上涨1元,需求就减少0.82591kg。
(3)计算估计标准误差为0.458582kg
(4)假定价格下降至1.5元时,以95.45%的可靠程度估计该商品的需求量(3.256267-0.917164,3.256267+0.917164)即(2.339103,4.173431)kg
3、为研究产品销售额与销售利润之间的关系,某公司对所属6家企业进行调查。设产品销售额x(万元),销售利润y(万元),调查资料经初步整理和计算,结果如下:
?x=225,
?y=13,?x2=9823,
?y2=36.7,
?xy=593。
3.解:(1)r=0.9703
(2)建立回归模型,b=0.0761 a=2.1667-0.0761*37.5=-0.68705 Yc=-0.68705+0.0761X1

