第一章 绪论 一、填空
1、统计数据按测定层次分,可以分为 、 和 ;如果按时间状况分,可以分为 和 。
2、由一组频数2,5,6,7得到的一组频率依次是 、 、 和 ,如果这组频数各增加20%,则所得到的频率 。
3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为 ,其组中值为 。
4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为______。 5、中位数
Me可反映总体的 趋势,四分位差Q.D可反映总体的
程度,数据组1,2,5,5,6,7,8,9中位数是 , 四分位差是 ,众数为 。
6、假如各组变量值都扩大 2 倍,而频数都减少为原来的 1/3 ,那么算术平均数 。
KEY: 1,分类数据,顺序数据,数值型数据;截面数据,时间序列数据
2、0.1 0.25 0.3 0.35 不变 3、640 620
4、20,5,35,15,25 5、集中 分散 5.5 4 6、扩大为原来的两倍
二、选择(5题/章)
1、统计学的两大类基本内容是 A统计资料的收集和分析 B理论统计和运用统计 C统计预测和决策 D描述统计和推断统计
2、下列属于属性变量的是 A、教师年龄 B、教师职称 C、教师体重 D、教师工资
3、已知分组数据各组组限为:10~15,15~20,20~25,则第二组的组中值为 A、17 B、16 C、18 D、17.5 4、在分组时,身高164cm应归入下列哪一组?
A、160~164cm B、164~168cm C、160~164cm或164~168cm D、另立一组
5、分组数据各组的组限不变,每组的频数均增加40,则其加权算术平均数的值
A、增加40 B、增加40% C、不变化 D、无法判断 6、三个流水作业的生产车间的废品率分别为 5% , 2% , 4% ,则这三个 车间的平均废品率为
A.3.42 % B.3.675% C.3.667% 7、以下数字特征不刻画分散程度的是 A、极差 B、离散系数 C、 中位数 D、标准差 8、已知总体平均数为200,离散系数为0.05,则总体方差为 A、
10 D.3.158%
B、10 C、100 D、0.1
9、两个总体的平均数不相等,标准差相等,则 A.平均数大,代表性大 B.平均数小,代表性大 C.两个总体的平均数代表性相同 D.无法判断
10、某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128
元、148元、200元,计算结果均值为X=128元,标准差为 A、σ=33 B、σ=34 C、σ=34.23 D、σ=35
11、已知方差为 100 ,算术平均数为 4 ,则标准差系数为 A.10 B.2.5 C.25 D. 无法计算 12、有甲乙两组数列,若 A.X1<X2?1>?2,则乙数列平均数的代表性高 B.X1<X2?1>?2,则乙数列平均数的代表性低 C.X1=X2?1>?2,则甲数列平均数的代表性高 D.X1=X2?1<?2,则甲数列平均数的代表性低
13、某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为
A.右偏 B.左偏 C.对称 D.不能作出结论
14、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,
描述该组数据的集中趋势宜采用
A、众数 B、中位数 C、四分位数 D、均值
15、如果你的业务是提供足球运动鞋的号码,哪一种平均指标对你更有用? A、算术平均数 B、几何平均数 C、中位数 D、众数 KEY: D B D B D B C C A C B A B A D
三、判断(5题/章)
1、已知分组数据的各组组限为:10~15,15~20,20~25,取值为15的这个样本被分在第一组。 ( ) 2、将收集到得的数据分组,组数越多,丧失的信息越多。 ( ) 3、离散变量既可编制单项式变量数列,也可编制组距式变量数列。 ( ) 4、从一个总体可以抽取多个样本,所以统计量的数值不是唯一确定的。 ( ) 5、在给定资料中众数只有一个。 ( ) 6、数字特征偏度、峰度、标准差都与数据的原量纲无关。 ( ) 7、比较两个总体平均数的代表性,如果标准差系数越大则说明平均数的代表性越好。 ( ) 8、中位数是处于任意数列中间位置的那个数。 ( ) 9、算术平均数、调和平均数、几何平均数、众数均受极端两值影响。 ( ) 10、权数对算术平均数的影响作用只表现为各组出现次数的多少,而与各组次数占总次数的比重无关。 ( ) KEY: F F T T F F F F F F
四、计算题
1、某班的经济学成绩如下表所示: 43 77 84
55 77 86
56 78 87
56 79 88
59 80 88
60 81 89
67 82 90
69 83 90
73 83 95
75 83 97
(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数 (2)计算该班经济学成绩的众数、四分位差和离散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? 2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断: (1)该城市收入数据分布形状如何?(左偏还是右偏)。
(2)你觉得用均值、中位数、众数中的哪个来描述该城市人均收入状况较好。
理由?
(3)上四分位数和下四分位数所在区间?
3、某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。
4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组 按身高分组(cm) 150~155 155~160 160~165 165~170 170以上 合计 人数(人) 22 108 95 43 32 300 青少年组 按身高分组(cm) 70~75 75~80 80~85 85~90 90以上 合计 人数(人) 26 83 39 28 24 200 要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大?为什么?
5、有两个生产小组,都有5个工人,某天的日产量件数如下: 甲组:8 10 11 13 15 乙组:10 12 14 15 16
要求:计算各组的算术平均数、全距、标准差和标准差系数,并说明哪个组的平均数更具有代表性。
6、设甲、乙两单位职工的工资资料如下: 甲单位 乙单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 2 4 10 7 6 4 30 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 1 2 4 12 6 5 30 要求:试比较哪个单位的职工工资差异程度小。
7、某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下: 净利润(元/头) –200 0 200 400 合计 原品种牛 频数 36 12 185 367 600 频率(%) 6 2 31 61 100 改良品种牛 频率(%) 1 2 57 40 100 (1)牧场主应该选择哪一种品种?为什么?
(2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主会改变他在(1)中所做的选择?
8、一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是 100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想?
KEY: 1、(1)77, 80.5,68.5,87.25 (2)83,18.75,0.173
(3)中位数,是数据分布明显左偏又是顺序数据。 (4)左偏 2、(1)右偏
(2)中位数,数据分布明显右偏,频数较多的几个组家庭百分比相差不大 (3)均值,300~400,400~500。 3、三道工序的平均合格率
X?nx1?x2????xn?n?x?30.9574?0.9378?0.9723?30.87298?0.9557?95.57%
4、(1)解:(1)求成人组和青少年组的身高的均值、标准差、标准差系数。 成人组 组中值y yf y^2 (y^2)f 身高(cm) 频数f x 22 152.5 -2 -44 4 88 150~155 108 157.5 -1 -108 1 108 155~160 95 162.5 0 0 0 0 160~165 43 167.5 1 43 1 43 165~170 170以上 32 172.5 2 64 4 128 合 计 令y?y?x?ab?300 x?162.55
-45 367 ?yf?f2??45300367300??0.15
x?a?by?162.5?5*(?0.15)?161.75
y?2?yf?f??1.223
y?y22标准差: ?y??1.09571.09?57
5. 4 ?x?b?y?5?标准差变异系数:
C???X?5.4784161.75?0.03387
成人组的平均身高为161.75cm,标准差为5.4784cm,标准差系数为0.03387。 青少年组 身高频率f 组中值 y yf y^2 (y^2)f (cm) 26 72.5 -2 -52 4 104 70~75 83 77.5 -1 -83 1 83 75~80 39 82.5 0 0 0 0 80~85 28 87.5 1 28 1 28 85~90 24 92.5 2 48 4 96 90以上 合 200 -59 311 计 令y?y?x?ab?x?82.55
?yf?f??59200??0.295
x?a?by?82.5?5*(?0.295)?81.025
y?2?yf?f2?311200?1.555
y?y22标准差: ?y??1.21161.09?57
6 . ?x?b?y?5?标准差变异系数:
C???X?6.05881.025?0.074767
成人组的平均身高为81.025cm,标准差为6.058cm,标准差系数为0.074767。 (2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。 5、解:
x甲??xn?575?11.4(件); x乙?675?13.4(件)
R甲?15?8?7(件); A.D.甲=10.45R乙?16?10?6(件)9.65
?2.08(件); A.D.乙=?1.92(件)?甲=2.42(件); V甲=21.20%; ? V甲?V乙,所以乙组的平均数代?乙=2.15(件)V乙=16.08%表性较大
2600030?866.67(元)
6、解:x甲??xf?f?2705033?819.70(元); x乙??甲=138.14(元); V甲=138.14819.70?16.85%; ?乙=124.05(元)
V乙=124.05866.67?14.31%
? V甲?V乙,所以乙单位职工工资差异程度小
7、解:(1)x原品种=294元 x改良品种=272元;
原品种牛的利润总额=294×600=176400元; 改良品种牛的利润总额=272×750=204000元; 所以应该选择改良品种牛。
(2)若改良品种牛的平均利润少于235.2(176400÷750)元时,牧场主会选择原品种牛。
8、解:该应试者在A项测试的标准分为(115-100)/15=1 该应试者在A项测试的标准分为(425-400)/50=0.5.
可知该应试者在A项测试中的成绩更为理想。