第24课时 方差与标准差
【学习导航】
学习要求
1.体会方差与标准差也是对调查数据的一种简明的描述,要求熟练记忆公式,并能用于生产实际和科学实验中;
2.体会方差与标准差对数据描述中的异同。
【课堂互动】
自学评价
案例 有甲乙两种钢筋现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.
甲
110
120
130
125
120
125
135
125
135
125
乙
115
100
125
130
115
125
125
145
125
145
哪种钢筋的质量较好?
【分析】
在平均数相同的情况下,观察上述数据表,发现乙样本的最小值100低于甲样本的最小值110,最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
在平均数相同的情况下,比较两组数据的极差能大概判断它们的稳定程度.
极差: 我们把一组数据的最大值与最小值的差称为极差.
从数据表上可以看出,乙的极差较大,数据较分散;甲的极差小,数据较集中,这就说明甲比乙稳定.
运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.这时,我们考虑用更为精确的方法——方差.
在上一课时中,学习了总体平均数的估计,其中提到平均数是“最理想”近似值的缘由.同样我们可以考虑每一抗拉强度与平均抗拉强度的离差,离差越小,稳定性就越高.
那么,怎样来刻画一组数据的稳定程度呢?
在上一课时中,设n个实验值(=1,2,…,n)的近似值为,那么它与这n个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为
()2+()2+…+()2
=,
所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n个数据,,…,的平均数或均值,一般记为 .
在上述过程中,可以发现,一组数据与其平均数的离差的平方和最小,考虑用与其平均数的离差的平方和来刻画一组数据的稳定程度是可行的.即本案例中,可用各次抗拉强度与平均抗拉强度的差的平方和表示.由于比较的两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差.
因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差.标准差也可以刻画数据的稳定程度.
一般地,设一组样本数据,其平均数为,则称
为这个样本的方差,其算术平方根 为样本的标准差,分别简称样本方差,样本标准差.
根据上述方差计算公式可算得甲、乙两个样本的方差分别为50和165,故可认为甲种钢筋的质量好于乙种钢筋.
【精典范例】
例1 甲、乙两种冬水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2), 试根据这组数据估计哪一种水稻品种的产量比较稳定:
品 种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
【解】
甲品种的样本平均数为10,样本方差为
=0.02
乙品种的样本平均数也为10,样本方差为
=0.24
例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差
天 数
151
~
180
181
~
210
211
~
240
241
~
270
271
~
300
301
~
330
331
~
360
361
~
390
灯泡数
1
11
18
20
25
16
7
2
【分析】用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命。
【解】
各组中值分别为165,195,225,255,285,315,
345,375,由此算得平均数约为
=267.9
将各组中值对于此平均数求方差得
=2128.60(天2)
故标准差约为
答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天。
例3(1)求下列各组数据的方差与标准差(结果精确到0.1):
甲
1
2
3
4
5
6
7
8
9
乙
11
12
13
14
15
16
17
18
19
丙
10
20
30
40
50
60
70
80
90
丁
3
5
7
9
11
13
15
17
19
(2)比较计算结果,各组方差和标准差的关系是什么?
【解】
甲:6.7,2.6; 乙:6.7,2.6
丙:666.7,25.8 丁:26.7,5.2
乙的方差与标准差分别与甲的相同;
丙的方差是甲的方差的100倍,标准差是甲的10倍;
丁的方差是甲的方差的4倍,标准差是甲的2倍
例4某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如下
家庭人均月收入(元)
工作人员数
管理人员数
20
5
60
10
200
50
80
20
40
15
合 计
400
100
(1)一般工作人员家庭人均月收入的估计及其方差的估计;
(2)管理人员家庭人均月收入的估计及其方差的估计
(3)平均数的估计及总体方差的估计
【解】分组数据用组中值作为本组数据的代表。
(1) =995, =83475
(2) =1040, =90900
(3) =1004 =85284
追踪训练
1.若样本,,,...,的平均数,方差,则样本,,,...,的平均数=______20_____ ,=____0.4_____.
2.若,…,的方差为3,则,,…,的方差为12。
3.计算下列两组数据的平均数和标准差.
甲
9.9
10.3
9.8
10.1
10.4
10.0
9.8
9.7
乙
10.2
10.0
9.5
10.3
10.5
9.6
9.8
10.1
解:
甲的平均数为:0.66
标准差:0.21
乙的平均数为:10
标准差:0.92
第9课时方差与标准差
分层训练
1.以下可以描述总体稳定性的统计量是( )
(A)样本均值 (B)样本中位数
(C)样本方差 (D)样本最大值x(n)
2.已知两个样本数据如下
甲
9.9
10.2
9.8
10.1
9.8
10
10.2
乙
10.1
9.6
10
10.4
9.7
9.9
10.3
则下列选项正确的是 ( )
(A) (B)
(C) (D)
3.设一组数据的方差是,将这组数据的每个数据都乘10,所得到的一组新数据的方差是
( )
(A)0.1 (B) (C)10 (D)100
4.已知…,的方差为2,则2+3, 2+3,…,2+3的标准差是___________
5.某医院急诊中心关于其病人等待急诊的时间记录如下:
等待时间(分钟)
[0,5)
频 数
4
8
5
3
用上述分组资料计算得病人平均等待时间的估计值=_______,病人等待时间标准差的估计值s=___________
6.已知样本99,100,101,x ,y的平均数是100,方差是2,则=________
7.(1)美国加利福尼亚州州长提出给所有的州政府雇员月薪增加70美元。这对于州政府雇员的平均月薪将会有何影响?对于月薪的标准差呢?
(2)整个政府部门的月薪递增5%将对平均月薪有何影响?对于月薪的标准差呢?
8.甲、乙两机床同时加工直径为100mm的零件,为检验质量,从中抽取6件测量数据为
甲
99
100
98
100
100
103
乙
99
100
102
99
100
100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定。
拓展延伸
9.假定以下数据是甲、乙两个供货商的交货天数:
甲
10
9
10
10
11
11
9
11
10
10
乙
8
8
14
10
11
10
7
15
12
10
估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间比较具有一致性与可靠性。
10.已知样本90, 83, 86, 85, 83, 78, 74, 73, 71, 70的方差为 ,且关于的方程的两根的平方和恰好是,求的值。
w.w.w.k.s.5.u.c.o.m
【点此下载】