统计
1.了解随机抽样,了解分层抽样的意义.
2.会用样本频率分布估计总体的概率分布.
3.会用样本平均数估计总体期望,会用样本的方差、标准差估计总体方差、标准差.
“统计”这一章,是初中数学中的“统计初步”的深化和拓展.要求主要会用随机抽样,分层抽样的方法从总体中抽取样本,并用样本频率分布估计总体分布.本章高考题以基本题(中、低档题)为主,每年只出一道填空题,常以实际问题为背景,综合考查学生应用基础知识解决实际问题的能力.高考的热点是总体分布的估计和抽样方法.知识的交汇点是排列、组合、概率与统计的解答题.
第1课时 抽样方法与总体分布估计
1.总体、样本、样本容量
我们要考察的对象的全体叫做_______,其中每个考察的对象叫_______.从总体中抽出的一部分个体叫做_______,样本中个体的数目叫做_______.
2.简单随机抽样
设一个总体由N个个体组成,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个个体被抽到的_______相等,就称这样的抽样为_______.
3.分层抽样
当已知总体由_______的几部分组成时,为了使样本更能充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的_______进行抽样,这种抽样叫做_______.其中所分成的各个部分叫做_______.
4.总体分布和样本频率分布
总体取值的_______分布规律称为总体分布.
样本频率分布_______称为样本频率分布.
5.总体分布估计:
总体分布估计主要指两类.一类是用样本的频率分布去估计总体(的概率)分布.二类是用样本的某些数字特征(例如平均数、方差、标准差等)去估计总体的相应数字特征.
6.频率分布条形图和直方图:
两者都是用来表示总体分布估计的.其横轴都是表示总体中的个体.但纵轴的含义却截然不同.前者纵轴(矩形的高)表示频率;后者纵轴表示频率与组距的比,其相应组距上的频率等于该组距上的矩形的面积.
7.总体期望值
指总体平均数.
例1. 某公司在甲、乙、丙、丁四个地区分别有150个,120个,180个,150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②;则完成①②这两项调查采用的抽样方法依次是 ( )
A.分层抽样,系统抽样
B.分层抽样,简单随机抽样法
C.系统抽样,分层抽样
D.简单随机抽样法,分层抽样法
解:B
变式训练1:某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法从中抽取20人,各年龄段分别抽取多少人( )
A.7,5,8 B.9,5,6
C.6,5,9 D.8,5,7
解:B
样本容量与总体个数的比为20:100=1:5
各年龄段抽取的人数依次为:
(人)
例2. 一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本。
解:(1)系统抽样方法:将200个产品编号1,2,…,200,再将编号分为20段,每段10个编号,第一段为110号,…,第20段为191200号.在第1段用抽签法从中抽取1个,如抽取了6号,再按预先给定规则,通常可用加间隔数10,第二段取16号,第三段取26号,…,第20段取196号,这样可得到一个容量为20的样本.
(2)分层抽样方法:因为样本容量与总体的个体数的比为20:200=1:10,所以一、二、三级品中分别抽取的个体数目依次是,即10,6,4.
将一级品的100个产品按00,01,02,…,99编号,将二级品的60个产品按00,01,02,…,59编号,将三级品的40个产品按00,01,02,…,39编号,采用随机数表示,分别抽取10个,6个,4个.这样可得容量为20的一个样本.
变式训练2:在100个产品中,一等品20个,二等品30个,三等品50个,用分层抽样的方法抽取一个容量为20的样本.
(1)简述抽样过程;
(2) 用这种抽样方法可使总体中每个个体被抽到的概率是多少?
解:先将产品按等级分成三层,每一层:一等品20个,第二层:二等品30个,第三层:三等品50个,然后确定每一层抽取样品数.因为20:30:50=2:3:5,.所以在第一层中抽取4个,第二层中抽取6个,第三层中抽取10个.最后用简单随机抽样方法在第一层中抽4个,第二层中抽6个,第三层中抽10个.
(2)一等品被抽到的概率为,二等品被抽到的概率为,三等品被抽到的概率为,即每个个体被抽到的概率都是
例3. (2004年高考-江苏) 某校为了了解学生的课外阅读情况
,随机调查了50名学生,得到阅读所用时间的数据结果用条形图
表示如下,根据条形图,问这50名学生这一天平均每人的课外
阅读时间为多少?
解:由条形图知,在调查的50名同学中课外阅读时间
为的人分别为5人,20人,10人,10人,5人.
所以这一天中平均每人的课外阅读时间为50=0.9(h)
变式训练3:观察下面的频率分布表
分组
频数
频率
[3.95,4.35)
2
[4.35,4.75)
4
[4.75,5.15)
14
[5.15,5.55)
25
[5.55,5.95)
45
[5.95,6.35)
46
[6.35,6.75)
39
[6.75,7.15)
20
[7.15,7.55)
4
[7.55,7.95)
1
合计
200
(1) 完成上面的频率分布表
(2) 根据上表,画出频率分布直方图
(3) 根据表和图估计数据落在[4.75,7.15)范围内的概率约是多少?数据小于7.00的概率约是多少?
解:(1) (略) (2)频率直方图(略) (3)根据上面的表和图可以估计,数据落在[4.75,7.15)内的概率约为0.945,数据小于7.00的概率约为0.9375
例4. 某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,以每人被抽取的概率为0.2,向该中学抽取一个容量为n的样本,求n的值.
解:一年级,二年级,三年级人数总和为400+320+280=1000(人),则
变式训练4:一个总体有6个个体,要通过逐个抽取的方法从中抽取一个容量为3的样本,求:
(1)每次抽取时各个个体被抽到的概率;
(2)指定的个体在三次抽取时各自被抽到的概率;
(3)整个抽样过程中个体被抽到的概率;
解:
1.两种抽样方法的比较:
类别
共同点
不同点
联 系
适用范围
简单
随机
抽样
抽样过
程中每
个个体
被抽取
的概率
相等
从总体中逐个抽取
各层抽样时采用简单随机抽样
总体中的个体数较少
分层
抽样
将总体分成几层进行抽取
总体由差异明显的几部分组成
2.简单随机抽样是一种不放回抽样,所取的样本没有被重复抽取的情况.分层抽样,分层时不要求均分,但抽样时,要按各层中个体总数的比例在各层中抽取个体.以上两种抽样都是一种等概率抽样(即抽样方法的公平性).这种等概率抽样包含有两层含义,其一、每次从总体中抽取一个个体时,各个个体被抽取的概率是相等的.其二、在整个抽样过程中,各个个体被抽取到的概率相等.
3.注意以下几个概念的区别与联系:频数、频率、概率.
4.频率分布条形图是用高度来表示概率的,而概率分布直方图是用面积来表示概率的.
5.统计内容的实践性较强,其重点是如何用样本频率分布去估计总体分布,难点是对频率分布直方图的理解和应用.
第2课时 总体特征数的估计
1.在统计学中,我们是用样本的数字特征来估计总体相应的数字特征的.
2.样本平均数(也称样本期望值)
(1)反映的是这组数据的平均水平.
(2)当数值较大时,可将各个数据同时减去一个适当的数,得=,那么
(3)如果个数据中,出现次, 出现次,…, 出现次,那么:
这里
3.方差(1)
分别称为数据的方差和标准差,它们反映的是数据的稳定与波动,集中与离散的程度.
(2)
(3)数值较大时,可以将各数据减去一个恰当的常数a,得到则
例1.某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
统计量
级别
平均
标准差
第一组
90
6
第二组
80
4
求全班的平均成绩和标准差.
解:设第一组20名学生的成绩为;
第二组20名学生的成绩为,
故全班平均成绩为:
又设第一组学生的成绩的标准差为,第二组学生的成绩的标准差为,则
此处()
又设全班40名学生的标准差为S,平均成绩为故有
变式训练1:对甲乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲:60 80 70 90 70
乙:80 60 70 80 75
问:甲乙谁的各科平均成绩好?谁的各门功课发展较平衡?
解: 因为,.所以甲的平均成绩较好,乙的各门发展较平衡.
例2. 甲乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸分别为(单位:mm)
甲: 10.2 10.1 10.9 8.9 9.9 10.3 9.7 10
9.9 10.1
乙: 10.3 10.4 9.6 9.9 10.1 10 9.8 9.7
10.2 10
分别计算上面两个样本的平均数与方差.如果图纸上的设计尺寸为10mm,从计算结果看,用哪台机床加工这种零件较合适.
解:
,
所以乙比甲稳定,用乙较合适.
变式训练2:假定下述数据是甲乙两个供货商的交货天数:
甲:10 9 10 10 11 11 9 11 10 10
乙:8 10 14 7 10 11 10 8 15 12
估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性.
从交货天数的平均值看来,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此是较具一致性与可靠性的供货商.
例3. 个体户王某经营一家餐馆,下面是餐馆所有工作人员在某个月份的工资:
王某
厨师甲
厨师乙
杂工
招待甲
招待乙
会计
3000元
450元
400元
320元
350元
320元
410元
(1)计算平均工资;
(2) 计算出的平均工资能否反映帮工人员这个月收入的一般水平?
(3)去掉王某工资后,再计算平均工资;
(4)后一个平均工资能代表帮工人员的收入吗?
(5)根据以上计算,从统计的观点看,你对(1)、(3)的结果有什么看法?
解:(1)平均工资750元;
(2)因为帮工人员的工资低于平均工资,所以(1)中算出的平均工资不能反映帮工人员在这个月份的月收入的一般水平;(3)去掉王某的工资后的平均工资375元;(4)(3)中计算的平均工资接近于帮工人员月工资收入,所以它能代表帮工人员的收入;(5)从本题的计算可见,个别特殊值对平均数具有很大的影响,因此在选择样本时,样本中尽量不要选特殊数据.
变式训练3:甲乙两人在相同条件下,射靶10次,命中环数如下:
甲:8 6 9 5 10 7 4 8 9 5
乙:7 6 5 8 6 9 6 8 7 7
依上述数据估计 ( )
A.甲比乙的射击技术稳定
B.乙比甲的射击技术稳定
C.两人没有区别
D.两人区别不大
解:B
例4. 为了科学地比较考试成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为:z=(其中x是某位同学的考试分数,是该次考试的平均分,s是该次考试的标准差,z称为这位学生的标准分).转化为标准分后可能出现小数和负值,因此,又常常将z分数作线性变换转化或其他分数,例如某次学生选拔考试采用的是T分数,试性变换公式是:T=40z+60,已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T分数为多少?
解:84分
变式训练4:经问卷调查,某班学生对摄影分别执“喜欢”,“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢“的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的是:5位“喜欢”摄影的同学,1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的人数为多少?
解:设班里“喜欢”的y人,“一般”的x人,“不喜欢”的x-12人.
∴ ∴x=18
又 ∴y=30
即全班“喜欢”摄影的人数为30.
方差是反映稳定性程度的一个重要特征,在日常生活中常有体现,如两同学的总成绩都一样,但是一个人有偏科现象,而另一个人没有,一般认为没有偏科现象(即方差小)的同学成绩要稳定一些.
统计初步章节测试题
一选择题
1.某市为了分析全市9 800名初中毕业生的数学考试成绩,共抽取50本试卷,每本都是30份,则样本容量是………………………………………………………………( )
(A)30 (B)50 (C)1 500 (D)9 800
2.有下面四种说法:
(1)一组数据的平均数可以大于其中每一个数据;
(2)一组数据的平均数可以大于除其中1个数据外的所有数据;
(3)一组数据的标准差是这组数据的方差的平方;
(4)通常是用样本的频率分布去估计相应总体的分布.
其中正确的有……………………………………………………………………( )
(A)1种 (B)2种 (C)3种 (D)4种
3.已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a,x4,x5,x6,…,x10的平均数为b,则样本数据的平均数为…………………………………………( )
(A) (B) (C) (D)
4.已知样本数据x1,x2,…,xn的方差为4,则数据2x1+3,2x2+3,…,2xn+3的方差为……………………………………………………………………………………( )
(A)11 (B)9 (C)4 (D)16
5.同一总体的两个样本,甲样本的方差是-1,乙样本的方差是-,则( )
(A)甲的样本容量小 (B)甲的样本平均数小
(C)乙的平均数小 (D)乙的波动较小
6.某校有500名学生参加毕业会考,其中数学成绩在85~100分之间的有共180人,这个分数段的频率是……………………………………………………………………( )
(A)180 (B)0.36 (C)0.18 (D)500
7.某校男子足球队22名队员的年龄如下:
16 17 17 18 14 18 16 18 17 18 19
18 17 15 18 17 16 18 17 18 17 18
这些队员年龄的众数与中位数分别是……………………………………………( )
(A)17岁与18岁 (B)18岁与17岁 (C)17岁与17岁 (D)18岁与18岁
校六月份里5天的日用电量,结果如下(单位:kW).
400 410 395 405 390
根据以上数据,估计这所学校六月份的总用电量为………………………………( )
(A)12 400 kW (B)12 000 kW (C)2 000 kW (D)400 kW
【提示】(400+410+395+405+390)=400,故30×400=12000.
9.已知下列说法:
(1)众数所在的组的频率最大;
(2)各组频数之和为1;
(3)如果一组数据的最大值与最小值的差是15,组距为3,那么这组数据应分为5组;
(4)频率分布直方图中每个小长方形的高与这一组的频数成正比例.
正确的说法是……………………………………………………………………( )
(A)(1)(3) (B)(2)(3) (C)(3)(4) (D)(4)
10.近年来国内生产总值年增长率的变化情况如图.从图上看,下列结论中不正确的是……………………………………………………………………………………( )
(A)1995所~1999年,国内生产总值的年增长率逐年减小
(B)2000年国内生产总值的年增长率开始回升
(C)这7年中,每年的国内生产总值不断增长
(D)这7年中,每年的国内生产总值有增有减
二填空题
11.一批灯泡共有2万个,为了考察这批灯泡的使用寿命,从中抽查了50个灯泡的使用寿命,在这个问题中,总体是__________,样本容量是__________,个体是__________.
12.一个班5名学生参加一次演讲比赛,平均得分是89分,有2名学生得87分,两名学生得92分,这组数据的众数是__________.
13.某次考试A,B,C,D,E这5名学生的平均分为62分,若学生A 除外,其余学生的平均得分为60分,那么学生A 的得分是__________.
14.样本数据-1,2,0,-3,-2,3,1的标准差等于__________.
15.把容量是64的样本分成8组,从第1组到第4组的频数分别是5,7,11,13,第5组到第7组的频率是0.125,那么第8组的频数是__________,频率是__________.
16.某班通过一次射击测试,在甲、乙两名同学中选出一名同学代表班级参加校射击比赛.这两位同学在相同条件下各射靶5次,所测得的成绩分别如下(单位:环):
甲 9.6 9.5 9.3 9.4 9.7
乙 9.3 9.8 9.6 9.3 9.5
根据测试成绩,你认为应该由__________代表班级参赛.
三解答题:
17.近年来,由于乱砍滥伐,掠夺性使用森林资源,我国长江、黄河流域植被遭到破坏,土地沙化严重,洪涝灾害时有发生.沿黄某地区为积极响应和支持“保护母亲河”的倡议,建造了长100千米,宽0.5千米的防护林.有关部门为掌握这一防护林共约有多少棵树,从中选出10块(每块长1千米,宽0.5千米)进行统计,每块树木数量如下(单位:棵)
65 100 63 200 64 600 64 700 67 300
63 300 65 100 66 600 62 800 65 500
请你根据以上数据计算这一防护林共约有多少棵树(结果保留3个有效数字).
18.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5 月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图如下.已知从左至右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,这两组哪组获奖率较高?
19.从甲、乙、丙三个厂家生产的同一种产品中,各抽出8件产品,对其使用寿命进行跟踪调查,结果如下(单位:年)
甲 3 4 5 6 8 8 8 10
乙 4 6 6 6 8 9 12 13
丙 3 3 4 7 9 10 11 12
三家广告中都称这种产品的使用寿命是8年.请根据调查结果判断厂家在广告中分别运用了平均数、众数、中位数中哪一种反映集中趋势的特征数.
20.已知数据x1,x2,x3,x4,x5,其中每一个数均为非负整数且互不相等,中位数是2,=2.(1)求这组数据;(2)计算这组数据的标准差.
21.(15分)某商店将甲、乙两种糖果混合销售,并按以下公式确定混合糖果的单价:单价=(元/千克),其中m1、m2 分别为甲、乙两种糖果的重量(千克),a1、a2分别为甲、乙两种糖果的单价(元/千克).已知甲种糖果单价为20元/千克,乙种糖果单价为16元/千克.现将10千克乙种糖果和一箱甲种糖果混合(搅拌均匀)销售,售出5千克后,又在混合糖果中加入5千克乙种糖果,再出售时,混合糖果的单价为17.5元/千克.这箱甲种糖果有多少千克?
统计初步章节测试题参考答案
一选择题
1.【提示】抽取50本,每本30份,这说明什么?
【答案】C.
【点评】样本容量是样本个体的数量.注意:(A)、(B)错在未理解样本容量的意义,(D)是总体中个体的数量.
2.【提示】(2)、(4)正确.
【答案】B.
【点评】本题涉及到平均数、方差、标准差、频率分布、用样本估计总体等知识点.
3.【提示】前3个数据和为3 a,后7个数据的和7 b,样本平均数为10个数据的和除以10.
【答案】B.
【点评】本题考查平均数的求法.注意不能把两个平均数的和相加除以2而误选为(A).
4.【提示】每一个数据都乘以2,则方差变为22×4=16,再把每一个数据加3,不改变方差的大小.
【答案】D.
5.【提示】-1=,-=,故-1>-.
【答案】D.
【点评】本题考查方差的意义,本题解题关键是方差的大小比较.
6.【提示】=0.36.
【答案】B.
7.【答案】B.
8.【提示】(400+410+395+405+390)=400,故30×400=12000.
【答案】B.
【点评】本题需用样本平均数估计总体平均数.注意本题要求的是全月的用电量.
9.【答案】D.
【点评】本题考查与频率分布有关的概念.判断(4)正确,是因为每一个小长方形的高等于=×频数,故小长方形的高与频数成正比例.
10.【提示】认真读懂统计图是关键.
【答案】D.
【点评】本题是图象阅读题,要注意分清横轴、纵轴意义还要注意本题纵轴反映的是增长率的变化情况,而选择支中涉及的是国内生产总值.
二填空题
11.【答案】2万个灯泡使用寿命的全体,50,每个灯泡的使用寿命.
【点评】注意样本容量没有单位.
12.【提示】设另一名学生得x分,则(92+87)×2+x=89×5,解得x=87.
【答案】87.
【点评】本题关键是列方程求得另一名学生的成绩.
13.【分析】设A得分为x分,其余4名学生得分的和为60×4=240分,则240+x=62×5,x=70.
【答案】70分.
14.【提示】s 2=(1+4+0+9+4+9+1)=4.
【答案】2.
【点评】求标准差一般先计算出样本方差,再取其算术平方根.
15.【提示】64×0.125=8,故64-5-7-11-13-8×3=4,=0.062 5.
【答案】4,0.062 5.
【点评】注意应用各组频数之和等于样本容量、频率之和为1这两个性质.
16.【提示】比较平均数与方差.
【答案】甲.
三解答题:
17【解】先计算出=(65 100+63 200+64 600+64 700+67 300+63 300
+65 100+66 600+62 800+65 500)
=64 820.
于是,可以估计这一防护林平均每块约有64820株树.又64 820×100=6 482 000≈6.48×106(株),于是可以估计这一防护林大约共有6.48×106株树.
【点评】本例一方面要求学生有用样本估计总体的思想方法,另一方面要求学生有应用数学的意识,这是今后中考命题发展的趋势.
18.【解】(1)依题意,可算出第三组的频率为
=,
然后依据频率=,知本次活动其参评的作品数==60(件);
(2)根据频率分布直方图,可看出第四组上交的作品数量最多,共有
(件);
(3)易求得第四组获奖率为=,
第六组获奖率为=,
由此可知,第六组获奖率较高.
19.【答案】甲:众数 乙:平均数 丙:中位数
20.【解】(1)因各数据互不相等,不妨设x1<x2<x3<x4<x5,则x3=2,故这组数据为0,1,2,3,4.
(2)s=(12+22+32+42+02-5×22)=.
21.【提示】本题要依题意找到其中的等量关系,列出方程以求解.
【解】设这箱甲种糖果有x千克,则有
(x+5)+80=17.5(x+10).
化简,得
2.5 x2-10 x-150=0,
即
x2-4 x-60=0.
解得
x1=10,x2=-6.
经检验,x1=10,x2=-6都是原方程的根,但x=-6不合题意,舍去.
故这箱甲种糖果有10千克.
【点此下载】