统计
【专题要点】
能够区分三种抽样方法,对不同情况能合理选择抽样方法,并遵循各种抽样方法的步骤逐步进行。
通过具体问题掌握列频率分布表的方法。学会用频率分布表作频率直方图和频率折线图,会用频率直方图对总体分布规律进行估计。
掌握茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计。
理解数据标准差的意义和作用,学会计算平均数,标准差;会用样本的数字特征估计总体的数字特征。
理解相关关系,能够区分两变量间是相关关系还是函数关系。
了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立象形回归方程。
理解回归分析的基本思想,通过具体案例,理解进行残差分析的必要性,以及相关指数对回归模型的刻画。
理解独立性检验的基本思想和步骤。能够用的计算及临界值的比较判断事件的相关与无关
【考纲要求】高考资源网
统计部分要求不太高,主要是考抽样方法与正态分布有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.高考资源网
【知识纵横】
1.抽样
(1)简单随机抽样高考资源网
简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.
(2)系统抽样
系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.
系统抽样的分段间隔,当(N为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体使剩下的个体个数能被n整除,这时.
(3)分层抽样
当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例进行简单随机抽样.
2.用样本估计总体
样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确.
①用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求全距→决定组距与组数→分组→列频率分布表→画频率分布直方图.
②茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便.
③平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为.高考资源网
3.两个变量之间的关系
求回归直线方程的步骤:
第一步:先把数据制成表,从表中计算出;
第二步:计算回归系数的a,b,公式为
高考资源网
第三步:写出回归直线方程.
4.独立性检验
①列联表:列出的两个分类变量和,它们的取值分别为和的样本频数表称为列联表1
分类
1
2
总计
1
2
总计
构造随机变量(其中)
得到的观察值常与以下几个临界值加以比较:高考资源网
如果 ,就有的把握因为两分类变量和是有关系;
如果 就有的把握因为两分类变量和是有关系;
如果 就有的把握因为两分类变量和是有关系;
如果低于,就认为没有充分的证据说明变量和是有关系.
【教法指引】
统计案例
本部分内容主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用,是教材新增内容,估计高考中比重不会过大
(1)知识点将会考察回归分析的基本思想方法,用独立性检验判断A与B间的关系,及2×2列联表;高考资源网
(2)考查的形式主要以选择、填空题为主,但不会涉及很多;
随机变量的分布列
本部分内容主要包括随机变量的概念及其分布列,离散性随机变量的均值和方差,正态分布,从近几年的高考观察,这部分内容有加强命题的趋势。
(1)考查的重点将以随机变量及其分布列的概念和基本计算为主,题型以选择、填空为主,有时也以解答题形式出现;高考资源网
(2)预计2010年高考还是实际情景为主,建立合适的分布列,通过均值和方差解释实际问题;
【典例精析】
1.线性相关性检验
例1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.
解析:
i
1
2
3
4
5
6
7
8
9
10
11
12
xi
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
yi
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
xiyi
2.43
2.264
2.856
3.264
3.590
4.07
4.643
5.090
5.652
6.096
6.653
7.245
=,==2.8475,=29.808,=99.2081,=54.243
1)画出散点图:
2)
r=高考资源网
=
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系
3)设回归直线方程,
利用
,
计算a,b,得b≈1.215, a=≈0.974,
∴回归直线方程为:
2.独立性检验
例2.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:
患慢性气管炎
未患慢性气管炎
合计
吸烟
43
162
205
不吸烟
13
121
134
合计
56
283
339
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?
解析:由公式,因为7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯有关
3.独立的概念及应用
例3.(2009山东卷理)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的
产品净重(单位:克)数据绘制的频率分布直方图,其中产品
净重的范围是[96,106],样本数据分组为[96,98),[98,100),
[100,102),[102,104),[104,106],已知样本中产品净重小于
100克的个数是36,则样本中净重大于或等于98克并且
小于104克的产品的个数是 ( ).
A.90 B.75 C. 60 D.45
答案 A高考资源网
解析 产品净重小于100克的概率为(0.050+0.100)×2=0.300,
已知样本中产品净重小于100克的个数是36,设样本容量为,
则,所以,净重大于或等于98克并且小于
104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本
中净重大于或等于98克并且小于104克的产品的个数是
120×0.75=90.故选A.
4.随机变量的分布列高考资源网
例4.(2009全国卷Ⅱ理)(本小题满分12分)某车间甲组有10名工人,其中有4名女工人;乙组有5名工人,其中有3名女工人,现采用分层抽样方法(层内采用不放回简单随机抽样)从甲、乙两组中共抽取3名工人进行技术考核
(1)求从甲、乙两组各抽取的人数;
(I2)求从甲组抽取的工人中恰有1名女工人的概率;
(3)记表示抽取的3名工人中男工人数,求的分布列及数学期望。
分析 (1)这一问较简单,关键是把握题意,理解分层抽样的原理即可。另外要注意
此分层抽样与性别无关。
(2)在第一问的基础上,这一问处理起来也并不困难。
从甲组抽取的工人中恰有1名女工人的概率
(3)的可能取值为0,1,2,3高考资源网
,,
,
分布列及期望略.
5.随机变量的均值高考资源网
例5.(1)(2009湖南卷文) 一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为 .
答案 120
解析 设总体中的个体数为,则
(2)(2009四川卷文)设矩形的长为,宽为,其比满足∶=,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近高考资源网
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
答案 A
解析 甲批次的平均数为0.617,乙批次的平均数为0.613
6.随机变量的方差
例6.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:
ε
0
1
2
η
0
1
2
P
P
试对这两名工人的技术水平进行比较。
分析:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小。
解析:工人甲生产出次品数ε的期望和方差分别为:
,高考资源网
;
工人乙生产出次品数η的期望和方差分别为:
,
;
由Eε=Eη知,两人出次品的平均数相同,技术水平相当,但Dε>Dη,可见乙的技术比较稳定。
7.正态分布
例7.2009全国卷Ⅱ文)(本小题满分12分)某车间甲组有10名工人,其中有4名女工人;
乙组有10名工人,其中有6名女工人。现采用分层抽样(层内采用不放回简单随即抽样)从甲、乙两组中共抽取4名工人进行技术考核。
(1)求从甲、乙两组各抽取的人数;
(2)求从甲组抽取的工人中恰有1名女工人的概率;高考资源网
(3)求抽取的4名工人中恰有2名男工人的概率。
解析 本题考查概率统计知识,要求有正确理解分层抽样的方法及利用分类原理处理事件概率的能力,第一问直接利用分层统计原理即可得人数,第二问注意要用组合公式得出概率,第三问关键是理解清楚题意以及恰有2名男工人的具体含义,从而正确分类求概率.
解 (1)由于甲、乙两组各有10名工人,根据分层抽样原理,要从甲、乙两组中共抽
取4名工人进行技术考核,则从每组各抽取2名工人.
(2)记表示事件:从甲组抽取的工人中恰有1名女工人,则
(3)表示事件:从甲组抽取的2名工人中恰有名男工人,
表示事件:从乙组抽取的2名工人中恰有名男工人,
表示事件:抽取的4名工人中恰有2名男工人。
与独立, ,且
故高考资源网
高考资源网
【点此下载】