2013年江苏省栟茶高级中学高三数学考前赢分第27天
核心知识
一、抽样方法
1.统计的有关概念:
统计的基本思想:用样本去估计总体;
总体:所要考察对象的全体;
个体:总体中的每一个考察对象;
样本:从总体中抽取的一部分个体叫总体的一个样本;
样本容量:样本中个体的数目;
抽样:从总体中抽取一部分个体作为样本的过程叫抽样.
2.抽样的常见方法:
(一)简单随机抽样
①简单随机抽样的概念
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
②简单随机抽样实施的方法:
(1)抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
一般步骤:(1)将总体中的个个体编号;(2)将这个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽取1个号签,连续抽取次;(5)将总体中与抽到的号签的编号一致的个个体取出。
随机数表法:按照一定的规则到随机数表中选取号码的抽样方法。
一般步骤:①将个体编号;
②在随机数表中任选一个数作为开始;
③从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.
(二)系统抽样
①系统抽样的定义:
一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样
②系统抽样的步骤
(1)采用随机的方式将总体中的个体编号;
(2)为将整个的编号进行分段,要确定分段的间隔k.当是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的总体中的个体数能被n整除,这时.
(3)在第1段用简单随机抽样确定起始的个体编号l.
(4)按照事先确定的规则(常将l加上间隔k)抽取样本:
(三)分层抽样
①分层抽样的定义
当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫“层”.
②分层抽样的步骤:
(1)分层:将总体按某种特征分成若干部分。
(2)确定比例:计算各层的个体数与总体的个体数的比。
(3)确定各层应抽取的样本容量。
(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本。
3.三种抽样方法对照表:
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率是相同的
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均分成几个部分,按事先确定的规则在各部分抽取
在第一部分抽样时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统
总体由差异明显的几部分组成
二、总体分布的估计
1.频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布。我们把反映总体频率分布的表格称为频率分布表
2.频率分布直方图:反映样本的频率分布规律的直方图。
作频率分布直方图的方法:
.把横轴分成若干段,每一线段对应一个组的组距;
.然后以此线段为底作一矩形,它的高等于该组的频率/组距;
这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。
3.频率分布折线图
在频率分布直方图中,取相邻矩形上底边的中点顺次连结起来,就得到频率分布折线图(简称频率折线图)
4.密度曲线
如果样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑的曲线,称这条光滑的曲线为总体的密度曲线
5.茎叶图:
茎叶图的概念 一般地,当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;
(2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;
(3)茎叶图对重复出现的数据要重复记录,不能遗漏.
. 如:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,
36,36,37,39,44,49,50
三、总体特征数的估计
1.平均数:叫做n个数据的平均数或均值。
2.极差:一组数据的最大值与最小值的差称为极差
3.方差和标准差;一般地,设一组样本数据 ,其平均数为 ,则称
为这个样本的方差,其算术平方根
为样本的标准差,分别简称样本方差,样本标准差。
方差的另外几种形式
方差的运算性质
设一组样本数据 ,其平均数为 方差为,则
新数据的平均数为,方差仍为 ;
新数据的平均数为,方差为 ;
新数据的平均数为,方差为;
四、线性回归方程:
(1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。与函数关系不同,相关关系是一种非确定性关系。
(2)回归分析:对具有相关关系的两个变量进行统计分析的方法。
(3)散点图:表示具有相关关系的两个变量的一组数据的图形。
(4)回归直线方程:,其中, 相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。
解题规范
1http://gk./ 某初级中学有学生人,其中一年级人,二、三年级各人,现要利用抽样方法取人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2, ……,270;使用系统抽样时,将学生统一随机编号1,2, ……,270,并将整个编号依次分为段http://gk./ 如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270;
关于上述样本的下列结论中,说法正确的是 ⑷
⑴ ⑵http://gk./ ②、③都不能为系统抽样
⑵http://gk./ ②、④都不能为分层抽样
⑶http://gk./ ①、④都可能为系统抽样
⑷http://gk./ ①、③都可能为分层抽样
标准答案
解析:根据定义③的间隔为,可为系统抽样;④的第一个数为,不符合系统抽样,因为间隔为,④的第一个数应该为;分层抽样则要求初一年级应该抽取人,号码在,所以④中的不符合分层抽样。
考前赢分第27天 爱练才会赢
前日回顾.
1.甲校有名学生,乙校有名学生,丙校有名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为人的样本,应在这三校分别抽取学生人数为、、
2 一个容量为的样本数据,分组后组距与频数如下表:
组距
频数
2
3
4
5
4
2
则样本在区间 上的频率为__________________http://gk./
当天巩固
1.下列两个变量之间的关系中,哪些是相关关系 ①②③
①.学生的性别与他的数学成绩 ②.人的工作环境与健康状况
③.女儿的身高与父亲的身高 ④. 正三角形的边长与面积
解析:区别相关关系和函数关系,④为函数关系
2.由下表可计算出变量的线性回归方程必定经过点 (3,1.2)
5
4
3
2
1
2
1.5
1
1
0.5
解析:由线性回归直线方程公式可得恒过点,求得。
3.已知10只狗的血球体积及红血球的测量值如下(x(血球体积,mm),y(血红球数,百万)):
x
45
42
46
48
42
35
58
40
39
50
y
6.53
6.30
9.25
7.50
6.99
5.90
9.49
6.20
6.55
7.72
(1)画出上表的散点图; (2)求,,,; (3)由散点图判断能否用线性回归方程来刻画与之间的关系,若能,求出线性回归方程.
解析:(1)散点图如下图
(2)
,
(3)由散点图知:能用线性回归方程来刻画与之间的关系,设回归直线为
∴ 线性回归方程为:
前日回顾答案:1 解析:甲校有名学生,乙校有名学生,丙校有名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为人的样本,应在这三校分别抽取学生人,人,人。
2 解析:
【点此下载】