2013年江苏省栟茶高级中学高三数学考前赢分第27天 核心知识 一、抽样方法 1.统计的有关概念: 统计的基本思想:用样本去估计总体; 总体:所要考察对象的全体; 个体:总体中的每一个考察对象; 样本:从总体中抽取的一部分个体叫总体的一个样本; 样本容量:样本中个体的数目; 抽样:从总体中抽取一部分个体作为样本的过程叫抽样. 2.抽样的常见方法: (一)简单随机抽样 ①简单随机抽样的概念 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。 ②简单随机抽样实施的方法: (1)抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。 一般步骤:(1)将总体中的个个体编号;(2)将这个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽取1个号签,连续抽取次;(5)将总体中与抽到的号签的编号一致的个个体取出。 随机数表法:按照一定的规则到随机数表中选取号码的抽样方法。 一般步骤:①将个体编号; ②在随机数表中任选一个数作为开始; ③从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码. (二)系统抽样 ①系统抽样的定义: 一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样 ②系统抽样的步骤 (1)采用随机的方式将总体中的个体编号; (2)为将整个的编号进行分段,要确定分段的间隔k.当是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的总体中的个体数能被n整除,这时. (3)在第1段用简单随机抽样确定起始的个体编号l. (4)按照事先确定的规则(常将l加上间隔k)抽取样本:  (三)分层抽样 ①分层抽样的定义 当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫“层”. ②分层抽样的步骤: (1)分层:将总体按某种特征分成若干部分。 (2)确定比例:计算各层的个体数与总体的个体数的比。 (3)确定各层应抽取的样本容量。 (4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本。 3.三种抽样方法对照表: 类别 共同点 各自特点 相互联系 适用范围  简单随机抽样 抽样过程中每个个体被抽取的概率是相同的 从总体中逐个抽取  总体中的个体数较少  系统抽样  将总体均分成几个部分,按事先确定的规则在各部分抽取 在第一部分抽样时采用简单随机抽样 总体中的个体数较多  分层抽样  将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统 总体由差异明显的几部分组成  二、总体分布的估计 1.频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布。我们把反映总体频率分布的表格称为频率分布表 2.频率分布直方图:反映样本的频率分布规律的直方图。 作频率分布直方图的方法: .把横轴分成若干段,每一线段对应一个组的组距; .然后以此线段为底作一矩形,它的高等于该组的频率/组距; 这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。 3.频率分布折线图 在频率分布直方图中,取相邻矩形上底边的中点顺次连结起来,就得到频率分布折线图(简称频率折线图) 4.密度曲线 如果样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑的曲线,称这条光滑的曲线为总体的密度曲线 5.茎叶图: 茎叶图的概念 一般地,当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。 茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏. . 如:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31, 36,36,37,39,44,49,50 三、总体特征数的估计 1.平均数:叫做n个数据的平均数或均值。 2.极差:一组数据的最大值与最小值的差称为极差 3.方差和标准差;一般地,设一组样本数据 ,其平均数为 ,则称 为这个样本的方差,其算术平方根 为样本的标准差,分别简称样本方差,样本标准差。 方差的另外几种形式 方差的运算性质 设一组样本数据 ,其平均数为 方差为,则 新数据的平均数为,方差仍为 ; 新数据的平均数为,方差为 ; 新数据的平均数为,方差为; 四、线性回归方程: (1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。与函数关系不同,相关关系是一种非确定性关系。 (2)回归分析:对具有相关关系的两个变量进行统计分析的方法。 (3)散点图:表示具有相关关系的两个变量的一组数据的图形。 (4)回归直线方程:,其中, 相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。 解题规范 1http://gk./ 某初级中学有学生人,其中一年级人,二、三年级各人,现要利用抽样方法取人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2, ……,270;使用系统抽样时,将学生统一随机编号1,2, ……,270,并将整个编号依次分为段http://gk./ 如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270; 关于上述样本的下列结论中,说法正确的是 ⑷ ⑴ ⑵http://gk./ ②、③都不能为系统抽样 ⑵http://gk./ ②、④都不能为分层抽样 ⑶http://gk./ ①、④都可能为系统抽样 ⑷http://gk./ ①、③都可能为分层抽样 标准答案 解析:根据定义③的间隔为,可为系统抽样;④的第一个数为,不符合系统抽样,因为间隔为,④的第一个数应该为;分层抽样则要求初一年级应该抽取人,号码在,所以④中的不符合分层抽样。 考前赢分第27天 爱练才会赢 前日回顾. 1.甲校有名学生,乙校有名学生,丙校有名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为人的样本,应在这三校分别抽取学生人数为、、 2 一个容量为的样本数据,分组后组距与频数如下表: 组距        频数  2  3  4  5  4  2  则样本在区间 上的频率为__________________http://gk./ 当天巩固 1.下列两个变量之间的关系中,哪些是相关关系 ①②③ ①.学生的性别与他的数学成绩 ②.人的工作环境与健康状况 ③.女儿的身高与父亲的身高 ④. 正三角形的边长与面积 解析:区别相关关系和函数关系,④为函数关系 2.由下表可计算出变量的线性回归方程必定经过点 (3,1.2)  5 4 3 2 1   2 1.5 1 1 0.5  解析:由线性回归直线方程公式可得恒过点,求得。 3.已知10只狗的血球体积及红血球的测量值如下(x(血球体积,mm),y(血红球数,百万)): x 45 42 46 48 42 35 58 40 39 50  y 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72  (1)画出上表的散点图; (2)求,,,; (3)由散点图判断能否用线性回归方程来刻画与之间的关系,若能,求出线性回归方程. 解析:(1)散点图如下图 (2)  , (3)由散点图知:能用线性回归方程来刻画与之间的关系,设回归直线为   ∴ 线性回归方程为: 前日回顾答案:1 解析:甲校有名学生,乙校有名学生,丙校有名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为人的样本,应在这三校分别抽取学生人,人,人。 2 解析:

【点此下载】