第2讲 用样本估计总体 【2013年高考会这样考】 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主. 2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数). 【复习指导】 1.由于高考对统计考查的覆盖面广,几乎对所有的统计考点都有所涉及,其中频率分布直方图、均值与方差、茎叶图是核心考点,需要好好掌握.复习时,对于统计的任何环节都不能遗漏,最主要的是掌握好统计的基础知识,适度的题量练习. 2.高考对频率分布直方图或茎叶图与概率相结合的题目考查日益频繁.因此,复习时要加强这方面的训练,弄清图表中有关量的含义,并从中提炼出有用的信息,为后面的概率计算打好基础.   基础梳理 1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征. (2)作频率分布直方图的步骤 ①求极差(即一组数据中最大值与最小值的差). ②决定组距与组数. ③将数据分组. ④列频率分布表. ⑤画频率分布直方图. (3)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 3.茎叶图的优点 用茎叶图表示数据有两个突出的优点: 一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到; 二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. 4.样本方差与标准差 设样本的元素为x1,x2,…,xn,样本的平均数为, (1)样本方差:s2=[(x1-)2+(x2-)2+…+(xn-)2]. (2)样本标准差: s= .  两个异同 (1)众数、中位数与平均数的异同 ①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. ②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质. ③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题. ④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. (2)标准差与方差的异同 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差. 三个特征 利用频率分布直方图估计样本的数字特征: (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值. (2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标. 双基自测 1.(人教A版教材习题改编)某工厂生产滚珠,从某批产品中随机抽取8粒,量得直径分别为(单位:mm):14.7,14.6,15.1,15.0,14.8,15.1,15.0,14.9,则估计该厂生产的滚珠直径的平均数为(  ). A.14.8 mm B.14.9 mm C.15.0 mm D.15.1 mm 解析 平均数=(14.7+14.6+15.1+15.0+14.8+15.1+15.0+14.9)=14.9 (mm). 答案 B 2.(2012·合肥月考)一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]  频数 12 13 24 15 16 13 7  则样本数据落在(10,40]上的频率为(  ). A.0.13 B.0.39 C.0.52 D.0.64 解析 由列表可知样本数据落在(10,40]上的频数为52,故其频率为0.52. 答案 C 3.(人教A版教材习题改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是(  ). A.14 B.16 C.15 D.17 解析 将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为=15. 答案 C 4.  某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有(  ). A.30辆 B.40辆 C.60辆 D.80辆 解析 由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆). 答案 B 5.(2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=________. 解析 平均数==7. ∴s2=[(10-7)2+(6-7)2+(8-7)2+(5-7)2+ (6-7)2]=×(9+1+1+4+1)=3.2. 答案 3.2   考向一 频率分布直方图的绘制与应用 【例1】?某校从  参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题: (1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分. [审题视点] 利用各小长方形的面积和等于1求[70,80)内的频率. 解   (1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示. (2)平均分为:x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).  频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法. 【训练1】 (2011·湖北)有  一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为(  ). A.18 B.36 C.54 D.72 解析 样本数据落在区间[10,12)内的频率1-(0.19+0.15+0.05+0.02)×2=0.18,所以数据落在此区间的频数为200×0.18=36. 答案 B 考向二 茎叶图的应用 【例2】?如图是某青年歌手  大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有(  ). A.a1>a2 B.a2>a1 C.a1=a2 D.a1,a2的大小与m的值有关 [审题视点] 去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论. 解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B. 答案 B  由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等. 【训练2】 在  一项大西瓜品种的实验中,共收获甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如图所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是: (1)__________________________________________; (2)__________________________________________. 解析 从这个茎叶图可以看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除了一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳定,总体情况比乙好. 答案 (1)甲种大西瓜的平均重量大于乙种大西瓜 (2)甲种大西瓜的产量比乙种大西瓜稳定 考向三 用样本的数字特征估计总体的数字特征 【例3】?甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.  (1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价. [审题视点] (1)先通过图象统计出甲、乙二人的成绩; (2)利用公式求出平均数、方差,再分析两人的成绩,作出评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. 甲==13, 乙==13, s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s>s可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.  平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小. 【训练3】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环): 甲 10 8 9 9 9  乙 10 10 7 9 9  如果甲、乙两人中只有1人入选,则入选的最佳人选应是________. 解析 甲=乙=9环,s=[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=, s=[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=>s,故甲更稳定,故填甲. 答案 甲  规范解答19——怎样解答茎叶图与概率的综合性问题 【问题研究】 茎叶图是一个将数据分成主、次两部分,把主要部分当做茎、次要部分当作叶表达数据的一个图,它是一种常用的统计图.因此考题常将茎叶图作为载体来考查平均数、方差以及概率问题. 【解决方案】 首先对茎叶图中的数据全面分析,然后再根据茎叶图的数据解决其它问题. 【示例】?(本题满分12分)(2011·北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.  (1)如果X=8,求乙组同学植树棵数的平均数和方差; (2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率. (注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)  第(1)问直接套入公式求值;第(2)问利用古典概型的知识解决. [解答示范] (1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为 ==.(2分) 方差为 s2= =.(5分) (2)记甲组四名同学为A1,A2,A3,A4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B1,B2,B3,B4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是: (A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A3,B1),(A3,B2),(A3,B3),(A3,B4),(A4,B1),(A4,B2),(A4,B3),(A4,B4),(9分) 用C表示:“选出的两名同学的植树总棵数为19”这一事件,则C中的结果有4个,它们是:(A1,B4),(A2,B4),(A3,B2),(A4,B2).故所求概率为P(C)==.(12分)  茎叶图一般记录两组的数据,它最直观、最清晰,但利用茎叶图解决概率问题时对重复出现的数据要重复记录,不能遗漏. 高考资源网 w。w-w*k&s%5¥u 高考资源网 w。w-w*k&s%5¥u

【点此下载】