6.2 总体分布的估计 第19课时 频率分布表 【学习导航】 学习要求 1.感受如何用样本频率分布表去估计总体分布; 2.自己亲自体验制作频率分布表的过程,注意分组合理并确定恰当的组距; 【课堂互动】 自学评价 案例1 为了了解7月25日至8月24日北京地区的气温分布状况,我们对往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃): 7月25日至8月10日 41.9 37.5 35.7 35.4 37.2 38.1   34.7 33.7 33.3 32.5 34.6 33.0   30.8 31.0 28.6 31.5 28.8   8月8日 至8月24日 28.6 31.5 28.8 33.2 32.5 30.3   30.2 29.8 33.1 32.8 29.4 25.6   24.7 30.0 30.1 29.5 30.3   怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢? 【分析】 要比较两时间段的高温状况,最直接的方法就是分别统计这两时间段中高温天数.如果天数差距明显,则结论显然,若天数差距不明显,可结合其它因素再综合考虑.上面两样本中的高温天数的频率用下表表示: 时间 总天数 高温天数(频数) 频率  7月25日至8月10日 17 11 0.647  8月8日至8月24日 17 2 0.118  由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日. 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表. 案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的样本的频率分布表。 168 165 171 167 170 165 170 152 175 174  165 170 168 169 171 166 164 155 164 158  170 155 166 158 155 160 160 164 156 162  160 170 168 164 174 171 165 179 163 172  180 174 173 159 163 172 167 160 164 169  151 168 158 168 176 155 165 165 169 162  177 158 175 165 169 151 163 166 163 167  178 165 158 170 169 159 155 163 153 155  167 163 164 158 168 167 161 162 167 168  161 165 174 156 167 166 162 161 164 166   【分析】该组数据中最小值为151,最大值为180,它们相差29,可取区间[150.5,180.5],并将此区间分成10个小区间,每个小区间长度为3,再统计出每个区间内的频数并计算相应的频率,我们将整个取值区间的长度称为全距,分成的区间的长度称为组距。 【解】 (1)在全部数据中找出最大值180和最小值151,则两者之差为29,确定全距为30,决定以组距3将区间[150.5,180.5]分成10个组; (2)从第一组开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表: 分 组 频数累计 频数 频率   4 4 0.04   12 8 0.08   20 8 0.08   31 11 0.11   53 22 0.22   72 19 0.19   86 14 0.14   93 7 0.07   97 4 0.04   100 3 0.03  合 计  100 1   【小结】编制频率分布表的步骤如下: (1)求全距,决定组数和组距,组距=全距/组数; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表. 在分组时,为了容易看出规律,一般分组使每组的长度相等,组数不宜太多也不宜太少.一般地,称区间的左端点为 为下组限,右端点 为上组限。我们可以采用下组限在内而上组限不在内的分组方法,也可采用下组限不在内而上组限在内 的分组方法。如果取全距时不利于分组(如不能被组数整除),如何处理可适当增大全距,如在左、右两端各增加适当范围(尽量使两端增加的量相同. 精典范例 例1 某铸件厂从规定尺寸为25.40mm的一堆零件中任取100件,测得它们的实际尺寸如下: 25.39 25.36 25.34 25.42 25.45 25.38 25.39  25.41 25.43 25.44 25.48 25.45 25.43 25.46  25.40 25.39 25.41 25.36 25.38 25.31 25.56  25.37 25.44 25.33 25.46 25.40 25.49 25.34  25.35 25.32 25.45 25.40 25.27 25.43 25.54  25.40 25.43 25.44 25.41 25.53 25.37 25.38  25.36 25.42 25.39 25.46 25.38 25.35 25.31  25.41 25.32 25.38 25.42 25.40 25.33 25.37  25.47 25.34 25.30 25.39 25.36 25.46 25.29  25.40 25.35 25.41 25.37 25.47 25.39 25.42  25.42 25.24 25.47 25.35 25.45 25.43 25.37  25.40 25.34 25.51 25.45 25.44 25.40 25.38  25.43 25.41 25.40 25.38 25.40 25.36 25.33  25.42 25.40 25.50 25.37 25.49 25.35 25.39  25.39 25.47       1)这100件零件尺寸的全距是多少? 2)如果将这100个数据分为11组,则如何分组?组距为多少? 3)画出以上数据的频率分布表。 4)如果规定尺寸在之间的零件为合格产品抽样检查,合格品率大于85%,这批零件才能通过检验,则这批产品能通过检验吗? 【解】 1)该组数据中最小值为25.24,最大值为25.56,它们相差0.32,故可取区间 [25.235,25.565],并将此区间等分成11个区间,这100个零件尺寸的全距为 25.235 - 25.565=0.33 2)组距为 3) 分 组 频数累计 频 数 频 率   1 1 0.01   3 2 0.02   8 5 0.05   20 12 0.12   38 18 0.18   63 25 0.25   79 16 0.16   92 13 0.13   96 4 0.04   98 2 02   100 2 0.02  合 计  100 1  4)尺寸在之间的零件的累计频率为0.12+0.18+0.25+0.16+0.13=0.84<0.85 故这批零件不能通过抽样检验。 追踪训练一 1.一个容量为20的数据样本,分组与频数为:,,,,,,则样本数据在区间上的可能性为( D ) (A)5% (B)25% (C)50% (D)70% 2.下面是不同厂家生产的手提式电脑的重量(单位:kg),试列出其频率分布表 1.9 2.0 2.1 2.4 2.4  2.6 1.9 2.4 2.2 1.6  2.8 3.2 2.3 1.5 2.6  1.7 1.7 1.8 1.8 3.0   分析:全距 3.2-1.5=1.7 故可取区间[1.45,3.25] 并将此区间分成6个小区间 分 组 频数累计 频 数 频 率   4 4 0.20   9 5 0.25   12 3 0.15   17 5 0.25   18 1 0.05   20 2 0.10  合 计  20 1   3.一本书中,分组统计100个句子中的字数,得出下列结果:字数1~5个的15句,字数6~10个的27句,字数11~15个的32句,字数16~20个的15字,字数21~25个的8句,字数26~30个的3句,请作出字数的频率分布表,并利用组中值对该书中平均每个句子包含的字数作出估计。 分 组 频数累计 频数 频率  1~5 15 15 0.15  6~10 42 27 0.27  11~15 74 32 0.32  16~20 89 15 0.15  21~25 97 8 0.08  26~30 100 3 0.03  合 计  100 1  可以估计,该书中平均每个句子子包含字数为: 3×0.15+8×0.27+13×0.32+18×0.15+23×0.08+28×0.03≈12个. 4.李老师为了分析一次数学考试情况,全校抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在第五组(89.5~99.5分)的频数是多少?频率是多少?全校300人中分数在89.5~99.5中的约有多少人? 解: 频率是每一小组的频数与数据总数的比值,第四组的频率是0.08,则第四组的频数是4,从而可求出第五组的频数、频率,并由样本估计出全校300人中分数在89.5~99.5之间的人数.第四组的频数为,第五组的频数为50-10-23-11-4=2,频率为,所以全校在89.5~99.5之间的约有人. 第4课时6.2.1频率分布表 分层训练 1.在10人中,有4个学生,2个干部,3个工人,1个农民,数0.4是学生占总( ) (A)频数 (B)概率 (C)频率 (D)累积频率 2.在用样本频率估计总体分布的过程中,下列正确的是 ( ) 总体容量越大,估计越精确 总体容量越小,估计越精确 (C) 样本容量越大,估计越精确 (D) 样本容量越小,估计越精确 3.一个容量为20的数据样本,分组与频数为 则样本数据的可能性为55%的区间是( ) (A)  (B)  (C)  (D)  4.一个容量为20的样本,已知某组的频率为,则该组的频数为___________ 5.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=___________. 6.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么这组数据落在8.5~11.5内的频率为________ 7.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表. 组 号 1 2 3 4 5 6 7 8  频 数 10 16  18 15  11 9  并且知道第6组的频率是第3组频率的两倍,问第6组的频率是多少? 8.列出下列数据的频率分布表。 14.1 14.4 13.9 12.1 12.3  13.0 13.1 14.0 13.8 13.2  12.9 13.2 13.6 13.4 13.1  13.8 12.7 12.5 13.7 12.6  13.5 12.8 12.6 13.5 13.2  13.3 13.4 13.6 14.2 13.6   思考运用 9.某中学为了参加全国中学生运动会,打算组织100名学生组成校运动队,限制每名学生只参加一个运动项目,其中有13人报名参加了田径,10人进入了体操队,11选择了乒乓球队,另外参加三大球足球、篮球和排球的各有24人、27人和15人,请列出学生参加各运动队的频率分布表 10.有一个容量为45的样本数据,分组后各组的频数如下,根据累积频率分布,估计小于27.5的数据约为总体的多少。  w.w.w.k.s.5.u.c.o.m

【点此下载】