1.(文)(2012·新课标全国,3)在一组样本数据(x1,y1)、(x2,y2)、…、(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  ) A.-1           B.0 C. D.1 [答案] D [解析] 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1. 要注意理清相关系数的大小与相关性强弱的关系. (理)(2011·中山四校联考、湖南六校联考)甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表: 甲 乙 丙 丁  r 0.82 0.78 0.69 0.85  m 106 115 124 103  则哪位同学的试验结果体现A、B两变量有更强的线性相关性(  ) A.甲    B.乙    C.丙    D.丁 [答案] D [解析] r越接近1,相关性越强,残差平方和m越小,相关性越强,故选D. 2.(2011·西安模拟)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(  ) ①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 A.① B.①③ C.③ D.② [答案] C [解析] ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C. 3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值计算,得i=52,i=228,=478,iyi=1849,则其回归直线方程为(  ) A.=11.47+2.62x B.=-11.47+2.62x C.=2.62+11.47x D.=11.47-2.62x [答案] A [解析] 由i=52,i=228知, =6.5,=28.5,= =≈2.62, ∴=-=28.5-2.62×6.5=11.47. 4.(2011·湖南文,5)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计  爱好 40 20 60  不爱好 20 30 50  总计 60 50 110  由K2=算得,K2=≈7.8. 附表: P(K2≥k) 0.050 0.010 0.001  k 3.841 6.635 10.828  参照附表,得到的正确结论是(  ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” [答案] A [解析] 根据独立性检验的定义,由K2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”. 5.(2012·石家庄市二模)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示: 身高x(cm) 160 165 170 175 180  体重y(kg) 63 66 70 72 74  根据上表可得回归直线方程=0.56x+,据此模型预报身高为172cm的高三男生的体重为(  ) A.70.09kg B.70.12kg C.70.55kg D.71.05kg [答案] B [解析] ==170, ==69. ∵回归直线过点(,), ∴将点(170,69)代入=0.56x+中得=-26.2, ∴回归直线方程=0.56x-26.2, 代入x=172cm,则其体重为70.12kg. 6.(2012·广州市检测)某中学高三从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x+y的值为(  )  A.7    B.8    C.9    D.10 [答案] B [解析] 由茎叶图得,甲班学生的平均分是=85,解得x=5.因为乙班学生成绩的中位数是83,故只有80+y=83,解得y=3.所以x+y=8.故选B. 7.(2011·辽宁文,14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元. [答案] 0.254 [解析] 由回归直线方程为=0.254x+0.321知收入每增加1万元,饮食支出平均增加0.254万元. 8.以下四个命题: ①从匀速传递的产品生产流水线上,质检员每20min从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样; ②两个随机变量相关性越强,则相关系数的绝对值越接近于1; ③在线性回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位; ④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大. 其中正确命题的序号是________. [答案] ②③ 9.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:   专业 性别   非统计专业 统计专业  男 13 10  女 7 20  为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=≈4.844. 因为K2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. [答案] 5% [解析] 根据独立性检验临界值表可知“x与y有关系”的可信度,P(K2≥3.841)=0.05,∴有95%的可能认为x与y有关系,即判断出错的可能性为5%. 10.(2012·扬州模拟)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩: 数学 88 83 117 92 108 100 112  物理 94 91 108 96 104 101 106  (1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议. [解析] (1)=100+=100; =100+=100; ∴s==142,s=, 从而s>s,∴物理成绩更稳定. (2)由于x与y之间具有线性相关关系,根据回归系数公式得到 ==≈0.5, =-=100-0.5×100=50, ∴回归直线方程为=0.5x+50. 当y=115时,x=130,即该生物理成绩达到115分时,他的数学成绩大约为130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高. 能力拓展提升 11.(2012·湖北武汉市训练)已知一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是(  ) A.13,12 B.13,13 C.12,13 D.13,14 [答案] B [解析] 设数列{an}的公差为d,由a1,a3,a7成等比数列,得a=a1a7,则82=(8-2d)(8+4d),解得d=0(舍去)或d=2.故a1=a3-2d=4,an=a1+(n-1)d=2n+2.故此样本数据的平均数为==13,中位数为==13. 12.(2011·佛山二模)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示: 价格x 9 9.5 10 10.5 11  销售量y 11 10 8 6 5  通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________. [答案] =-3.2x+40 [解析] iyi=392,=10,=8,(xi-)2=2.5,代入公式,得=-3. 2,所以,=-=40,故回归直线方程为=-3.2x+40. 13.(2011·东北四校联考)某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表: 气温(℃) 18 13 10 -1  杯数 24 34 38 64  由表中数据算得线性回归方程=bx+a中的b≈-2,预测当气温为-5℃时,热茶销售量为________杯.(已知回归系数b=,a=-b) [答案] 70 [解析] 根据表格中的数据可求得=×(18+13+10-1)=10,=×(24+34+38+64)=40. ∴a=-b=40-(-2)×10=60,∴=-2x+60,当x=-5时,=-2×(-5)+60=70. 14.(文)(2011·郑州市质检)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示: 60分 以下 61~ 70分 71~ 80分 81~ 90分 91~ 100分  甲班 (人数) 3 6 11 18 12  乙班 (人数) 4 8 13 15 10  现规定平均成绩在80分以上(不含80分)的为优秀. (1)试分析估计两个班级的优秀率; (2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助. 优秀人数 非优秀人数 合计  甲班     乙班     合计     参考公式及数据:K2=, P(K2≥k0) 0.50 0.40 0.25 0.15 0.10  k0 0.455 0.708 1.323 2.072 2.706  P(K2≥k0) 0.05 0.025 0.010 0.005 0.001  k0 3.841 5.024 6.635 7.879 10.828  [解析] (1)由题意知,甲、乙两班均有学生50人, 甲班优秀人数为30人,优秀率为=60%, 乙班优秀人数为25人,优秀率为=50%, 所以甲、乙两班的优秀率分别为60%和50%. (2) 优秀人数 非优秀人数 合计  甲班 30 20 50  乙班 25 25 50  合计 55 45 100  因为K2==≈1.010, 所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助. (理)(2011·福建普通高中质检)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.  (1)在乙班样本中的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率; (2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关. 甲班(A方式) 乙班(B方式) 总计  成绩优秀     成绩不优秀     总计     附:K2= P(K2≥k) 0.25 0.15 0.10 0.05 0.025 0.01 0.005 0.001  k 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828  [解析] (1)设“抽出的两个均‘成绩优秀’”为事件A. 从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个. 而事件A包含基本事件: (93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共10个. 所以所求概率为P(A)==. (2)由已知数据得 甲班(A方式) 乙班(B方式) 总计  成绩优秀 1 5 6  成绩不优秀 19 15 34  总计 20 20 40  根据列联表中数据, K2=≈3.137, 由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关. 15.(2012·河南新乡、许昌、平顶山调研)在某医学实验中,某实验小组为了分析某药物用药量与血液中某种抗体水平的关系,选取六只实验动物进行血检,得到如下资料: 动物编号 1 2 3 4 5 6  用药量x(单位) 1 3 4 5 6 8  抗体指标y(单位) 3.4 3.7 3.8 4.0 4.2 4.3  记s为抗体指标标准差,若抗体指标落在(-s,+s)内,则称该动物为有效动物,否则称为无效动物.研究方案规定先从六只动物中选取两只,用剩下的四只动物的数据求线性回归方程,再对被选取的两只动物数据进行检验. (1)求选取的两只动物都是有效动物的概率; (2)若选取的是编号为1和6的两只动物,且利用剩余四只动物的数据求出y关于x的线性回归方程为=0.17x+a,试求出a的值; (3)若根据回归方程估计出的1号和6号动物抗体指标数据与检验结果误差都不超过抗体指标标准差,则认为得到的线性回归方程是可靠的.试判断(2)中所得线性回归方程是否可靠. 参考公式:样本数据x1,x2,…,xn的标准差: S=,其中为样本平均数. [解析] (1)=3.9,s≈0.31.故1、6号为无效动物,2、3、4、5号为有效动物. 记从六只动物中选取两只为事件A. 所有可能结果为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15种. 满足题意的有(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共6种.故P(A)==. (2)对于2、3、4、5号动物,=4.5,=3.925, 代入=0.17x+a得a=3.16. (3)由=0.17x+3.16得1=3.33,6=4.52. 误差e1=0.07,e6=0.22,均比标准差s≈0.31小,故(2)中回归方程可靠. 1.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表 甲的成绩      环数 7 8 9 10  频数 5 5 5 5    乙的成绩      环数 7 8 9 10  频数 6 4 4 6   丙的成绩      环数 7 8 9 10  频数 4 6 6 4  s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有(  ) A.s3>s1>s2 B.s2>s1>s3 C.s1>s2>s3 D.s2>s3>s1 [答案] B [解析] 计算可得甲、乙、丙的平均成绩都为8.5. s1=  =.同理s2=,s3=, ∴s2>s1>s3. 2.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是(  )  A.5    B.4    C.3    D.2 [答案] D [解析] 去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,∴x=2,符合题意,故选D. 3.(2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是(  ) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg [答案] D [解析] 本题考查线性回归方程. D项中身高为170cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系. 4.(2012·湖南文,13)下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.  (注:方差s2=[(x1-)2-(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数) [答案] 6.8 [解析] 本题考查茎叶图、方差的概念. 由茎叶图知==11, ∴s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8 5.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下: 性别 是否需要志愿者 男 女  需要 40 30  不需要 160 270  (1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由. 附:  K2=. [解析] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%. (2)K2=≈9.967. 由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.

【点此下载】