幻灯片 1第三节 相关性、最小二乘估计、回归分析与 独立性检验 ---- 幻灯片 2三年9考 高考指数:★★★ 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用. ---- 幻灯片 31.线性回归方程的建立及应用和独立性检验的应用是考查重点; 2.题型以选择题和填空题为主,主要是求线性回归方程的系数或利用线性回归方程进行预测,在给出临界值的情况下判断两个变量是否有关. ---- 幻灯片 41.相关性 (1)散点图:在考虑两个量的关系时,为了对_____之间的关系 有一个大致的了解,人们通常将______________的点描出来, 这些点就组成了变量之间的一个图,通常称这种图为变量之间 的散点图. (2)曲线拟合:从散点图上可以看出,如果变量之间_________ ________,这些点会有一个_____的大致趋势,这种趋势通常可 以用一条___________来近似,这种近似的过程称为曲线拟合. 变量所对应 存在着某 种关系 光滑的曲线 变量 集中 ---- 幻灯片 5(3)线性相关:若在两个变量x和y的散点图中,所有点看上去 都在__________附近波动,则称变量间是线性相关的.此时, 我们可以用___________来近似. (4)非线性相关:若散点图上所有点看上去都在__________ _______________附近波动,则称此相关为非线性相关.此时, 可以用___________来拟合. (5)不相关:如果所有的点在散点图中_________________,则 称变量间是不相关的. 一条直线 一条直线 某条曲线 (不是一条直线) 一条曲线 没有显示任何关系 ---- 幻灯片 6【即时应用】 (1)思考:相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. ---- 幻灯片 7(2)判断下列各关系是否是相关关系.(请在括号内填“是”或“否”) ①路程与时间、速度的关系; ( ) ②加速度与力的关系; ( ) ③产品成本与产量的关系; ( ) ④圆周长与圆面积的关系; ( ) ⑤广告费支出与销售额的关系. ( ) ---- 幻灯片 8【解析】①②④是确定的函数关系,成本与产量,广告费支出与销售额是相关关系. 答案:①否 ②否 ③是 ④否 ⑤是 ---- 幻灯片 92.回归直线方程与相关系数 (1)最小二乘法 如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度: _____________________________________________________ 使得上式达到_________的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法. [y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2. 最小值 ---- 幻灯片 10(2)线性回归方程 假设样本点为(x1,y1),(x2,y2),…,(xn,yn),则 直线方程y=a+bx称为线性回归方程,a、b是线性回归方程的 ________. 系数 ---- 幻灯片 11(3)相关系数r ① ---- 幻灯片 12②当r>0时,称两个变量___________. 当r<0时,称两个变量___________. 当r=0时,称两个变量_____________. r的绝对值越接近于1,表明两个变量之间的线性相关程度越 高;r的绝对值越接近于0,表明两个变量之间的线性相关程度 越低. 正相关 负相关 线性不相关 ---- 幻灯片 13【即时应用】 (1)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回 归直线方程y=a+bx,判断下面说法是否正确.(请在括号内打 “√”或“×”) ①任何一组观测值都能得到具有代表意义的回归直线方程; ( ) ②直线y=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点; ( ) ---- 幻灯片 14③直线y=a+bx的斜率 ( ) ④直线y=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏 差 是该坐标平面上所有直线与这些点的偏差 中最小的. ( ) (2)已知回归方程y=4.4x+838.19,则可估计x与y的增长速度 之比约为_________. ---- 幻灯片 15【解析】(1)任何一组观测值都能利用公式得到直线方程,但 这个方程可能无意义,①不正确;回归直线方程y=bx+a经过 样本点的中心 可能不经过(x1,y1),(x2,y2),…, (xn,yn)中的任何一点,这些点分布在这条直线附近,②不正 确;③正确;④正确. (2)x与y的增长速度之比即约为回归方程的斜率的倒数 答案:(1)①× ②× ③√ ④√ (2) ---- 幻灯片 163.独立性检验 (1)2×2列联表 设A,B为两个变量,每一个变量都可以取两个值,变量A:A1, A2= ;变量B:B1,B2= 通过观察得到如表所示的数据: a b a+b c d c+d a+c b+d n=a+b+c+d ---- 幻灯片 17(2)独立性判断方法 选取统计量________________________,用它的大小来检验 变量之间是否独立. ①当χ2__________时,没有充分的证据判定变量A,B有关联, 可以认为变量A,B是没有关联的; ②当χ2__________时,有90%的把握判定变量A,B有关联; ③当χ2__________时,有95%的把握判定变量A,B有关联; ④当χ2__________时,有99%的把握判定变量A,B有关联. ≤2.706 >2.706 >3.841 >6.635 ---- 幻灯片 18【即时应用】 (1)下面是一个2×2列联表 则表中a、b处的值分别为_____________. ---- 幻灯片 19(2)在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2的观测值为27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是___________的(填“有关”或“无关”). 【解析】(1)∵a+21=73,∴a=52. 又∵a+2=b,∴b=54. (2)∵27.63>6.635, ∴有99%的把握认为“打鼾与患心脏病有关”. 答案:(1)52、54 (2)有关 ---- 幻灯片 20 相关关系的判断 【方法点睛】利用散点图判断相关关系的技巧 利用散点图判断两个变量是否有相关关系是比较简便的方法: (1)在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系; ---- 幻灯片 21(2)如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系; (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. ---- 幻灯片 22【例1】关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据: 判断它们是否有相关关系. ---- 幻灯片 23【解题指南】判断有无相关关系,一种常用的简便方法就是绘制散点图. 【规范解答】本题涉及两个变量:年龄与脂肪含量,可以以年龄为自变量,考查脂肪含量的变化趋势,分析相关关系通常借助散点图. ---- 幻灯片 24以年龄作为x轴,脂肪含量作为y轴,可得相应的散点图如图所示. 由散点图可知,两者之间具有相关关系. ---- 幻灯片 25【反思·感悟】粗略判断相关性,可以观察一个变量随另一个变量变化而变化的情况.画出散点图能够更直观的判断是否相关,相关时是正相关还是负相关. ---- 幻灯片 26【变式训练】5个学生的数学和物理成绩如下表: 画出散点图,并判断它们是否有相关关系. ---- 幻灯片 27【解析】把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(xi,yi)(i=1,2,…,5),作出散点图如图. 从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关. ---- 幻灯片 28 线性回归方程及其应用 【方法点睛】求样本数据的线性回归方程的步骤 第一步,计算平均数 第二步,求和 第三步,计算 第四步,写出回归方程y=bx+a. ---- 幻灯片 29【提醒】对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程. ---- 幻灯片 30【例2】(1)(2011·广东高考)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm. (2)测得某国10对父子身高(单位:英寸)如下: ---- 幻灯片 31①画出散点图,说明变量y与x的相关性; ②如果y与x之间具有线性相关关系,求线性回归方程. (已知: ≈4 490.34, =44 794, =44 941.93, =44 842.4) ---- 幻灯片 32【解题指南】(1)求出回归方程,代入相关数据求得; (2)①根据散点图判断相关性. ②根据已知数据和提示的公式数据求解,写出线性回归方程. 【规范解答】(1)由题设知:设相对的父亲的身高为x,相对的儿子的身高为y,它们对应的取值如表所示 于是有 a=176-173×1=3,得回归方程为y=x+3,所以当x=182时,y=185. 答案:185 ---- 幻灯片 33(2)①散点图如图所示: 观察散点图中点的分布可以看出:这些点在一条直线的附近分布,所以变量y与x之间具有线性相关关系. ---- 幻灯片 34②设回归方程为y=bx+a. 由 =67.01-0.464 6×66.8≈35.974 7. 得所求的线性回归方程为y=0.464 6x+35.974 7. ---- 幻灯片 35【互动探究】若本例(2)题干不变,如果父亲的身高为73英寸,试估计儿子的身高. 【解析】由本例(2)可知回归方程为y=0.464 6x+35.974 7. 当x=73时,y=0.464 6×73+35.974 7≈69.9(英寸). 所以当父亲身高为73英寸时,儿子的身高约为69.9英寸. ---- 幻灯片 36【反思·感悟】求线性回归方程,主要是利用公式,求出回归系数b,a,求解过程中注意计算的准确性和简便性.利用回归方程预报,就是求函数值. ---- 幻灯片 37【变式训练】一般来说,一个人脚越长,他的身高就越高.现对10名成年人的脚长x与身高y进行测量,得如下数据(单位:cm): ---- 幻灯片 38作出散点图后,发现散点在一条直线附近.经计算得到一些数据: 某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长26.5 cm,请你估计案发嫌疑人的身高为_________cm. ---- 幻灯片 39【解析】由已知 故y=7x. 当x=26.5时,y=185.5. 答案:185.5 ---- 幻灯片 40 独立性检验的基本思想及其应用 【方法点睛】利用统计量χ2进行独立性检验的步骤 (1)根据数据列出2×2列联表; (2)根据公式计算χ2的值; (3)比较χ2与临界值的大小关系,作出统计推断. ---- 幻灯片 41【例3】某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件.根据所给数据: (1)写出2×2列联表; (2)判断产品是否合格与设备改造是否有关. 【解题指南】列表后利用χ2的值进行检验. ---- 幻灯片 42【规范解答】(1)由已知数据得 (2)∵ ≈12.38. 由于12.38>6.635,所以有99%以上的把握认为产品是否合格与设备改造有关. ---- 幻灯片 43【反思·感悟】准确计算χ2的值是关键.能有多大的把握认为两个变量有关,应熟悉常用的几个临界值. ---- 幻灯片 44【变式训练】为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表: 利用列联表的独立性检验判断是否喜欢饮酒与性别是否有关? ---- 幻灯片 45【解析】由列联表中的数据得 ∵χ2≈11.953>6.635. 所以有99%以上的把握认为是否喜欢饮酒与性别有关. ---- 幻灯片 46【变式备选】有两个分类变量X与Y,其一组观测的2×2列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为X与Y之间有关系? ---- 幻灯片 47【解析】要有90%以上的把握认为X与Y之间有关系,则χ2>2.706, 而χ2= = 解χ2>2.706得a>7.19或a<2.04.又因为a>5且15-a>5,a∈Z,所以a=8,9,故当a取8或9时有90%以上的把握认为X与Y之间有关系. ---- 幻灯片 48【满分指导】线性回归方程解答题的规范解答 【典例】(12分)(2011·安徽高考)某地最近十年粮食需求量逐年上升,下表是部分统计数据: ---- 幻灯片 49(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量. ---- 幻灯片 50【解题指南】将数据进行处理,把数据同时减去一个数代入公式计算;利用公式求回归直线方程,并进行预测. 【规范解答】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据预处理如下: …………………………………………………………………2分 ---- 幻灯片 51对预处理的数据,容易算得 ………………………………………………4分 ………………………………………………6分 由上述计算结果,知所求回归直线方程为 y-257=b(x-2 006)+a=6.5(x-2 006)+3.2.……………8分 即y=6.5(x-2 006)+260.2.……………………………10分 ---- 幻灯片 52(2)利用所求得的直线方程,可预测2012年的粮食需求量为 6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨). …………………………………………12分 ---- 幻灯片 53【阅卷人点拨】通过高考中的阅卷数据分析与总结,我们可以得到以下失分警示和备考建议: ---- 幻灯片 54---- 幻灯片 551.(2011·江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下 则y对x的线性回归方程为( ) (A)y=x-1 (B)y=x+1 (C)y=88+ x (D)y=176 ---- 幻灯片 56【解析】选C.由表中数据知回归直线是上升的,首先排除D. 由线性回归性质知:点 =(176,176) 一定在回归直线上,代入各选项检验,只有C符合,故选C. ---- 幻灯片 572.(2011·陕西高考)设(x1,y1),(x2,y2), …,(xn,yn)是变量x和y的n个样本点, 直线l是由这些样本点通过最小二乘法 得到的线性回归直线(如图),以下结 论正确的是( ) (A)直线l过点 (B)x和y的相关系数为直线l的斜率 (C)x和y的相关系数在0到1之间 (D)当n为偶数时,分布在l两侧的样本点的个数一定相同 ---- 幻灯片 58【解析】选A. ---- 幻灯片 59---- 幻灯片 603.(2011·辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加___________万元. 【解析】由于y=0.254x+0.321,当x增加1万元时,年饮食支出y增加0.254万元. 答案:0.254 ---- 幻灯片 61---- 幻灯片 62----

【点此下载】