幻灯片 1第三节 相关性、最小二乘估计、回归分析与
独立性检验
----
幻灯片 2三年9考 高考指数:★★★
1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
----
幻灯片 31.线性回归方程的建立及应用和独立性检验的应用是考查重点;
2.题型以选择题和填空题为主,主要是求线性回归方程的系数或利用线性回归方程进行预测,在给出临界值的情况下判断两个变量是否有关.
----
幻灯片 41.相关性
(1)散点图:在考虑两个量的关系时,为了对_____之间的关系
有一个大致的了解,人们通常将______________的点描出来,
这些点就组成了变量之间的一个图,通常称这种图为变量之间
的散点图.
(2)曲线拟合:从散点图上可以看出,如果变量之间_________
________,这些点会有一个_____的大致趋势,这种趋势通常可
以用一条___________来近似,这种近似的过程称为曲线拟合.
变量所对应
存在着某
种关系
光滑的曲线
变量
集中
----
幻灯片 5(3)线性相关:若在两个变量x和y的散点图中,所有点看上去
都在__________附近波动,则称变量间是线性相关的.此时,
我们可以用___________来近似.
(4)非线性相关:若散点图上所有点看上去都在__________
_______________附近波动,则称此相关为非线性相关.此时,
可以用___________来拟合.
(5)不相关:如果所有的点在散点图中_________________,则
称变量间是不相关的.
一条直线
一条直线
某条曲线
(不是一条直线)
一条曲线
没有显示任何关系
----
幻灯片 6【即时应用】
(1)思考:相关关系与函数关系有什么异同点?
提示:相同点:两者均是指两个变量的关系.
不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
----
幻灯片 7(2)判断下列各关系是否是相关关系.(请在括号内填“是”或“否”)
①路程与时间、速度的关系; ( )
②加速度与力的关系; ( )
③产品成本与产量的关系; ( )
④圆周长与圆面积的关系; ( )
⑤广告费支出与销售额的关系. ( )
----
幻灯片 8【解析】①②④是确定的函数关系,成本与产量,广告费支出与销售额是相关关系.
答案:①否 ②否 ③是 ④否 ⑤是
----
幻灯片 92.回归直线方程与相关系数
(1)最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
_____________________________________________________
使得上式达到_________的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.
最小值
----
幻灯片 10(2)线性回归方程
假设样本点为(x1,y1),(x2,y2),…,(xn,yn),则
直线方程y=a+bx称为线性回归方程,a、b是线性回归方程的
________.
系数
----
幻灯片 11(3)相关系数r
①
----
幻灯片 12②当r>0时,称两个变量___________.
当r<0时,称两个变量___________.
当r=0时,称两个变量_____________.
r的绝对值越接近于1,表明两个变量之间的线性相关程度越
高;r的绝对值越接近于0,表明两个变量之间的线性相关程度
越低.
正相关
负相关
线性不相关
----
幻灯片 13【即时应用】
(1)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回
归直线方程y=a+bx,判断下面说法是否正确.(请在括号内打
“√”或“×”)
①任何一组观测值都能得到具有代表意义的回归直线方程;
( )
②直线y=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点; ( )
----
幻灯片 14③直线y=a+bx的斜率 ( )
④直线y=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏
差 是该坐标平面上所有直线与这些点的偏差
中最小的. ( )
(2)已知回归方程y=4.4x+838.19,则可估计x与y的增长速度
之比约为_________.
----
幻灯片 15【解析】(1)任何一组观测值都能利用公式得到直线方程,但
这个方程可能无意义,①不正确;回归直线方程y=bx+a经过
样本点的中心 可能不经过(x1,y1),(x2,y2),…,
(xn,yn)中的任何一点,这些点分布在这条直线附近,②不正
确;③正确;④正确.
(2)x与y的增长速度之比即约为回归方程的斜率的倒数
答案:(1)①× ②× ③√ ④√ (2)
----
幻灯片 163.独立性检验
(1)2×2列联表
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,
A2= ;变量B:B1,B2= 通过观察得到如表所示的数据:
a
b
a+b
c
d
c+d
a+c
b+d
n=a+b+c+d
----
幻灯片 17(2)独立性判断方法
选取统计量________________________,用它的大小来检验
变量之间是否独立.
①当χ2__________时,没有充分的证据判定变量A,B有关联,
可以认为变量A,B是没有关联的;
②当χ2__________时,有90%的把握判定变量A,B有关联;
③当χ2__________时,有95%的把握判定变量A,B有关联;
④当χ2__________时,有99%的把握判定变量A,B有关联.
≤2.706
>2.706
>3.841
>6.635
----
幻灯片 18【即时应用】
(1)下面是一个2×2列联表
则表中a、b处的值分别为_____________.
----
幻灯片 19(2)在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2的观测值为27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是___________的(填“有关”或“无关”).
【解析】(1)∵a+21=73,∴a=52.
又∵a+2=b,∴b=54.
(2)∵27.63>6.635,
∴有99%的把握认为“打鼾与患心脏病有关”.
答案:(1)52、54 (2)有关
----
幻灯片 20 相关关系的判断
【方法点睛】利用散点图判断相关关系的技巧
利用散点图判断两个变量是否有相关关系是比较简便的方法:
(1)在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系;
----
幻灯片 21(2)如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系;
(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
----
幻灯片 22【例1】关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据:
判断它们是否有相关关系.
----
幻灯片 23【解题指南】判断有无相关关系,一种常用的简便方法就是绘制散点图.
【规范解答】本题涉及两个变量:年龄与脂肪含量,可以以年龄为自变量,考查脂肪含量的变化趋势,分析相关关系通常借助散点图.
----
幻灯片 24以年龄作为x轴,脂肪含量作为y轴,可得相应的散点图如图所示.
由散点图可知,两者之间具有相关关系.
----
幻灯片 25【反思·感悟】粗略判断相关性,可以观察一个变量随另一个变量变化而变化的情况.画出散点图能够更直观的判断是否相关,相关时是正相关还是负相关.
----
幻灯片 26【变式训练】5个学生的数学和物理成绩如下表:
画出散点图,并判断它们是否有相关关系.
----
幻灯片 27【解析】把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(xi,yi)(i=1,2,…,5),作出散点图如图.
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关.
----
幻灯片 28 线性回归方程及其应用
【方法点睛】求样本数据的线性回归方程的步骤
第一步,计算平均数
第二步,求和
第三步,计算
第四步,写出回归方程y=bx+a.
----
幻灯片 29【提醒】对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.
----
幻灯片 30【例2】(1)(2011·广东高考)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm.
(2)测得某国10对父子身高(单位:英寸)如下:
----
幻灯片 31①画出散点图,说明变量y与x的相关性;
②如果y与x之间具有线性相关关系,求线性回归方程.
(已知: ≈4 490.34,
=44 794, =44 941.93, =44 842.4)
----
幻灯片 32【解题指南】(1)求出回归方程,代入相关数据求得;
(2)①根据散点图判断相关性.
②根据已知数据和提示的公式数据求解,写出线性回归方程.
【规范解答】(1)由题设知:设相对的父亲的身高为x,相对的儿子的身高为y,它们对应的取值如表所示
于是有
a=176-173×1=3,得回归方程为y=x+3,所以当x=182时,y=185.
答案:185
----
幻灯片 33(2)①散点图如图所示:
观察散点图中点的分布可以看出:这些点在一条直线的附近分布,所以变量y与x之间具有线性相关关系.
----
幻灯片 34②设回归方程为y=bx+a.
由
=67.01-0.464 6×66.8≈35.974 7.
得所求的线性回归方程为y=0.464 6x+35.974 7.
----
幻灯片 35【互动探究】若本例(2)题干不变,如果父亲的身高为73英寸,试估计儿子的身高.
【解析】由本例(2)可知回归方程为y=0.464 6x+35.974 7.
当x=73时,y=0.464 6×73+35.974 7≈69.9(英寸).
所以当父亲身高为73英寸时,儿子的身高约为69.9英寸.
----
幻灯片 36【反思·感悟】求线性回归方程,主要是利用公式,求出回归系数b,a,求解过程中注意计算的准确性和简便性.利用回归方程预报,就是求函数值.
----
幻灯片 37【变式训练】一般来说,一个人脚越长,他的身高就越高.现对10名成年人的脚长x与身高y进行测量,得如下数据(单位:cm):
----
幻灯片 38作出散点图后,发现散点在一条直线附近.经计算得到一些数据:
某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长26.5 cm,请你估计案发嫌疑人的身高为_________cm.
----
幻灯片 39【解析】由已知
故y=7x.
当x=26.5时,y=185.5.
答案:185.5
----
幻灯片 40 独立性检验的基本思想及其应用
【方法点睛】利用统计量χ2进行独立性检验的步骤
(1)根据数据列出2×2列联表;
(2)根据公式计算χ2的值;
(3)比较χ2与临界值的大小关系,作出统计推断.
----
幻灯片 41【例3】某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件.根据所给数据:
(1)写出2×2列联表;
(2)判断产品是否合格与设备改造是否有关.
【解题指南】列表后利用χ2的值进行检验.
----
幻灯片 42【规范解答】(1)由已知数据得
(2)∵ ≈12.38.
由于12.38>6.635,所以有99%以上的把握认为产品是否合格与设备改造有关.
----
幻灯片 43【反思·感悟】准确计算χ2的值是关键.能有多大的把握认为两个变量有关,应熟悉常用的几个临界值.
----
幻灯片 44【变式训练】为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:
利用列联表的独立性检验判断是否喜欢饮酒与性别是否有关?
----
幻灯片 45【解析】由列联表中的数据得
∵χ2≈11.953>6.635.
所以有99%以上的把握认为是否喜欢饮酒与性别有关.
----
幻灯片 46【变式备选】有两个分类变量X与Y,其一组观测的2×2列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为X与Y之间有关系?
----
幻灯片 47【解析】要有90%以上的把握认为X与Y之间有关系,则χ2>2.706,
而χ2=
=
解χ2>2.706得a>7.19或a<2.04.又因为a>5且15-a>5,a∈Z,所以a=8,9,故当a取8或9时有90%以上的把握认为X与Y之间有关系.
----
幻灯片 48【满分指导】线性回归方程解答题的规范解答
【典例】(12分)(2011·安徽高考)某地最近十年粮食需求量逐年上升,下表是部分统计数据:
----
幻灯片 49(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;
(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.
----
幻灯片 50【解题指南】将数据进行处理,把数据同时减去一个数代入公式计算;利用公式求回归直线方程,并进行预测.
【规范解答】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据预处理如下:
…………………………………………………………………2分
----
幻灯片 51对预处理的数据,容易算得
………………………………………………4分
………………………………………………6分
由上述计算结果,知所求回归直线方程为
y-257=b(x-2 006)+a=6.5(x-2 006)+3.2.……………8分
即y=6.5(x-2 006)+260.2.……………………………10分
----
幻灯片 52(2)利用所求得的直线方程,可预测2012年的粮食需求量为
6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).
…………………………………………12分
----
幻灯片 53【阅卷人点拨】通过高考中的阅卷数据分析与总结,我们可以得到以下失分警示和备考建议:
----
幻灯片 54----
幻灯片 551.(2011·江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下
则y对x的线性回归方程为( )
(A)y=x-1 (B)y=x+1
(C)y=88+ x (D)y=176
----
幻灯片 56【解析】选C.由表中数据知回归直线是上升的,首先排除D.
由线性回归性质知:点 =(176,176)
一定在回归直线上,代入各选项检验,只有C符合,故选C.
----
幻灯片 572.(2011·陕西高考)设(x1,y1),(x2,y2),
…,(xn,yn)是变量x和y的n个样本点,
直线l是由这些样本点通过最小二乘法
得到的线性回归直线(如图),以下结
论正确的是( )
(A)直线l过点
(B)x和y的相关系数为直线l的斜率
(C)x和y的相关系数在0到1之间
(D)当n为偶数时,分布在l两侧的样本点的个数一定相同
----
幻灯片 58【解析】选A.
----
幻灯片 59----
幻灯片 603.(2011·辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加___________万元.
【解析】由于y=0.254x+0.321,当x增加1万元时,年饮食支出y增加0.254万元.
答案:0.254
----
幻灯片 61----
幻灯片 62----
【点此下载】