§3.2 回归分析(1) 教学目标 (1)通过实例引入线性回归模型,感受产生随机误差的原因; (2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点 线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境 1. 情境:对一作直线运动的质点的运动过程观测了次,得到如下表所示的数据,试估计当x=9时的位置y的值. 时刻/s          位置观测值/cm          根据《数学(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示: 从散点图中可以看出,样本点呈直线趋势,时间与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式, 可以得到线性回归方为,所以当时,由线性回归方程可以估计其位置值为 2.问题:在时刻时,质点的运动位置一定是吗? 二.学生活动 思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映与之间的关系,的值不能由完全确定,它们之间是统计相关关系,的实际值与估计值之间存在着误差. 三.建构数学 1.线性回归模型的定义: 我们将用于估计值的线性函数作为确定性函数; 的实际值与估计值之间的误差记为,称之为随机误差; 将称为线性回归模型. 说明:(1)产生随机误差的主要原因有: ①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差. (2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计,? 2.探求线性回归系数的最佳估计值: 对于问题②,设有对观测数据,根据线性回归模型,对于每一个,对应的随机误差项,我们希望总误差越小越好,即要使越小越好.所以,只要求出使取得最小值时的,值作为,的估计值,记为,. 注:这里的就是拟合直线上的点到点的距离. 用什么方法求,? 回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求,的方法:最小二乘法. 利用最小二乘法可以得到,的计算公式为 , 其中, 由此得到的直线就称为这对数据的回归直线,此直线方程即为线性回归方程.其中,分别为,的估计值,称为回归截距,称为回归系数,称为回归值. 在前面质点运动的线性回归方程中,,. 3. 线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位; 4. 化归思想(转化思想) 在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1),令,,则有. (2),令,,,则有. (3),令,,,则有. (4),令,,,则有. (5),令,,则有. 四.数学运用 1.例题: 例1.下表给出了我国从年至年人口数据资料,试根据表中数据估计我国年的人口数. 年份             人口数/百万             解:为了简化数据,先将年份减去,并将所得值用表示,对应人口数用表示,得到下面的数据表:                           作出个点构成的散点图, 由图可知,这些点在一条直线附近,可以用线性回归模型来表示它们之间的关系. 根据公式(1)可得  这里的分别为的估 计值,因此线性回归方程 为 由于年对应的,代入线性回归方程可得(百万),即年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本(万元)与人均产出(万元)的数据: 人均 资本 /万元            人均 产出 /万元             (1)设与之间具有近似关系(为常数),试根据表中数据估计和的值; (2)估计企业人均资本为万元时的人均产出(精确到). 分析:根据,所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对的两边取对数,就能将其转化为线性关系. 解(1)在的两边取常用对数,可得,设,,,则.相关数据计算如图所示.             1 人均资本/万元 3 4 5.5 6.5 7 8 9 10.5 11.5 14  2 人均产出/万元 4.12 4.67 8.68 11.01 13.04 14.43 17.5 25.46 26.66 45.2  3  0.47712 0.60206 0.74036 0.81291 0.8451 0.90309 0.95424 1.02119 1.0607 1.14613  4  0.6149 0.66932 0.93852 1.04179 1.11528 1.15927 1.24304 1.40586 1.42586 1.65514   仿照问题情境可得,的估计值,分别为由可得,即,的估计值分别为和. (2)由(1)知.样本数据及回归曲线的图形如图(见书本 页) 当时,(万元),故当企业人均资本为万元时,人均产值约为万元.

【点此下载】