高一数学必修四线性回归分析知识点

时间:2019-05-18  来源:高一  阅读:

【导语】有时候,洒脱一点,眼前便柳暗花明;宽容一点,心中便海阔天空。身边的世界往往比我们想象的要睿智与宽容。心存感激,永不放弃!即使是在最猛烈的风雨中,我们也要有抬起头,直面前方的勇气。因为请相信:任何一次苦难的经历,只要不是毁灭,就是财富!本站高一频道为你整理了《高一数学必修四线性回归分析知识点》希望对你有帮助!
4 (7).jpg
  【一】

  重点难点讲解:

  1.回归分析:

  就是对具有相关关系的两个变量之间的关系形式进行测定,确定一个相关的数学表达式,以便进行估计预测的统计分析方法。根据回归分析方法得出的数学表达式称为回归方程,它可能是直线,也可能是曲线。

  2.线性回归方程

  设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点(xi,yi)(i=1,......,n)大致分布在一条直线的附近,则回归直线的方程为。

  其中。

  3.线性相关性检验

  线性相关性检验是一种假设检验,它给出了一个具体检验y与x之间线性相关与否的办法。

  ①在课本附表3中查出与显著性水平0.05与自由度n-2(n为观测值组数)相应的相关系数临界值r0.05。

  ②由公式,计算r的值。

  ③检验所得结果

  如果|r|≤r0.05,可以认为y与x之间的线性相关关系不显著,接受统计假设。

  如果|r|>r0.05,可以认为y与x之间不具有线性相关关系的假设是不成立的,即y与x之间具有线性相关关系。

  典型例题讲解:

  例1.从某班50名学生中随机抽取10名,测得其数学考试成绩与物理考试成绩资料如表:序号12345678910数学成绩54666876788285879094,物理成绩61806286847685828896试建立该10名学生的物理成绩对数学成绩的线性回归模型。

  解:设数学成绩为x,物理成绩为,则可设所求线性回归模型为,

  计算,代入公式得∴所求线性回归模型为=0.74x+22.28。

  说明:将自变量x的值分别代入上述回归模型中,即可得到相应的因变量的估计值,由回归模型知:数学成绩每增加1分,物理成绩平均增加0.74分。大家可以在老师的帮助下对自己班的数学、化学成绩进行分析。

  例2.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y2.23.85.56.57.0

  若由资料可知y对x成线性相关关系。试求:

  (1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?

  分析:本题为了降低难度,告诉了y与x间成线性相关关系,目的是训练公式的使用。

  解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.049162536于是b=,。∴线性回归方程为:=bx+a=1.23x+0.08。

  (2)当x=10时,=1.23×10+0.08=12.38(万元)即估计使用10年时维修费用是12.38万元。

  说明:本题若没有告诉我们y与x间是线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。

  例3.某省七年的国民生产总值及社会商品零售总额如下表所示:已知国民生产总值与社会商品的零售总额之间存在线性关系,请建立回归模型。年份国民生产总值(亿元)

  社会商品零售总额(亿元)1985396.26205.821986442.04227.951987517.77268.661988625.10337.521989700.83366.001990792.54375.111991858.47413.18合计4333.012194.24

  解:设国民生产总值为x,社会商品零售总额为y,设线性回归模型为。

  依上表计算有关数据后代入的表达式得:∴所求线性回归模型为y=0.445957x+37.4148,表明国民生产总值每增加1亿元,社会商品零售总额将平均增加4459.57万元。

  例4.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜每年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份19931994199519961997199871999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x与y之间的相关系数,并检验是否线性相关;

  (2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。

  分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著水平0.05与自由度15-2相应的相关系数临界值r0.05比较,若r>r0.05,则线性相关,否则不线性相关。

  解:(1)列出下表,并用科学计算器进行有关计算:i123456789101112131415xi707480788592909592108115123130138145yi5.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0xiyi357444544608.4765938.490011401058118813571500.616251766.41885,.故蔬菜产量与施用氮肥量的相关系数:r=由于n=15,故自由度15-2=13。由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值r0.05=0.514,则r>r0.05,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。

  (2)设所求的回归直线方程为=bx+a,则∴回归直线方程为=0.0931x+0.7102。

  当x=150时,y的估值=0.0931×150+0.7102=14.675(t)。

  说明:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心谨慎计算,如果会使用含统计的科学计算器,能简单得到,这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数据进行处理。

  【二】

  问题提出

  1.函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.

  2.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?

  3.我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,但这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.

  知识探究(一):变量之间的相关关系

  思考1:考察下列问题中两个变量之间的关系:

  (1)商品销售收入与广告支出经费;

  (2)粮食产量与施肥量;

  (3)人体内的脂肪含量与年龄.

  这些问题中两个变量之间的关系是函数关系吗?

  思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?

  思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?

  自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.

  1、球的体积和球的半径具有()

  A函数关系B相关关系

  C不确定关系D无任何关系

  2、下列两个变量之间的关系不是

  函数关系的是()

  A角的度数和正弦值

  B速度一定时,距离和时间的关系

  C正方体的棱长和体积

  D日照时间和水稻的亩产量AD练:知识探究(二):散点图

  【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:

  其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.

  思考1:对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?

  思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?

  思考3:上图叫做散点图,你能描述一下散点图的含义吗?

  在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.

  思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?

  思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?

  思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?

  一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.

  一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.

  知识探究(一):回归直线

  思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?

  思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?

  这些点大致分布在一条直线附近.

  思考3:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?

  思考4:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?

  思考5:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?

  知识探究(二):回归方程

  在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.

  思考1:回归直线与散点图中各点的位置应具有怎样的关系?

  整体上最接近

  思考2:对于求回归直线方程,你有哪些想法?

  思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?20.9%某小卖部为了了解热茶销售量与气温

  之间的关系,随机统计并制作了某6天

  卖出热茶的杯数与当天气温的对照表:

  如果某天的气温是-50C,你能根据这些

  数据预测这天小卖部卖出热茶的杯数吗?

  实例探究

  为了了解热茶销量与

  气温的大致关系,我们

  以横坐标x表示气温,

  纵坐标y表示热茶销量,

  建立直角坐标系.将表

  中数据构成的6个数对

  表示的点在坐标系内

  标出,得到下图。

  你发现这些点有什么规律?

  今后我们称这样的图为散点图(scatterplot).

  建构数学

  所以,我们用类似于估计平均数时的

  思想,考虑离差的平方和

  当x=-5时,热茶销量约为66杯

  线性回归方程:

  一般地,设有n个观察数据如下:当a,b使2.三点(3,10),(7,20),(11,24)的

  线性回归方程是()D11.69

  二、求线性回归方程

  例2:观察两相关变量得如下表:

  求两变量间的回归方程解1:列表:

  阅读课本P73例1

  EXCEL作散点图

  利用线性回归方程解题步骤:

  1、先画出所给数据对应的散点图;

  2、观察散点,如果在一条直线附近,则说明所给量具有线性相关关系

  3、根据公式求出线性回归方程,并解决其他问题。

  (1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性

  模型还是随机模型.

  模型1:y=6+4x;模型2:y=6+4x+e.

  解(1)模型1:y=6+4x=6+4×3=18;

  模型2:y=6+4x+e=6+4×3+1=19.C线性相关与线性回归方程小结1、变量间相关关系的散点图

  2、如何利用“最小二乘法”思想求直线的回归方程

  3、学会用回归思想考察现实生活中变量之间的相关关系

高一数学必修四线性回归分析知识点

https://m.shkuanshun.cn/gaozhong/44738/

推荐访问:高一数学必修二课本答案人教版 高一数学必修三知识框架
相关阅读 猜你喜欢
本类排行 本类最新