高中数学北师大版必修3第1章7-8《相关性 相关性》ppt课件_图文

第一章
统 计

第一章
§7 相关性

§8 最小二乘估计

成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 ·必修3

有部分课件由于控制文件大小,内容不完整,请联系购买完整版

第一章

§7

§8

1

课前自主预习

3

易错疑难辨析

2

课堂典例讲练

4

课时作业

课前自主预习

丹顶鹤是生活在沼泽或浅水地带的一 种大型涉禽, 常被人冠以“湿地之神”的美 称. 某地区的环境条件非常适合丹顶鹤的栖 息繁衍.鹤在中华文化中有着长寿的涵义, 我们经常见到“松鹤延年”的壁画.有个有趣的现象,如果某 村庄附近栖息的丹顶鹤多, 那么这个村庄的老人的长寿率也高; 某村庄附近栖息的丹顶鹤少,那么这个村庄的老人的长寿率也 低.于是得出一个结论:丹顶鹤能够直接影响该村庄老人的长 寿率.你认为这个结论可靠吗?

1.相关性 函数关系和相关关系 (1)变量之间的两种关系是________ ________. (2)在考虑两个变量的关系时,为了对变量之间的关系有一 个大致的了解,人们通常将变量所对应的点描出来,这些点就 组成了变量之间的一个图,通常称这种图为变量之间的 散点图 . ________ (3)如果变量之间存在着某种关系,这些点会有一个集中的

光滑 的曲线来近似, 大致趋势,这种趋势通常可以用一条________
这样近似的过程称为曲线拟合.

若两个变量x和y的散点图中,所有点看上去都在一条直线 线性相关的.若所有点看上去都在某 附近波动,则称变量间是________ 条曲线(不是一条直线)附近波动,则称此相关为 非线性相关的 ,此时,可以用一条曲线来拟合.如果所有的 _____________

点在散点图中没有显示任何关系,则称变量间是不相关的.

2.最小二乘估计 (1)如果有 n 个点:(x1,y1),(x2,y2),…,(xn,yn),可以 用下面的表达式来刻画这些点与直线 y=a+bx 的接近程度: [y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.
最小值 的直线 y=a+bx 就是我们所要求 使得上式达到________ 最小二乘法 . 的直线,这种方法称为___________

x1+x2+…+xn y1+y2+…+yn 如果用 x 表示 ,用 y 表示 ,则可以 n n ?x1- x ??y1- y ?+?x2- x ??y2- y ?+…+?xn- x ??yn- y ? 求得 b= ?x1- x ?2+?x2- x ?2+…+?xn- x ?2 x1y1+x2y2+…+xnyn-n x y
2 2 2 x2 1+x2+…+xn-n x =____________________________.

y -b x 这样得到的直线方程称为____________ 线性回归方程,a, a=________.
b 是线性回归方程的系数.

(2)利用最小二乘法估计时,要先作出数据的散点图.如果 散点图呈现一定的规律性,我们再根据这个规律进行拟合.如
最小二乘法 估计出线性 果散点图呈现出线性关系, 我们可以用___________

回归方程;如果散点图呈现出其他的曲线关系,我们就要利用 其他的曲线进行拟合.

1.在下面各图中, 图中的两个变量具有相关关系的是(

)

A.(1)(2) C.(2)(4)

B.(1)(3) D.(2)(3)

[答案] D [解析] 根据题目所提供的信息,题图(1)表示函数的图 像;题图(2)上的点分布在某一条直线附近,所以它们是相关关

系;题图(3)上的点分布在某一个二次函数的图像附近,所以这
两个变量之间也是相关关系;题图(4)表示的点不具有相关关 系.所以题图(2)和题图(3)表示的点对应的两个变量具有相关关

系.

2.对于给定的两个变量的统计数据,下列说法正确的是
( ) A.都可以分析两个变量的关系 B.都可以用一条直线近似地表示两者的关系 C.都可以作出散点图

D.都可以用确定的表达式表示两者之间的关系
[答案] C [解析] 两个变量可能是无关的,A、D错误;两者可能不 是线性相关的,此时不能用直线近似,B错误;两者的关系可 能是无关的.

3.下表是 x 与 y 之间的一组数据,则 y 关于 x 的回归直线 必过点( ) x 0 1 2 3 y 1 3 5 7 A.(2,2) C.(1,2)
[答案] D

B.(1.5,2) D.(1.5,4)

1+2+3 1+3+5+7 - - [解析] x = =1.5, y = =4, 4 4 由于回归直线必过点(- x ,- y ),故必过点(1.5,4).

4.若施肥量x与小麦产量y之间的回归直线方程为y=250 +4x,当施肥量为50kg时,预计小麦产量为________kg.

[答案] 450
[解析] 把x=50kg代入y=250+4x可求得y=450kg.

5.由一组观测数据(x1,y1),(x2,y2),…,(x20,y20)得 x =
2 2 1, y =2,x2 + x +…+ x 1 2 20=29,x1y1+x2y2 +…+x20y20=54 ,

则线性回归方程是________.
[答案] y=1.56x+0.44

[ 解析 ]

代入公式 b =

x1y1+x2y2+…+x20y20-20 x y
2 2 2 x2 1+x2+…+x20-20 x



54-20×1×2 14 ≈1.56.a = y - b x = 2 - 1.56×1 = 0.44. 则所 2 = 9 29-20×1 求线性回归方程是 y=1.56x+0.44.

课堂典例讲练

变量间相关关系的判断

下列关系中,带有随机性相关关系的是
________. ①正方形的边长与面积之间的关系; ②水稻产量与施肥之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系. [思路分析] 两变量之间的关系有两种:函数关系与带有 随机性的相关关系.

[规范解答] ①正方形的边长与面积之间的关系是函数关
系. ②水稻产量与施肥之间不是严格的函数关系,但是具有相 关性,因而是相关关系. ③人的身高与年龄之间的关系既不是函数关系,也不是相

关关系,因为人的年龄达到一定时期身高就不发生明显变化
了,因而它们不具有相关关系. ④降雪量与交通事故的发生率之间具有相关关系. [答案] ②④

[规律总结]

相关关系与函数关系的区别在于是否具有确

定性.在区分二者时,如果一个变量每取一个值,另一个变量 总有唯一确定的值与之对应,那么这两个变量就是函数关系, 不是相关关系;如果一个变量每取一个值,另一个变量的取值 带有一定的随机性,并且从总体上来看有关系,但不是确定性 关系,那么这个变量之间就是相关关系,不是函数关系.确定 相关关系时有时要依靠生活经验大致确定.

下列两个变量之间不属于相关关系的是(
①学生每日学习时间与学习成绩; ②人的年龄与血压; ③某天的天气情况与股市的涨跌情况; ④球的表面积与体积. A.①② C.②③ [答案] D B.①③ D.③④

)

4 3 [解析] 在这四组中只有第④组 S 球=4πR ,V 球= πR ,可 3
2

以将任一个式子代换 R,得到 V 与 S 之间是一个函数关系,而 第③组天气与股市无关系.

用散点图判断相关关系

从高一(1)班中随机选出 10 名同学,将他们的身 高、数学成绩和物理成绩列表如下: 身高/m 1.5 1.6 1.55 1.65 1.45 1.06 1.52 1.66 1.7 1.4 数学成 绩/分 物理成 绩/分 90 85 78 88 87 76 95 75 68 70

88

84

80

83

78

70

90

80

74

68

试判断数学成绩与身高和物理成绩是否成相关关系.

[思路分析] 分别画出数学成绩与身高、数学成绩与物理

成绩的散点图,即可判断两者是否为相关关系.
[规范解答] 我们将上述数据,分别在“数学成绩—身高” 和“数学成绩—物理成绩”的坐标平面上,画出散点图如下图

所示.

从图(1)上的散点分布,我们看不出身高与数学成绩之间有 什么相关性,也就是说,这两个变量之间不存在相关性,而从 图(2)上,我们发现,在数学成绩与物理成绩之间有某种相关

性:不少数学成绩好的同学,物理成绩也很好,两者之间似乎
有一种线性关系,也就是说,这两个变量近似成线性相关关系. [规律总结] 判断变量之间有无相关关系,一种常用的简 便可行的方法就是绘制散点图,如果点的分布有规律(如大致在 一条直线附近),那么这两个变量之间具有相关关系.

下面是水稻产量与施肥量的一组统计数据(单位:kg): 水稻产量 320 330 360 410 460 470 480 施肥量 15 20 25 30 35 40 45

(1)将上表中的数据制成散点图; (2) 你能从散点图中发现施肥量与水稻产量近似成什么关 系吗?水稻产量会一直随着施肥量的增加而增加吗? (3)若近似成线性关系,请画出一条直线来近似表示这种线 性关系.

[解析] (1)以 x 轴表示施肥量,y 轴表示水稻产量,可得散 点图如图所示:

(2)从图中可以发现施肥量与水稻产量之间具有相关关 系.当施肥量由小到大变化时,水稻产量也由小变大,但水稻 产量只是在一定范围内随着施肥量的增加而增加. (3)如图所示.

求回归直线方程

某市近 5 年的煤气消耗量与使用煤气户数如下 表: 年份 x(万户) y(百万立方米) 2008 2009 2010 2011 2012 1 6 1.1 7 1.5 9 1.6 11 1.8 12

(1)检验是否线性相关; (2)求 y 对 x 的回归直线方程.

[思路分析]

根据表中的数据 → 作出散点图 →

判断是否线性相关 → 若是,则根据公式求得a,b → 得回归直线方程
[规范解答] 示. (1)作出散点图,观察呈线性正相关,如图所

1+1.1+1.5+1.6+1.8 7 - (2) x = = , 5 5 6+7+9+11+12 - y= =9, 5
2 2 2 2 2 ?x2 i =1 +1.1 +1.5 +1.6 +1.8 =10.26, i= 1 5

?xiyi=1×6+1.1×7+1.5×9+1.6×11+1.8×12=66.4.
i= 1

5

7 66.4-5× ×9 i= 1 5 170 ∴b= = = , 49 23 5 10.26-5× x2 25 ?xi2-5-
i= 1

x- y ?xiyi-5-

5

170 7 31 - - a= y -b x =9- × =- , 23 5 23 170 31 ∴y 对 x 的回归直线方程为 y= x- . 23 23

[规律总结] 求回归直线方程的步骤:
n 2 (1)先把数据制成表,从表中计算出 xi, yi, xi , xiyi; i=1 i= 1 i= 1 i= 1

?

n

?

n

?

n

?

? n ? x- y ?xiyi-n- ? ? i =1 , ?b= n (2)计算回归系数 a,b,公式为? -2 ? ?x2 i -n x i= 1 ? ? ? y -bx; ? a =- (3)写出回归直线方程 y=bx+a.

已知 x、y 之间具有线性相关关系,且它们之间的一组数据 如下: x 0 1 2 3 y 1 3 5 7
2 2 (1)分别计算:- x 、- y 、x1y1+x2y2+x3y3+x4y4、x2 1+x2+x3+

x2 4; (2)求出线性回归方程 y=bx+a.

[解析]

可利用表格中的数直接计算,然后把这些结果代

入回归方程系数公式,分别求得 a,b,再求出 y. 0+1+2+3 1+3+5+7 - - (1) x = =1.5, y = =4,x1y1+x2y2 4 4
2 2 2 +x3y3+x4y4=0×1+1×3+2×5+3×7=34,x2 + x + x + x 1 2 3 4=

02+12+22+32=14; x1y1+x2y2+x3y3+x4y4-4- x- y 34-4×1.5×4 (2)b= = 2 =2, 2 2 2 2 2 14-4×1.5 x1+x2+x3+x4-4- x a=- y -b- x =4-2×1.5=1,故 y=2x+1.

利用线性回归方程对总体进行估计 要分析学生初中升学的数学成绩对高中一年级 数学学习有什么影响,在高中一年级学生中随机抽选 10 名学 生,分析他们入学的数学成绩和高中一年级期末数学考试成绩

(如表):

学生编号 入学数 学成绩x

1

2

3

4

5

6

7

8

9

10

63 67 45 88 81 71 52 99 58 76

高一期末 65 78 52 82 92 89 73 98 56 75 数学成绩y

(1)计算入学数学成绩(x)与高一期末数学考试成绩(y)的线

性回归方程;
(2)若某学生入学数学成绩为80分,试估计他高一期末数学 考试成绩;

(3)若事实上该学生期末考试数学成绩为94分,如何解释?
[思路分析] 先画散点图初步判断相关关系类型,再结合 相应公式进行计算.

[规范解答]

(1)从入学成绩(x)与高一期末数学考试成绩(y)

两组变量的散点图可以看出,这两组变量具有线性相关关系.

通过计算知: x =70, y =76,
2 ∑ ( x - x )( y - y ) = 1 894 , ∑ ( x - x ) =2 474, 1 i i i= 1 i= 1 10 10

于是 b=0.765 56,a=- y -b- x =22.410 67, 因此所求的线性回归方程为 y=0.765 56x+22.410 67. (2)若某学生入学数学成绩为 80 分, 代入上式 y=0.765 56x +22.410 67,可得 y≈84,即这个学生高一期末数学考试成绩 预测值为 84 分. (3)用样本估计总体时,如果抽样的方法比较合理,那么样 本可以反映总体的信息,但从样本得到的信息会有偏差.

某班5名学生的2015年高考总成绩和数学成绩(单位:分)如
下表: 学生 总成绩(x) A B C D E 534 482 425 608 636 85 74 117 130

数学成绩(Y) 106

(1)画出散点图,并判断总成绩与数学成绩是否有相关关

系;
(2)求数学成绩Y对总成绩x的回归直线方程; (3)如果一个学生的总成绩为600分,试预测这个学生的数

学成绩.

[解析] (1)散点图如图所示:

由散点图可以看出总成绩 (Y)与数学成绩 (x)有很强的线性 相关关系.

(2)列表计算 序号 1 2 3 4 5 ∑ x 534 482 425 608 636 Y 106 85 74 117 130 x2 285 156 232 324 180 625 369 664 404 496 xy 56 604 40 970 31 450 71 136 82 680 282 840

2 685 512 1472 265

设所求回归直线方程为 y=bx+a,则由上表可得

?xiyi-5 x y
i= 1

5

b=

?xi2-5 x 2
i= 1

5

7 896 = ≈0.26, 30 420

a= y -b x ≈-37. 所以所求回归直线方程为 y=0.26x-37. (3)根据上面求得的回归直线方程,当总成绩为 600 分时, y=0.26×600-37=119(分). 即这个学生的数学成绩约为 119 分.

易错疑难辨析

由一组样本数据(x1,y1),(x2,y2),…,(xn,yn) 得到线性回归方程 y=bx+a,那么下列说法中错误的是( A.直线 y=bx+a 必经过点( x , y ) B.直线 y=bx+a 至少经过点(x1,y2),(x2,y2),…,(xn, yn)中的一个点
n

)

∑xiyi-n x y i=1 C.直线 y=bx+a 的斜率为 b= n ∑xi2-n x 2
i=1

D.直线 y=bx+a 和各点(x1,y1),(x2,y2),…,(xn,yn) 的偏差的平方和∑[yi-(bxi+a)]2 是该坐标平面上所有直线与这
i=1 n

些点的偏差的平方和中最小的

[错解] A

[辨析]

不理解线性回归方程的真正含义.因为 y =b x +

1 1 a,其中 x = (x1+x2+…+xn), y = (y1+y2+…+yn),显然回 n n 归直线经过点( x , y ).故 A 是正确的.回归直线最能近似刻画 点(x1,y1), (x2,y2),…, (xn,yn)的变化趋势,但并不一定经 过某些点.故 B 是错误的.对于 C、D 只需了解相应概念便会 得出正确结论.

[正解] B

[规律总结]

回归直线 y=bx+a,它最能近似反映样本数

据(x1,y1),(x2,y2),…,(xn,yn)所表示点的变化趋势,因为 y =b x +a,所以回归直线过点( x , y ).


相关文档

2017-2018学年高中数学北师大版必修3 ppt课件 第一章 统计1.6-7统计活动 结婚年龄的变化相关性(30张)
最新高中数学北师大版必修3第1章2.1《简单随机抽样》ppt课件
最新高中数学北师大版必修3第1章《统计》ppt复习课件
电脑版