3.1.2相关系数 课件(北师大版选修2-3_图文

BS ·数学 选修2-3





1.2 相关系数

易 误















导 学

1.了解两个随机变量间的线性相关系数 r,并能利

堂 双



用公式求出相关系数 r;了解正相关、负相关、不

达 标

课标解读 相关的概念.











2.能利用相关系数 r 判断两个随机变量间线性相 作





探 究

关程度的大小,从而判断回归直线拟合的效果.













菜单

BS ·数学 选修2-3



相关系数







课 【问题导思】

辨 析



自 1.有什么办法判断两个变量是否具有线性相关关系?




导 学

【提示】

作出散点图,看这些点是否在某一直线的附近,

堂 双

计算线性相关系数.

基 达



2.线性相关系数与最小误差有何关系?

课 堂

【提示】 Q(误差)=lyy(1-r2).

课 时





动 3.相关系数r的绝对值的大小对相关性有何影响?





究 【提示】 |r|越大,变量之间的相关程度越高;|r|越小, 教

变量间线性相关程度越低;当r=0时,两个变量线性不相

师 备

关.







菜单

BS ·数学 选修2-3





4.r 的正负对相关性的影响.

易 误

课 前 自

【提示】 r>0,b=llxxyx>0 两变量正相关;

辨 析





导 学

r<0,b=llxxyx<0,两变量负相关.

堂 双 基 达





1.判断两个变量之间的线性相关关系的方法有:



堂 互

(1) 计算线性相关系数r .

时 作





探 究

(2) 画散点图 .













菜单

BS ·数学 选修2-3





2.假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,

易 误



课 前

(xn,yn),则变量间线性相关系数 r 的计算公式为







n



导 学

r=

lxy lxx

= lyy

∑ ?xi- x ??yi- y ?
i=1

n

n

∑ ?xi- x ?2 ? ?yi- y ?2

堂 双 基 达 标

i=1

i=1









互 动

n
∑xiyi-n x y

作 业

探 究



i=1 n

n

∑x2i -n x 2 ∑y2i -n y 2

i=1

i=1

教 师 备







菜单

BS ·数学 选修2-3











相关系数及其应用

辨 析



自 主

维尼纶纤维的耐热水性能的好坏可以用指标 当

导 学

“缩醛化度”y 来衡量,这个指标越高,耐热水性能就越好,

堂 双

而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用

基 达

甲醛浓度 x(克/升)去控制这一指标,为此必须找出它们之间的 标

关系,现安排一批试验,获得如下表数据.







甲醛浓度



互 动

(克/升) 18 20 22 24 26 28 30

作 业

探 究

缩醛化度 26. 28. 28. 28. 29. 30. 30.

(克分子%) 86 35 75 87 75 00 36

教 师

求相关系数 r.

备 课

【思路探究】

可直接利用相关系数 r 的公式直接计算.

资 源

菜单

BS ·数学 选修2-3

【自主解答】 列表如下:

易 错



i xi

yi

xi2

xiyi

yi2

误 辨





前 自

1 18 26.86 324 483.48 721.459 6







2 20 28.35 400 567 803.722 5







3 22 28.75 484 632.5 826.562 5

基 达



4 24 28.87 576 692.88 833.476 9

课 堂

5 26 29.75 676 773.5 885.062 5

课 时







6 28 30.00 784 840

900







7 30 30.36 900 910.80 921.729 6





∑ 168 202.94 4 144 4 900.16 5 892.013 6









菜单

BS ·数学 选修2-3











课 前

x =24, y =28.99,





主 导 学

7

r=

∑ i=1xiyi-7 x y

7

7

∑x2i -7 x 2 ∑y2i -7 y 2

当 堂 双 基 达 标

i=1

i=1

课 堂 互



4 900.16-7×24×28.99 4 144-7×242× 5 892.013 6-7×28.992

课 时 作





探 究

≈0.94.













菜单

BS ·数学 选修2-3































当相关系数|r|越接近 1 时,两个变量的线性相关程度越

基 达



高,当相关系数|r|越接近 0 时,两个变量的线性相关程度越





堂 低.



























菜单

BS ·数学 选修2-3





























下列是小麦产量与施化肥量的一组观测数据:







施化肥量 15 20 25 30 35 40 45





小麦产量 320 330 360 410 460 470 480







互 动

判断施化肥量与水稻产量是否有相关关系.

作 业

















菜单

BS ·数学 选修2-3

【解】

易 错



i xi yi

xi2

yi2

xiyi

误 辨





前 自

1 15 320 225 102 400 4 800







2 20 330 400 108 900 6 600







3 25 360 625 129 600 9 000

基 达



4 30 410 900 168 100 12 300

课 堂

5 35 460 1 225 211 600 16 100

课 时







6 40 470 1 600 220 900 18 800







7 45 480 2 025 230 400 21 600





∑ 210 2 830 7 000 1 171 900 89 200









菜单

BS ·数学 选修2-3







7





自 主

∴r=

?xiyi-7 x y
i=1



7

7



??x2i -7 x 2???yi2-7 y 2?

误 辨 析
当 堂 双 基

i=1

i=1





课 堂

= 700×4 32070771.43≈0.975.

课 时





动 探

由于 r=0.975>0,因此施化肥量和水稻产量近似成线性 业



正相关关系.

教 师









菜单

BS ·数学 选修2-3











线性回归分析的综合应用

辨 析





主 导


“阿曼德匹萨”是一个制作和外卖意大利匹萨 堂





的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺

基 达



的销售额与店铺附近地区大学生人数的关系,随机抽取十个





堂 互

分店的样本,得到数据如下:

时 作





















菜单

BS ·数学 选修2-3











店铺编号 区内大学生数(万人) 季度销售额(万元)

辨 析

前 自

1

0.2



2

0.6

导 学

3

0.8

4

0.8

5.8

10.5

当 堂

8.8



11.8

基 达

5

1.2

11.7



6

1.6

课 堂

7

2



8

2





9

2.2



10

2.6

13.7

15.7

课 时

16.9

作 业

14.9

20.2













菜单

BS ·数学 选修2-3











课 前

(1)试对区内大学生人数与店铺的销售额的关系进行相关 析



主 导

性检验;

当 堂





(2)试根据这些数据建立回归模型,然后再进一步根据回

基 达



归方程预测一个区内大学生人数 1 万人店铺的季度销售额;





堂 互

(3)若店铺的季度销售额低于 10 万元则亏损,试求建店区

时 作





探 内大学生人数至少约多少人?















菜单

BS ·数学 选修2-3





【思路探究】 先根据表中的数据作相关检验,然后判 易 误


课 断是否具有相关关系,再根据所给的数据解出线性回归方程, 析




主 最后进行预测.











【自主解答】

(1)根据数据我们对区内大学生人数 x 与

基 达



课 店铺季度销售额 y 作相关检验.根据数据可知: x =110(0.2+ 课





互 动 探

0.6+…+2.6)=1.4;y =110(5.8+10.5+…+20.2)=13,∑i1=01xi2-

作 业



10

10



10 x 2=5.68,∑ i=1xiyi-10 x y =28.4,∑ i=1y2i -10 y 2=157.3,

师 备 课





菜单

BS ·数学 选修2-3

因此 r= 5.6828×.4157.3≈0.95;|r|接近 1,因此有把握认为

易 错 易 误



课 前

区内大学生人数 x 与店铺季度销售额 y 具有线性相关关系,





主 求 y 对 x 的回归直线方程有意义.


当 堂





(2)回归系数 b=258.6.48=5,a=13-5×1.4=6.

基 达 标



因此回归直线方程是 y=bx+a=5x+6.







互 动

当 x=1 时,y=5×1+6=11,即区内大学生人数 1 万元

作 业


究 店铺的季度销售额约 11 万元.



(3)由回归直线方程是 y=5x+6.令 y≥10,解得 x≥0.8,

师 备



所以当建店区内大学生人数至少 8 000 人时才适合建店.

资 源

菜单

BS ·数学 选修2-3











课 前

进行相关性检验主要有两种常用方法,一是作散点图, 析



主 导

观察所给的数据点是否在一条直线的附近,作散点图的优点

当 堂





是既直观又方便,是解决相关性检验问题比较常用的方法;

基 达



缺点是作图总是存在误差,有时很难判断这些点是不是分布





堂 在一条直线的附近.二是利用样本相关系数对其进行相关性 时





动 探

检验,优点是判断准确,缺点是计算繁琐,但可以借助计算





器进行处理.

教 师









菜单

BS ·数学 选修2-3







在我国某地的一个县城,近期发现了好几个癌症村.政

误 辨





前 自

府部门十分震惊,马上组成调查组调查病因,经调查发现致





导 学

癌的罪魁祸首是水源中的金属砷,它们来自附近的几家化工

堂 双



厂,化工厂排出的废水中含有金属砷,废水污染了水源,人

达 标

课 食用了这种水就会致癌.下面就是调查组对几个癌症村水源 课





互 中的砷超标的倍数和患癌症的人数统计的数据:











砷超标的倍数 x 3 4 5.5 4.2 5.8 6 3.5





患癌症人数 y 15 20 28 24 35 44 34

备 课





菜单

BS ·数学 选修2-3

(1)画出表中数据的散点图;





(2)求 y 对 x 的回归方程;

易 误



课 前

(3)若一个村的水源中砷超标的倍数为 7,试估计这个村 析



主 的患癌症的人数.


当 堂



【解】 (1)散点图如图所示:

双 基





































菜单

BS ·数学 选修2-3



(2)观察散点图,可知 x、y 成线性相关关系.







课 前

计算得 x =372, y =2070,

辨 析



主 导

根据求 b 公式代入数据计算得

当 堂





b≈6.065,a=2070-6.065×372≈0.846.

基 达 标



所以患癌症人数 y 对水源中砷超标的倍数 x 的回归直线 课





互 动

方程为 y=6.065x+0.846.

作 业

探 究

(3)根据上面求得的回归直线方程,当水源中砷超标的倍



数为 7 时,y=6.065×7+0.846=43.301.

师 备



即该村患癌症的人数约为 43 人.





菜单

BS ·数学 选修2-3











对误差的大小与变量相关关系的理解有误

辨 析



自 主 导 学

对两个变量 y 和 x 进行回归分析,得到一组样 本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正 确的是( )

当 堂 双 基

A.由样本数据得到的回归方程 y=bx+a 必过样本点的

达 标

中心( x , y )

课 堂

B.在回归分析中,误差 Q 越小,变量之间的线性相关

课 时

互 动

程度越高

作 业

探 究

C.相关系数 r 越小,说明变量之间的线性相关程度越小

D.在散点图中,若 n 个点在一条直线上,说明变量之间

教 师

的相关性强





【错解】 B

资 源

菜单

BS ·数学 选修2-3







【错因分析】 对误差Q与变量间的相关关系理解错误.

误 辨

课 前

【防范措施】 正确理解回归方程、相关系数r、误差Q、



自 主

散点图等概念是解决概念题的基础.









【正解】 ∵误差Q越小,|r|越大,变量之间的线性相关

双 基

程度越高,而相关系数r的范围为-1≤r≤1,∴C错误.

达 标

【答案】 C

































菜单

BS ·数学 选修2-3















前 自

1.相关系数是用来刻画两个变量相关关系的强与弱的.







n





2.相关系数的计算公式 r=

∑ ?xi- x ??yi- y ?
i=1

n

n

∑ ?xi- x 2?∑ ?yi- y 2?

双 基 达 标

i=1

i=1





堂 互

n
∑xiyi-n x y

时 作

动 探



i=1 n

n





∑x2i -n x 2 ∑y2i -n y 2

i=1

i=1













菜单

BS ·数学 选修2-3











1.在对变量 y 和 x 进行线性相关检验时,已知 n 是观测

辨 析



自 主

值组数,r 是相关系数,且已知:









①n=7,r=0.953 3;②n=15,r=0.301 2;

双 基



③n=17,r=0.499 1;④n=3,r=0.9950.





则变量 y 和 x 具有较高线性相关程度的是( )







互 动

A.①和②

B.①和④

作 业





C.②和④

D.③和④













菜单

BS ·数学 选修2-3























导 学

【解析】

相关系数 r 的绝对值越大,变量 x,y 的线性

堂 双



相关程度越高,故选 B.

达 标

【答案】 B

































菜单

BS ·数学 选修2-3











2.对相关系数 r,下列说法正确的是( )

辨 析



自 主

A.|r|越大,相关程度越大









B.|r|越小,相关程度越大

双 基



C.|r|越大,相关程度越小,|r|越小,相关程度越大



课 堂

D.|r|≤1 且|r|越接近于 1,相关程度越大,|r|越接近 0,

课 时





动 相关程度越小



















菜单

BS ·数学 选修2-3





【解析】 由两个变量相关系数公式









前 自

n
? ?xi- x ??yi- y ?



i=1

导 学

r=




当 堂 双

n

n

? ?xi- x ?2·? ?yi- y ?2

基 达 标

i=1

i=1







可知,|r|越接近于 1,相关程度越大,|r|越接近于 0,相 时





动 探

关程度越小,故选 D.







【答案】 D

师 备







菜单

BS ·数学 选修2-3











课 前

3.在回归分析中,相关系数|r|越大,则误差 Q(a,b)应 析



主 导

________.

当 堂



【解析】 ∵Q=lxy(1-r2)>0,

双 基 达


∴|r|越大,Q 越小.







【答案】 越小



























菜单

BS ·数学 选修2-3



4.一唱片公司欲知打歌费用 x(十万元)与唱片销售量 y(千

错 易





张)之间的关系,从其所发行的唱片中随机抽取了 10 张,得

辨 析



自 主 导

10

10

10

10

到如下的资料:∑ i=1xi=28,∑i=1x2i =303.4,∑ i=1yi=75,∑ i=1y2i =598.5,

当 堂





10



∑ i=1xiyi=237,求 y 与 x 的相关系数 r 的值.

达 标



【解】 由题中数据可知







互 动 探

r= 303.4-1203×7-2.1802× ×2.58×987.5.- 5 10×7.52=0.3.

作 业















菜单

BS ·数学 选修2-3

















自 主

对于 x 与 y 有如下观测数据:









x 18 25 30 39 41 42 49 52

双 基



y 3 5 6 7 8 8 9 10





(1)作出散点图;







互 动

(2)根据数据判断 x 与 y 是否具有相关关系;

作 业





(3)求 x 与 y 的回归直线方程;



(4)根据回归直线方程,预测 y=20 时 x 的值.

师 备







菜单

BS ·数学 选修2-3








【思路探究】 解决有关线性回归问题的一般步骤是: 辨







自 散点图→相关系数→回归方程.















【自主解答】 (1)作出散点图,如图





































菜单

BS ·数学 选修2-3









课 前

(2) x =18×(18+25+30+39+41+42+49+52)=2986=

辨 析



主 导

37,

当 堂





y =18×(3+5+6+7+8+8+9+10)=7,

基 达 标



8



堂 互

?x

2 i



182



252



302



392



412



422



492



522



11

时 作



i=1







920,













菜单

BS ·数学 选修2-3



8
?y2i =32+52+62+72+82+82+92+102=428,

错 易

i=1











自 主 导

8
?xiyi=18×3+25×5+30×6+39×7+41×8+42×8+

当 堂



i=1







49×9+52×10=2 257,





8



堂 互

?xiyi-8 x y =2 257-8×37×7=185,

时 作



i=1









8
?x2i -8 x 2=11 920-8×372=968,

师 备

i=1







菜单

BS ·数学 选修2-3







8



?y2i -8 y 2=428-8×72=36,



i=1

误 辨 析









8



?xiyi-8 x y

堂 双 基

i=1

∴r=

8

8



= 96188×5 36≈0.991.



课 堂

??x2i -8 x 2???yi2-8 y 2?



i=1

i=1

课 时 作





探 究

由于 r=0.991 接近于 1,因此,认为两个变量有很强的



相关关系.

师 备







菜单

BS ·数学 选修2-3







8





?xiyi-8 x y

辨 析

前 自 主 导 学

i=1
(3)回归系数 b=
8

=21215972-0-8×8×373×727≈0.191,

当 堂

?x2i -8 x 2
i=1

双 基 达



a= y -b x =7-0.191×37=-0.067,





堂 互

所以 y 对 x 的回归直线方程是 y=0.191x-0.067.

时 作





探 究

(4)当 y=20 时,有 20=0.191x-0.067,有 x≈105.因此



在 y 的值为 20 时,x 的值约为 105.

师 备







菜单

BS ·数学 选修2-3































1.本题没有说明 y 对 x 呈线性相关关系,故需根据散点

基 达



图先确定变量是否线性相关.







2.相关系数用来检验线性相关性的强弱.



























菜单

BS ·数学 选修2-3











10 名同学在高一和高二的数学成绩如下表:

辨 析



自 主

x 74 71 72 68 76 73 67 70 65 74









y 76 75 71 70 76 79 65 77 62 72

双 基

其中 x 为高一数学成绩,y 为高二数学成绩.

达 标



(1)y 与 x 是否具有相关关系;







互 动

(2)如果 y 与 x 是相关关系,求回归直线方程;

作 业





(3)如果某同学在高一时的数学成绩为 90 分,试估计其在



高二时的数学成绩.

师 备







菜单

BS ·数学 选修2-3







【解】 (1)由已知表格中的数据,计算得

误 辨







自 主

10

10

?xi=710,?yi=723, x =71, y =72.3,

导 学

i=1

i=1

当 堂 双





10



?xiyi=51 467,



i=1











动 探 究

10

10

?x2i =50 520,?yi2=52 541.



i=1

i=1













菜单

BS ·数学 选修2-3







10



?xiyi-10 x ·y

误 辨 析



i=1

自 主

r=





10

10



?xi2-10 x 2

?yi2-10 y 2

堂 双 基

i=1

i=1





课 堂



51 467-10×72.3×71 50 520-10×712· 52 541-10×72.32

课 时











≈0.780 297.



由于 r≈0.780 297,可认为 x 与 y 之间具有线性相关关系.

教 师









菜单

BS ·数学 选修2-3


(2)y 与 x 具有线性相关关系,设回归直线方程 y=a+bx,则 错





10

课 前 自 主 导

?xiyi-10 x y

i=1
b=
10

=51

467-10×71×72.3 50 520-10×712

辨 析
当 堂



?x2i -10 x 2

双 基

i=1





≈1.22,







a= y -b x =72.3-1.22×71=-14.32,













所以 y 关于 x 的回归直线方程为



y=-14.32+1.22x.

教 师



(3)y=-14.32+1.22×90≈95(分).







菜单

BS ·数学 选修2-3







教学拓展

误 辨





如何利用残差图进行残差分析?



自 主

在回归模型中,残差变量是一个不能被观测的量,即在 当

导 学

实际问题中我们无法得到残差变量的观测值.因此,我们不

堂 双

能希望有某方法获取残差变量的值以提高预报变量的估计精

基 达

度,但却可以估计预报变量观测值中所包含的残差变量,这 标

课 种估计对于查找样本数据中的错误和模型的评价极为有



堂 用.残差分析是回归诊断的一种方法.最简单的残差分析是 时





动 通过观测残差图,以发现观测数据中可能出现的错误以及所 业


究 选用的回归模型是否恰当.利用残差图进行残差分析的具体

步骤如下:

教 师









菜单

BS ·数学 选修2-3

















自 主 导

①计算每组观测数据的残差,^ei=yi-^yi(i=1,2,…,n),

当 堂

学 即残差等于观测值减预测值.

双 基



②画残差图.残差图的纵坐标为残差,横坐标通常可以 标

课 堂

是观测样本的序号、自变量 x 或因变量的预测值等,残差图

课 时





动 是一种散点图.



















菜单

BS ·数学 选修2-3





③分析残差图.几种常见的残差图如下:

































































菜单

课 前 自 主 导 学
课 堂 互 动 探 究
菜单

BS ·数学 选修2-3
易 错 易 误 辨 析
当 堂 双 基 达 标
课 时 作 业
教 师 备 课 资 源

BS ·数学 选修2-3



我们以横坐标为观测样本的序号为例,说明每张图的含

错 易



课 义.

辨 析



自 主

图 1:残差散点图中的点分布在以 0 为中心的水平带形 当







区域上,并且沿水平方向散点的分布的规律相同,说明残差

双 基



是随机的,所选择的回归模型建模是合理的.





图 2:残差散点图中的点分布在一条倾斜的带形区域上, 课





互 动

并且沿带形区域方向散点的分布的规律相同,说明残差与横

作 业



究 坐标有线性关系,此时所选用的回归模型的效果不是最好的, 教



有改进的余地.

备 课





菜单

BS ·数学 选修2-3











图 3:残差散点图中的点分布在一条二次曲线形的弯曲

辨 析



自 主

带形区域上,说明残差与坐标横轴变量有二次关系,此时所







学 选用的回归模型的效果不是最好的,有改进的余地.

双 基



图 4:残差散点图中的点的分布范围随着横坐标的增 加 标

课 而增加,说明残差的方差与坐标横轴变量有关,不是一个常 课





互 动

数,此时所选用的回归模型的效果不是最好的,有改进的余

作 业



究 地,













菜单

BS ·数学 选修2-3



















主 导


④找异常值.根据计算的残差值和残差图,观察残差是 堂





否有特别大的那些点,即远离横坐标轴的点.如果存在远离

基 达



坐标轴的点,就要研究它出现的原因,是否在数据收集和录





堂 入中出现错误,如果有错误,改正后重新建立回归模型. 时

























菜单


相关文档

高中数学北师大版选修2-3 3.1.2相关系数 课件
高中数学 3.1.2 相关系数课件 北师大版选修2-3
北师大版高中数学选修2-3课件3.1.2 相关系数 课件 3
《3.1.2 相关系数》 课件 3-优质公开课-北师大选修2-3精品
【同步测控】高二数学北师大版选修2-3课件3.1.2 相关系数
《3.1.2 相关系数》 课件 2-优质公开课-北师大选修2-3精品
北师大版高中数学选修2-3课件3.1.2 相关系数 课件 2
高二数学北师大版选修2-3课件:3.1.2 相关系数
北师大版高中数学选修2-3课件3.1.2 相关系数 课件 1
高中数学3-1-2相关系数同步课件北师大版选修资料
电脑版