高二数学《用样本的频率分布估计总体分布》上课_图文

用样本的频率分布 估计总体分布 (一)
样本的频率分布表及频率分布直方图

复习引入:
(1)统计的核心问题:

如何是抽取的样本具有代表性

如何根据样本的情况对总体的情况作出推断
(2)随机抽样的几种常用方法 :

简单随机抽样 系统抽样 分层抽样
(3)通过抽样方法收集数据的目的是什么?

从中寻找所包含的信息,用样本去估计总体

探究:
我国是世界上严重缺水 的国家之一,城市缺水 问题较为突出,某市政 府为了节约生活用水, 计划在本市试行居民生 活用水定额管理,即确 定一个居民月用水量标 准a,用水量不超过a的 部分按平价收费,超出 a的部分按议价收费。 如果希望大部分居民的 日常生活不受影响,那 么标准a定为多少比较 合理呢 ?
你认为,为了较为 合理地确定出这个 标准,需要做哪些 工作?

探究:
我国是世界上严重缺水 的国家之一,城市缺水 问题较为突出,某市政 府为了节约生活用水, 计划在本市试行居民生 活用水定额管理,即确 定一个居民月用水量标 准a,用水量不超过a的 部分按平价收费,超出 a的部分按议价收费。 如果希望大部分居民的 日常生活不受影响,那 么标准a定为多少比较 合理呢 ?

①采用抽样调查的方 式获得样本数据 ②分析样本数据来估 计全市居民用水量的 分布情况

下表给出100位居民的月均用水量表

讨论:如何分 析数据?

根据这些数据 你能得出用水 量其他信息吗?

为此我们要对这些数据进行整理与分析

〈一〉频率分布的概念:

频率分布是指一个样本数据在各个小范围 内所占比例的大小。一般用频率分布直方 图反映样本的频率分布 〈二〉画频率分布直方图其一般步骤为: (1)计算一组数据中最大值与最小值的差, 即求极差 (2)决定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图

第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1 第二步: 决定组距与组数: (强调取整) 当样本容量不超过100时, 按照数据的多少, 常
分成5~12组.

为方便组距的选择应力求“取整”.
本题如果组距为0.5(t). 则 组数= 极差 ? 4.1 ? 8.2 所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限)
组距 0.5

[0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.

第四步: 列频率分布表.
分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5) 合计 频数 4 8 15 22 25 15 5 4 2 100 频率
0.04 0.08

组距=0.5
频率/组距
0.08 0.16 0.3 0.44

0.15
0.22

0.25
0.15 0.05

0.5
0.3 0.1 0.08 0.04 2.00

0.04
0.02 1

第 五 步: 画 出 频 率 分 布 直 方 图.

频率/组距 (组距=0.5)
0.6
0.5 0.5请大家阅读第 0.44 68页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?

小长方形的面 月均用水量最 多的在哪个区 积总和=? 积=? 间?

0.2

0.16

0.1 0.08 0

0.1

0.08

0.04

0.5

1 1.5

2

2.5

3

3.5 4

4.5

月均用水量/t

频率分布直方图的特征: 从频率分布直方图可以清楚的看出 数据分布的总体趋势。 从频率分布直方图得不出原始的数 据内容,把数据表示成直方图后, 原有的具体数据信息就被抹掉了。

分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5] 合计

频率 0.04 0.08 0.15 0.22 0.25 0.14

频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.06 0.04 0.02 1

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

问题7 如果当地政府希望使85% 以上的居 民每月的用水量不超出标准,根据频率分 布表和频率分布直方图,你能对制定月用 水量标准提出建议吗?

分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5] 合计

频率 0.04 0.08 0.15 0.22 0.25 0.14

频率/组距 0.50 0.40 0.30 0.20 0.10 0

0.06 0.04 0.02 1

0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t

问题9 你认为3吨这个标准一定能够保 证85%以上的居民用水不超标吗?如果不 一定,那么哪些环节可能导致结论的差别 ?

3.将组距确定为1,作出教材P68页 居民月 均用水量的频率分布直方图 4.谈谈两种组距下,你对图的印象?同一个样 本数据,绘制出来的分布图是唯一的吗?

同样一组数据,如果组距不同,得到的图 的形状也会不同。不同的形状给人以不同的印 象,这种印象有时会影响我们对总体的判断

练 习:
1.有一个容量为50的样本数据的分组的频数 如下:
[12.5, [15.5, [18.5, 15.5) 18.5) 21.5) 3 [24.5, 8 [27.5, 27.5) 30.5) 10 5

9 [30.5, 33.5) 4 [21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?

解:组距为3
分组 频数 3 8 9 频率 频率/ 组距

[12.5, 15.5)
[15.5, 18.5) [18.5, 21.5)

[21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) [30.5, 33.5) 5 4

0.06 0.16 0.18 0.22 0.20 0.10 0.08

0.020 0.053 0.060 0.073 0.067 0.033 0.027

频率分布直方图如下:
频率

组距
0.070 0.060 0.050 0.040 0.030 0.020

0.010 12.5 15.5

3.学校为了调查学生在课 外读物方面的支出况,抽出了 一个容量为n的样本,其频率 分布直方图如右图所示,其中 支出在[50, 60)元的同学有30 人,则n的值为 100

频率 组距
0.036 0.024 0.01

元 20 30 40 50 60

4.统计某校1000名学生的数学水平测试成绩,得到 样本频率分布直方图如图所示,若满分为100分,规定 不低于60分为及格,则及格率是( D ) A.20% B.25% C.60% D.80%

6.某高校在2010年的自主招生考试 成绩中随机抽取100名学生的笔试成 绩,按成绩分组,得到的频率分布 表如右图所示. (1)请先求出频率分布表中①、② 位置相应的数据,再在答题纸上完 成下列频率分布直方图; (2)为了能选拔出最优秀的学生, 高校决定在笔试成绩高的第3、4、5 组中用分层抽样抽取6名学生进入第 二轮面试,求第3、4、5组每组各抽 取多少名学生进入第二轮面试?

组号 第1组

分组

频 数

频率 0.050 0.350

?160,165? 5
? ? ?

第2组 165,170? ①

第3组 170,175? 30
第4组 175,180? 20 第5组 [180,185] 10 合计 100


0.200 0.100 1.000

小结:
画频率分布直方图的步骤: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整)
组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 ? 4.1 ? 8.2
组距 0.5

第三步: 将数据分组 ( 给出组的界限) 第四步: 列频率分布表. (包括分组、频数、频率、频 率/组距) 第五步: 画频率分布直方图(在频率分布表的基础上 绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)

注意
第几组频数 (1)第几组频率 ? 样本容量
(2)纵坐标为:

频率 组距

频率分布直方图如下:
频率

组距

连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图

0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5

0.5

1 1.5 2 2.5 3

3.5 4

利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢? (2)样本容量越大,这种估计越精确。
(3)当样本容量无限增大,组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑 曲线——总体密度曲线.

总体密度曲线
频率 组距

月均用 水量/t

a

b

(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。

总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布折线图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。

茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:
(1)甲运动员得分:

13,51,23,8,26,38,16,33,14,28,39
(2)乙运动员得分:

49,24,12,31,50,31,44,36,15,37,25,36,39

茎叶图
甲 茎是指中间的一 列数,表示得分的十 8 位数

叶就是从茎的旁边 乙 生长出来的数,表示得 分的个位数.

0 1 2 3 4 2 5

4 6 3

3 6 8
3 8 9

5 4
1 6 1 6 7 9 4 9 0

1

5

从运动员的成绩的分布来看,乙运动员的成绩更好; 从叶在茎上的分布情况来看,乙运动员的得分更集中 ,说明乙运动员的发挥更稳定.

2.绘制茎叶图的步骤 (1)将数据分为“茎”、“叶”两部分; (2)将最大“茎”与最小“茎”之间的数字按 大小顺序排成一列,茎相同者共用一个茎, 再画上竖线作为分界线; (3)将各个数据的“叶”在分界线的一侧对 应茎处同行列出.


相关文档

高二数学(2.2.1用样本的频率分布估计整体分布(2))
高二数学(2.2.1用样本的频率分布估计整体分布(1))
2.2.1用样本的频率分布估计总体分布(上课)
高二数学用样本的频率分布估计总体分布4
高二数学用样本的频率分布估计总体分布2
高二数学用样本的频率分布估计总体分布1
高二数学用样本的频率分布估计总体分布检测试题
高二数学用样本的频率分布估计总体分布3
高二数学用样本的频率分布估计总体分布
高二数学必修3 用样本的频率分布估计总体分布(2课时)1
电脑版