第二讲 正态分布的概念与计算
重点:正态分布的概念
难点:正态分布的计算
正态分布是质量管理中最为重要也最常使用的分布,它能描述很多质量特性X的统计规律性。
一 正态分布的概念
1定义
如果随机变量X的概率密度函数有如下形式:
则称X服从参数为μ,σ2的正态分布。
记作X~N(μ,σ2)。
当 时,正态分布称为标准正态分布,记为 ,它的密度函数用 表示,分布函数用 表示。
2 正态分布的密度函数图像
我们把正态分布的密度函数图像叫做正态曲线。
由于密度函数总是大于0的,所以密度函数的函数图像位于x轴的上方。而且 x
f(x)
m
m+s
m-s
O
X~N(m ,s 2)
由正态分布的表达式,可以发现,它的函数图像关于 对称,它的函数图像是对称的钟形曲线。因为p(x)的最大值为 ,所以正态曲线的最高点的纵坐标为 ;
(注:根据连续型随机变量密度函数的定义,钟形曲线下的面积为1。)
3参数的意义
正态分布 中,含有两个参数 与 。其中 为正态分布的均值,它是正态分布的中心,表明质量特性X在u附近取值的机会最大; 是正态分布的方差, 是正态分布的标准差。 愈大,分布愈分散,曲线低而平坦; 愈小,分布愈集中,曲线高而陡。
固定标准差 ,对不同的均值,如 ,对应的正态曲线的形状完全相同,仅位置不同。
固定均值 ,不同的标准差,如 ,对应的正态曲线的位置相同,但形状(高低与胖瘦)不同。
4正态分布的应用
正态分布是概率论中最重要的分布,在应用及理论研究中占有头等重要的地位,它与二项分布是概率论中最重要的两种分布。正态分布的重要性是多方面的,主要有以下几点:
1° 许多分布可用正态分布来近似。正态分布正是法国数学家德莫佛为了近似二项分布,于1733年首先引进的,1812年拉普拉斯改进了德莫佛的结果。后来,其他一些人推广了这一结果,现已包含在概率论著名的中心极限定理中。根据这个定理,许多独立、任意分布的随机变量之和具有近似正态分布。因此,在实际中遇到的许多随机现象都服从或近似地服从正态分布。
2° 由正态分布可以导出其它许多重要分布。例如,在数理统计的理论和应用中占极重要地位的c2-分布、t-分布和F-分布,都是正态随机变量函数的分布。
3° 正态分布具有各种良好的性质。在概率论与数理统计的研究和应用中,每当涉及正态分布时,一般都可以得到完满而简单的结果。
二 标准正态分布
1概率密度函数
当μ=0,σ=1时,称X服从标准正态分布,记作X~N(0,1)。
服从标准正态分布的随机变量记为U,它的概率密度函数记为 。
若X~N(μ,σ2),则 ~N(0,1)
实际中很少有一个质量特性(随机变量)的均值恰好为0,方差与标准差恰好为1。一些质量特性的不合格品率均要通过标准正态分布才能算得,这一点将在后面叙述。
2标准正态分布表
x
x
-x
F(-x)
1-F(x)
j(x)
X~N(0,1)
标准正态分布函数表,它可用来计算形如“ ”的随机事件发生的概率 ,记为 。从图形上看,当 时,这个概率相当于曲线下方,X轴上方,以及直线 左边的图形的面积。由于标准正态分布的密度函数图像关于y轴对称,所以F(-x)=1-F(x)。
根据 的值可在标准正态分布函数表(教材附表-1)上查得 ,譬如事件“U≤l.52”的概率可从附表1中查得:
它表示随机变量U取值不超过1.52的概率,在数量上它恰好为1.52左侧的一块阴影面积(见图5.1—15)。
注:由于直线是没有面积的,即直线的面积为零,故:
综上所述,可得如下计算公式:
3重要公式
类似的计算公式还有一些,现罗列如下:
① ② ③ ④ ⑤ 同学们自己可以根据标准正态分布密度函数的图像及其几何意义理解上述公式。
三 正态分布N(0,1)的分位数
这里结合标准正态分布N(0,1)来叙述分位数概念。对概率等式
P(u≤1.282)=0.9
1解释
解释1 :0.9是随机变量u不超过1.282的概率。
解释2:1.282是标准正态分布N(0,1)的0.9的分位数,记为 。
解释2表示:0.9分位数把标准正态分布密度函数 下的面积分为左右两块,左侧一块面积恰好为0.9,右侧一块面积恰好为0.1。
2分位数的意义
一般说来,对介于0与1之间的任意实数α,标准正态分布N(0,1)的α分位数是这样一个数,它的左侧面积恰好为α,它的右侧面积恰好为1-α。
用概率的语言,U(或它的分布)的a分位数 是满足下面等式的实数:
四 正态分布的有关计算
1正态分布计算的理论根据
性质⒈ 设 ,则
(标准化公式)
解释:此性质表明,任一个正态变量X(服从正态分布的随机变量的简称)经过标准化 后,都归一到标准正态变量
。
如:
若 ,通过标准化变换 ;
若 ,通过标准化变换 ;
性质⒉ 设 ,则对任意实数a,b有:
① ② ③ 若X~N(μ,σ2),则
其中 为标准正态(累积)分布函数,其函数值可从附表1-1中查得。
2例题示解
例1设 和 ,概率 和P(1.7
解析:
首先对每个正态变量经过各自的标准化变换得到标准正态变量。
根据性质2中③,让区间端点随着标准化变换而变化,最后可得:
其中 ,
例2 已知X~N(10,0.022),F(2.5)=0.9938。求X落在(9.95,10.05)内的概率。
解析:
例3 已知X~N(1,2 2),F(1)=0.9987,F(-1)=0.1587,则P{-1
解析:
=F(1)-F(-1)=1-2F(-1)=0.6826
或 。
注释:
从这个例子可以看到标准化变换在正态分布计算中的作用,各种正态分布计算都可通过一张标准正态分布函数表来实现,关键在于标准化变换。
五 正态分布与二项分布
二项分布:用X表示事件A在n重试验中出现的次数,则有
其中p是A在每次试验中出现的概率。公式(1)称为二项公式,因为它是二项式[px+(1-p)]n展开式中xk的系数。
事实上,根据独立性,事件A在某指定的k次试验中出现而在其余n-k次试验中不出现的概率为:pk(1-p)n-k ,这种情况共有 种,所以
已知n、p,求P{X=k},P{X≤k},P{X≥k}。
例4 已知某种疾病患者自然痊愈率为0.25,为了鉴定一种新药是否有效,医生把它给10个病人服用,且事先规定:若这10个人中至少有4人治好此病,则认为这种药有效,提高了痊愈率;反之,则认为此药无效。试求
(1) 虽然新药有效,并把痊愈率提高到0.35,但经过试验却被否定的概率;
(2) 新药完全无效,但通过试验被认为有效的概率。
解析:
P{否定新药}= ;
P{判断新药有效}= .
正态分布在线作业
1.设 ,则 ( )。
A. B. 1- C. D. 1- 答案:D
解析:
2. 设标准正态分布的P分位数为 ,则有( )。
A. B. C. D. 答案:C
解析: 与 互为相反数,即 =- ,如 =- ,如 =2,则 =-2,所以 3.设 ,则 ( )
A. B. 1- C. D. 2[1- ]
答案:C
解析: 4. 设随机变量 服从标准正态分布,其分布函数为 ,a为正数,则下列叙述中正
确的有( )。
A. B.
C. D. 答案:B、C
解析:因为 ,所以
5. 设甲厂与乙厂生产的电阻器的阻值分别服从 和 ,则下面( )叙述正确地描述了甲、乙两厂生产的电阻器的阻值情况。
A. 甲厂生产的电阻器的平均阻值低于乙厂生产的电阻器的平均阻值
B. 甲厂生产的电阻器的阻值不如乙厂生产的电阻器的阻值稳定
C. 甲厂生产的电阻器的平均阻值高于乙厂生产的电阻器的平均阻值
D. 甲厂生产的电阻器的阻值比乙厂生产的电阻器的阻值稳定
答案:A、D
解析:由于100 200,所以A对,又由于2 20,所以D对。
6. 设 是标准正态分布的 分位数,则有( )。
A. B. C. D. 答案:C、D
解析:标准正态分布的 分位数 是 的增函数,且在 时 ,在 时 ,在 时 ,由此可见C与D是对的。