数理统计及其在数学建模中的实践(使用MATLAB)
上QQ阅读APP看书,第一时间看更新

2.2 随机变量及其分布

在许多试验中,观察的对象常常是一个随机取值的量.例如掷一颗骰子出现的点数,它本身就是一个数值,因此PA)这个函数可以看成是普通函数(定义域和值域都是数字,数字映射到数字).但是观察硬币出现正面还是反面,就不能简单理解为普通函数.但我们可以通过下面的方法使它与数值联系起来.当出现正面时,规定其对应数为“1”;而出现反面时,规定其对应数为“0”.于是

X为随机变量.又由于X是随着试验结果(基本事件ω)不同而变化的,所以X实际上是基本事件ω的函数,即X=Xω.同时事件A包含了一定量的ω(例如古典概型中A包含了ω1ω2,…,ωmm个基本事件),于是PA)可以由pXω))来计算,这是一个普通函数.

设试验的样本空间为Ω,如果对Ω中每个事件ω都有唯一的实数值X=Xω)与之对应,则称X=Xω)为随机变量,简记为X.

有了随机变量,就可以通过它来描述随机试验中的各种事件,从而全面反映试验的情况.这就使得我们可以对随机现象进行研究,从前一节对事件与事件的概率的研究,扩大到对随机变量的研究,这样就可以借助数学分析的方法来研究随机现象了.

如果一个随机变量所有可能取到的值只有有限个(如掷骰子出现的点数)或可列无穷多个(如电话交换台接到的呼唤次数),则称为离散型随机变量.而像子弹着陆点到目标的距离这样的随机变量,由于它的取值范围连续地充满了一个区间,称为连续型随机变量.

2.2.1 随机变量的分布函数

1.离散型随机变量的分布律

设离散型随机变量X的可能取值为Xkk=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为

PX=xk)=pkk=1,2,…

则称上式为离散型随机变量X的概率分布或分布律.显然分布律应满足下列条件:

1)pk≥0,k=1,2,…;

2) .

2.分布函数

对于非离散型随机变量,通常有PX=x)=0,但它不可能用分布律表达.例如荧光灯的寿命XPX=x0)=0,所以我们考虑用X落在某个区间(ab]内的概率表示.

X为随机变量,x是任意实数,则函数

Fx)=PXx

称为随机变量X的分布函数.

Pa<Xb)=Fb)-Fa)可以得到X落入区间(ab]的概率.也就是说,分布函数完整地描述了随机变量X随机取值的统计规律性.分布函数Fx)是一个普通的函数,它表示随机变量落入区间(–∞,x]内的概率.

Fx)的图形是阶梯图形,x1x2,…是第一类间断点,随机变量Xxk处的概率就是Fx)在xk处的跃度.

分布函数具有如下性质:

1)0≤Fx)≤1, -∞<x<+∞;

2)Fx)是单调不减的函数,即x1<x2时,有Fx1)≤Fx2);

3)

4)Fx+0)=Fx),即Fx)是右连续的;

5)PX=x)=Fx)-Fx-0).

3.连续型随机变量的密度函数

Fx)是随机变量X的分布函数,若存在非负函数fx),对任意实数x,有

则称X为连续型随机变量.fx)称为X的概率密度函数或密度函数,简称概率密度.fx)的图形是一条曲线,称为密度(分布)曲线.

由上式可知,连续型随机变量的分布函数Fx)是连续函数,所以

Px1Xx2)=Px1<Xx2)=Px1X<x2)=Px1<X<x2)=Fx2)-Fx1.

密度函数具有下面4个性质:

1)fx)≥0;

2)

的几何意义为在横轴上面密度曲线下面的全部面积等于1.

如果一个函数fx)满足1)、2),则它一定是某个随机变量的密度函数;

3) .

4)若fx)在x处连续,则有F′x)=fx.

Px<Xx+dx)≈fx)dx

它在连续型随机变量理论中所起的作用与pX=xk)=pk在离散型随机变量理论中所起的作用类似.

Xω)→Xω)≤xFx)=PXx

对于连续型随机变量X,虽然有PX=x)=0,但事件(X=x)并非是不可能事件Φ.

h=0则右端为零,而概率PX=x)≥0,故得PX=x)=0.

不可能事件Φ的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件Ω的概率为1,而概率为1的事件也不一定是必然事件.

2.2.2 常见分布

1.0—1分布

PX=1)=pPX=0)=q.

2.二项分布

n重伯努利试验中,设事件A发生的概率为p.事件A发生的次数是随机变量,设为X,则X可能的取值为0,1,2,…,n.

PX=k)=Pnk)=Cknpkqn-k,其中,q=1-p,0<p<1,k=0,1,2,…,n.则称随机变量X服从参数为np的二项分布,记为XBnp.容易验证它满足离散型分布率的条件.

特别是,当n=1时,PX=k)=pkq1-kk=0,1,这就是(0-1)分布,所以(0-1)分布是二项分布的特例.

3.泊松分布

设随机变量X的分布律为

则称随机变量X服从参数为λ的泊松分布,记为X~π(λ)或者Pλ.

泊松分布为二项分布的极限分布(np=λn→∞).如飞机被击中的子弹数、来到公共汽车站的乘客数、机床发生故障的次数、自动控制系统中元件损坏的个数、某商店中来到的顾客人数等,均近似地服从泊松分布.

4.超几何分布

如果随机变量X所有可能的取值为0,1,2,…,LL=min{MN}),X的概率分布为

其中整数MN>0,且nN-M,则称X服从参数为NMn的超几何分布,记作

XHNMn.

5.几何分布

PX=k)=qk-1pk=1,2,3,…,其中p≥0,q=1-p.

则称随机变量X服从参数为p的几何分布.

6.均匀分布

若连续型随机变量X的概率密度为

则称X在区间(ab)上服从参数为ab的均匀分布,记作XUab.

分布函数为

ax1x2b时,X落在区间(x1x2)内的概率为

7.指数分布

如果随机变量X的概率密度为

其中λ为常数,则称X为服从参数为λ的指数分布,记作X~e(λ.

X的分布函数为

记住几个积分:

8.正态分布

如果随机变量X的概率密度为

其中μσ均为常数,且σ>0,则称X服从参数为μσ2的正态分布,记作XNμσ2.

fx)具有如下性质:

1)fx)的图形是关于x=μ对称的;

2)当x=μ时, 为最大值;

3)fx)以x轴为渐近线.

特别当σ固定、改变μ时,fx)的图形形状不变,只是整体沿x轴平行移动,所以μ又称为位置参数.μ固定、改变σ时,fx)的图形形状要发生变化,随σ变大,fx)图形的形状变得平坦,所以又称σ为形状参数.

μ=0,σ=1时,称X服从标准正态分布,记作XN(0,1),其密度函数记为

分布函数为Φx)是不可求积函数,其函数值已编制成表可供查用x)具有如下性质:

1)Φx)是偶函数,Φx)=Φ(-x);

2)当x=0时, 为最大值;

3)Φ(-x)=1-Φx)且

如果XNμσ2),则

所以我们可以通过变换将Fx)的计算转化为Φx)的计算,而Φx)的值则可以通过查表得到.

为分位数的定义.