2.2 随机变量及其分布
在许多试验中,观察的对象常常是一个随机取值的量.例如掷一颗骰子出现的点数,它本身就是一个数值,因此P(A)这个函数可以看成是普通函数(定义域和值域都是数字,数字映射到数字).但是观察硬币出现正面还是反面,就不能简单理解为普通函数.但我们可以通过下面的方法使它与数值联系起来.当出现正面时,规定其对应数为“1”;而出现反面时,规定其对应数为“0”.于是
称X为随机变量.又由于X是随着试验结果(基本事件ω)不同而变化的,所以X实际上是基本事件ω的函数,即X=X(ω).同时事件A包含了一定量的ω(例如古典概型中A包含了ω1,ω2,…,ωm共m个基本事件),于是P(A)可以由p(X(ω))来计算,这是一个普通函数.
设试验的样本空间为Ω,如果对Ω中每个事件ω都有唯一的实数值X=X(ω)与之对应,则称X=X(ω)为随机变量,简记为X.
有了随机变量,就可以通过它来描述随机试验中的各种事件,从而全面反映试验的情况.这就使得我们可以对随机现象进行研究,从前一节对事件与事件的概率的研究,扩大到对随机变量的研究,这样就可以借助数学分析的方法来研究随机现象了.
如果一个随机变量所有可能取到的值只有有限个(如掷骰子出现的点数)或可列无穷多个(如电话交换台接到的呼唤次数),则称为离散型随机变量.而像子弹着陆点到目标的距离这样的随机变量,由于它的取值范围连续地充满了一个区间,称为连续型随机变量.
2.2.1 随机变量的分布函数
1.离散型随机变量的分布律
设离散型随机变量X的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…
则称上式为离散型随机变量X的概率分布或分布律.显然分布律应满足下列条件:
1)pk≥0,k=1,2,…;
2) .
2.分布函数
对于非离散型随机变量,通常有P(X=x)=0,但它不可能用分布律表达.例如荧光灯的寿命X,P(X=x0)=0,所以我们考虑用X落在某个区间(a,b]内的概率表示.
设X为随机变量,x是任意实数,则函数
F(x)=P(X≤x)
称为随机变量X的分布函数.
P(a<X≤b)=F(b)-F(a)可以得到X落入区间(a,b]的概率.也就是说,分布函数完整地描述了随机变量X随机取值的统计规律性.分布函数F(x)是一个普通的函数,它表示随机变量落入区间(–∞,x]内的概率.
F(x)的图形是阶梯图形,x1,x2,…是第一类间断点,随机变量X在xk处的概率就是F(x)在xk处的跃度.
分布函数具有如下性质:
1)0≤F(x)≤1, -∞<x<+∞;
2)F(x)是单调不减的函数,即x1<x2时,有F(x1)≤F(x2);
3) ;
4)F(x+0)=F(x),即F(x)是右连续的;
5)P(X=x)=F(x)-F(x-0).
3.连续型随机变量的密度函数
设F(x)是随机变量X的分布函数,若存在非负函数f(x),对任意实数x,有
则称X为连续型随机变量.f(x)称为X的概率密度函数或密度函数,简称概率密度.f(x)的图形是一条曲线,称为密度(分布)曲线.
由上式可知,连续型随机变量的分布函数F(x)是连续函数,所以
P(x1≤X≤x2)=P(x1<X≤x2)=P(x1≤X<x2)=P(x1<X<x2)=F(x2)-F(x1).
密度函数具有下面4个性质:
1)f(x)≥0;
2) ;
的几何意义为在横轴上面密度曲线下面的全部面积等于1.
如果一个函数f(x)满足1)、2),则它一定是某个随机变量的密度函数;
3) .
4)若f(x)在x处连续,则有F′(x)=f(x).
P(x<X≤x+dx)≈f(x)dx
它在连续型随机变量理论中所起的作用与p(X=xk)=pk在离散型随机变量理论中所起的作用类似.
X(ω)→X(ω)≤x→F(x)=P(X≤x)
对于连续型随机变量X,虽然有P(X=x)=0,但事件(X=x)并非是不可能事件Φ.
令h=0则右端为零,而概率P(X=x)≥0,故得P(X=x)=0.
不可能事件Φ的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件Ω的概率为1,而概率为1的事件也不一定是必然事件.
2.2.2 常见分布
1.0—1分布
P(X=1)=p,P(X=0)=q.
2.二项分布
在n重伯努利试验中,设事件A发生的概率为p.事件A发生的次数是随机变量,设为X,则X可能的取值为0,1,2,…,n.
P(X=k)=Pn(k)=Cknpkqn-k,其中,q=1-p,0<p<1,k=0,1,2,…,n.则称随机变量X服从参数为n,p的二项分布,记为X~B(n,p).容易验证它满足离散型分布率的条件.
特别是,当n=1时,P(X=k)=pkq1-k,k=0,1,这就是(0-1)分布,所以(0-1)分布是二项分布的特例.
3.泊松分布
设随机变量X的分布律为
则称随机变量X服从参数为λ的泊松分布,记为X~π(λ)或者P(λ).
泊松分布为二项分布的极限分布(np=λ,n→∞).如飞机被击中的子弹数、来到公共汽车站的乘客数、机床发生故障的次数、自动控制系统中元件损坏的个数、某商店中来到的顾客人数等,均近似地服从泊松分布.
4.超几何分布
如果随机变量X所有可能的取值为0,1,2,…,L(L=min{M,N}),X的概率分布为
其中整数M,N>0,且n≤N-M,则称X服从参数为N,M,n的超几何分布,记作
X~H(N,M,n).
5.几何分布
P(X=k)=qk-1p,k=1,2,3,…,其中p≥0,q=1-p.
则称随机变量X服从参数为p的几何分布.
6.均匀分布
若连续型随机变量X的概率密度为
则称X在区间(a,b)上服从参数为a和b的均匀分布,记作X~U(a,b).
分布函数为
当a≤x1≤x2≤b时,X落在区间(x1,x2)内的概率为
7.指数分布
如果随机变量X的概率密度为
其中λ为常数,则称X为服从参数为λ的指数分布,记作X~e(λ).
X的分布函数为
记住几个积分:
8.正态分布
如果随机变量X的概率密度为
其中μ,σ均为常数,且σ>0,则称X服从参数为μ和σ2的正态分布,记作X~N(μ,σ2).
f(x)具有如下性质:
1)f(x)的图形是关于x=μ对称的;
2)当x=μ时, 为最大值;
3)f(x)以x轴为渐近线.
特别当σ固定、改变μ时,f(x)的图形形状不变,只是整体沿x轴平行移动,所以μ又称为位置参数.当μ固定、改变σ时,f(x)的图形形状要发生变化,随σ变大,f(x)图形的形状变得平坦,所以又称σ为形状参数.
当μ=0,σ=1时,称X服从标准正态分布,记作X~N(0,1),其密度函数记为
分布函数为 ,Φ(x)是不可求积函数,其函数值已编制成表可供查用.Φ(x)具有如下性质:
1)Φ(x)是偶函数,Φ(x)=Φ(-x);
2)当x=0时, 为最大值;
3)Φ(-x)=1-Φ(x)且
如果X~N(μ,σ2),则
所以我们可以通过变换将F(x)的计算转化为Φ(x)的计算,而Φ(x)的值则可以通过查表得到.
为分位数的定义.