数据的统计描述和分析实验指导书(matlab版)

weibcdf weibcdf(x, a, b) binocdf geocdf binocdf(x,n,p) geocdf(x,p) 参数为a, b的韦伯分布累积分布函数值 F(x)=P{X≤x} 参数为n, p的二项分布的累积分布函数值 F(x)=P{X≤x} 参数为 p的几何分布的累积分布函数值 F(x)=P{X≤x} 参数为 M,K,N的超几何分布的累积分布函数值 参数为Lambda的泊松分布的累积分布函数值 F(x)=P{X≤x} hygecdf hygecdf(x,M,K,N) poisscdf poisscdf(x,Lambda) 说明 累积概率函数就是分布函数F(x)=P{X≤x}在x处的值。 四、随机变量的逆累积分布函数

MATLAB中的逆累积分布函数是已知F(x)?P{X?x},求x。

逆累积分布函数值的计算有两种方法 1、通用函数计算逆累积分布函数值 命令 icdf 计算逆累积分布函数 格式 icd(f?name?,P,a1,a2,a3)

说明 返回分布为name,参数为a1,a2,a3,累积概率值为P的临界值,这里name与前面表1相同。

如果P?cdf(?name?,x,a1,a2,a3),则x?icdf(?name?,P,a1,a2,a3) 例24 在标准正态分布表中,若已知?(x)=0.975,求x 解:>> x=icdf('norm',0.975,0,1) x =1.9600

例25 在?2分布表中,若自由度为10,?=0.975,求临界值Lambda。

解:因为表中给出的值满足P{?2??}??,而逆累积分布函数icdf求满足P{?2??}??的临界值?。所以,这里的?取为0.025,即

>> Lambda=icdf('chi2',0.025,10) Lambda =3.2470

例26 在假设检验中,求临界值问题:

已知:??0.05,查自由度为10的双边界检验t分布临界值 >>lambda=icdf('t',0.025,10) lambda = -2.2281

2、专用函数-inv计算逆累积分布函数 命令 正态分布逆累积分布函数 函数 norminv

格式 X=norminv(p,mu,sigma) %p为累积概率值,mu为均值,sigma为标准差,X为

临界值,满足:p=P{X≤x}。

例27 设X~N(3,22),确定c使得P{X?c}?P{X?c}。 解:由P{X?c}?P{X?c}得,P{X?c}?P{X?c}=0.5,所以 >>X=norminv(0.5, 3, 2) X=3

关于常用临界值函数可查下表5。

表5 常用临界值函数表 函数名 unifinv unidinv 调用形式 x=unifinv (p, a, b) x=unidinv (p,n) 注 释 均匀分布(连续)逆累积分布函数(P=P{X≤x},求x) 均匀分布(离散)逆累积分布函数,x为临界值

expinv norminv chi2inv tinv finv gaminv betainv logninv nbininv ncfinv nctinv ncx2inv raylinv weibinv binoinv geoinv hygeinv poissinv x=expinv (p, Lambda) x=Norminv(x,mu,sigma) x=chi2inv (x, n) x=tinv (x, n) x=finv (x, n1, n2) x=gaminv (x, a, b) x=betainv (x, a, b) x=logninv (x, mu, sigma) x=nbininv (x, R, P) x=ncfinv (x, n1, n2, delta) x=nctinv (x, n, delta) x=ncx2inv (x, n, delta) x=raylinv (x, b) x=weibinv (x, a, b) x=binoinv (x,n,p) x=geoinv (x,p) x=hygeinv (x,M,K,N) x=poissinv (x,Lambda) 指数分布逆累积分布函数 正态分布逆累积分布函数 卡方分布逆累积分布函数 t分布累积分布函数 F分布逆累积分布函数 ?分布逆累积分布函数 ?分布逆累积分布函数 对数正态分布逆累积分布函数 负二项式分布逆累积分布函数 非中心F分布逆累积分布函数 非中心t分布逆累积分布函数 非中心卡方分布逆累积分布函数 瑞利分布逆累积分布函数 韦伯分布逆累积分布函数 二项分布的逆累积分布函数 几何分布的逆累积分布函数 超几何分布的逆累积分布函数 泊松分布的逆累积分布函数 例28 公共汽车门的高度是按成年男子与车门顶碰头的机会不超过1%设计的。设男子身高X(单位:cm)服从正态分布N(175,36),求车门的最低高度。

解:设h为车门高度,X为身高

求满足条件P{X?h}?0.01的h,即P{X?h}?0.99,所以

>>h=norminv(0.99, 175, 6) h =188.9581

例29 卡方分布的逆累积分布函数的应用 在MATLAB的编辑器下建立M文件如下:

n=5; a=0.9; %n为自由度,a为置信水平或累积概率 xa=chi2inv(a,n); %xa为临界值

x=0:0.1:15; yd_c=chi2pdf(x,n); %计算?2(5)的概率密度函数值,供绘图用 plot(x,yd_c,'b'), hold on %绘密度函数图形

xxf=0:0.1:x_a; yyf=chi2pdf(xxf,n); %计算[0,x_a]上的密度函数值,供填色用 fill([xxf,x_a], [yyf,0], 'g') %填色,其中:点(x_a, 0)使得填色

区域封闭

text(x_a*1.01,0.01, num2str(x_a)) %标注临界值点

text(10,0.10, ['\\fontsize{16}X~{\\chi}^2(4)']) %图中标注 text(1.5,0.05, '\\fontsize{22}alpha=0.9' ) %图中标注

结果显示如图9。

五、随机变量的数字特征 1、平均值、中值

命令 利用mean求算术平均值

格式 mean(X) %X为向量,返回X中各元素的平均值

mean(A) %A为矩阵,返回A中各列元素的平均值构成的向量 mean(A,dim) %在给出的维数内的平均值

图9

说明 X为向量时,算术平均值的数学含义是x?1?xi,即样本均值。

ni?1例30

>> A=[1 3 4 5;2 3 4 6;1 3 1 5] A =

1 3 4 5 2 3 4 6 1 3 1 5 >> mean(A)

ans =1.3333 3.0000 3.0000 5.3333 >> mean(A,1)

ans =1.3333 3.0000 3.0000 5.3333 命令 忽略NaN计算算术平均值

格式 nanmean(X) %X为向量,返回X中除NaN外元素的算术平均值。

nanmean(A) %A为矩阵,返回A中各列除NaN外元素的算术平均值向量。 例31

>> A=[1 2 3;nan 5 2;3 7 nan] A =

1 2 3 NaN 5 2 3 7 NaN >> nanmean(A)

ans = 2.0000 4.6667 2.5000 命令 利用median计算中值(中位数)

格式 median(X) %X为向量,返回X中各元素的中位数。

median(A) %A为矩阵,返回A中各列元素的中位数构成的向量。 median(A,dim) %求给出的维数内的中位数 例32

>> A=[1 3 4 5;2 3 4 6;1 3 1 5] A =

1 3 4 5 2 3 4 6 1 3 1 5 >> median(A)

ans = 1 3 4 5 命令 忽略NaN计算中位数

格式 nanmedian(X) %X为向量,返回X中除NaN外元素的中位数。

nanmedian(A) %A为矩阵,返回A中各列除NaN外元素的中位数向量。 例33

>> A=[1 2 3;nan 5 2;3 7 nan] A =

1 2 3 NaN 5 2 3 7 NaN >> nanmedian(A)

ans =2.0000 5.0000 2.5000

n命令 利用geomean计算几何平均数

格式 M=geomean(X) %X为向量,返回X中各元素的几何平均数。

M=geomean(A) %A为矩阵,返回A中各列元素的几何平均数构成的向量。 说明 几何平均数的数学含义是M?(?xi)n,其中:样本数据非负,主要用于对数正态

i?1n1分布。

例34

>> B=[1 3 4 5]

B =1 3 4 5 >> M=geomean(B) M =2.7832

>> A=[1 3 4 5;2 3 4 6;1 3 1 5] A =

1 3 4 5 2 3 4 6 1 3 1 5 >> M=geomean(A)

M =1.2599 3.0000 2.5198 5.3133 命令 利用harmmean求调和平均值

格式 M=harmmean(X) %X为向量,返回X中各元素的调和平均值。

M=harmmean(A) %A为矩阵,返回A中各列元素的调和平均值构成的向量。

说明 调和平均值的数学含义是M?1?xii?1nn,其中:样本数据非0,主要用于严重偏斜分

布。

例35

>> B=[1 3 4 5]

B =1 3 4 5 >> M=harmmean(B) M =2.2430

>> A=[1 3 4 5;2 3 4 6;1 3 1 5] A =

1 3 4 5 2 3 4 6 1 3 1 5 >> M=harmmean(A)

M =1.2000 3.0000 2.0000 5.2941 2、数据比较 命令 排序

格式 Y=sort(X) %X为向量,返回X按由小到大排序后的向量。

Y=sort(A) %A为矩阵,返回A的各列按由小到大排序后的矩阵。

[Y,I]=sort(A) % Y为排序的结果,I中元素表示Y中对应元素在A中位置。

sort(A,dim) %在给定的维数dim内排序 说明 若X为复数,则通过|X|排序。 例36

>> A=[1 2 3;4 5 2;3 7 0]

联系客服:779662525#qq.com(#替换为@)