数据分析与建模实验指导书 下载本文

ylabel('y(销售额)')

% 调用命令regress建立三元线性回归模型 x=[ones(m,1), A(:,1), A(:,2), A(:,3)]; y=A(:,4)

[b,bint,r,rint,stats]=regress(y,x);

b,bint,stats, % 输出结果 %残差与置信区间图 %rcoplot(r,rint)

三、实习题

1.以家庭为单位,某种商品年需求量与该商品价格之间的一组调查数据见下表3.5所示。

5 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5 价格x(元) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2 需求量(kg) ????x。 ???(1)求经验回归方程y01(2)检验线性关系的显著性(?=0.05,采用F检验)。

2.某省1978-1989消费费基金、国民收入使用额为67(十亿元),平均人口为58(百万人),当显著性水平?=0.05时,试估计1990年消费基金的预测区间。

年份 消费费基金y 国民收入使用额x1 平均人口数x2 1978 9.0 12.1 48.20 1979 9.5 12.9 48.90 1980 10.0 16.8 49.54 1981 10.6 14.8 50.25 1982 12.4 16.4 51.02 1983 16.2 20.9 51.84 1984 17.7 24.2 52.76 1985 20.1 28.1 56.39 1986 21.8 30.1 54.55 1987 25.3 35.8 55.35 1988 31.3 48.5 56.16 1989 36.0 54.8 56.98

实习四 判别分析

一、实验目的

掌握MATLAB判别分析的方法与计算步骤。 二、实例

1.蠓是一种昆虫,分为很多类型,其中有一种名为Af,是能传播花粉的益虫;另一种名为Apf,是会传播疾病的害虫,这两种类型的蠓在形态上十分相似,很难区别。现测得6只Apf和9只Af蠓虫的触角长度和翅膀长度数据Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00), (1.30,1.96) ;Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08).

若两类蠓虫协方差矩阵相等,试判别以下的三个蠓虫属于哪一类?

(1.24,1.8),(1.28,1.84),(1.4,2.04)

%方法一

clear

apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96]; %总体apf

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; %总体af

x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始待判数据 n1=size(apf,1); %总体apf的样本容量 n2=size(af,1); %总体af的样本容量 m1=mean(apf); %总体apf 的均值向量 m2=mean(af); %总体af 的均值向量 s1=cov(apf); %总体apf 的协方差 s2=cov(af); %总体af 的协方差

s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2); %计算样本均值与协方差矩阵 for i=1:3

W(i)=(x(i,:)-1/2*(m1+m2))*inv(s)*(m1-m2)'; % 计算判别函数值 end

输出结果为: W =

2.1640 1.3568 1.9802 %方法二 clear

apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96]; %总体apf

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; %总体af

training=[apf;af]; %合并两个总体形成训练集 n1=size(apf,1); %总体apf中样本的行数 n2=size(af,1); %总体af中样本的行数

group=[ones(1,n1), 2*ones(1,n2)]; %apf中样本与af中样本类属 x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始待判数据即sample class = classify(x, training,group) %判别分析

输出结果为: class= 1 1 1

2.假定两类总体的协方差矩阵不相等,重新判别上述三个蠓虫的类别。 clear

apf=[1.14,1.78; 1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96];

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; x=[1.24,1.8;1.28,1.84;1.4,2.04]; % 输入原始数据 W=mahal(x,apf)-mahal(x,af) % 计算判别函数值 输出结果为: W =

1.7611 3.8812 3.6468

3.已知矩阵A给出的身体指标化验数据,对三个待判数(190,67,30,17),(315,100,35,19),(240,60,37,18)进行判别归类. clear

A=[260 75 40 18 310 122 30 21 320 64 39 17 200 72 34 17 310 60 35 18 260 59 37 11 240 87 45 18 190 40 27 15 360 88 28 26 170 65 39 17 225 65 34 16 295 100 36 12 270 110 39 24 170 65 37 16 270 65 32 21 205 130 34 23 210 82 31 17 380 114 36 21 190 69 27 15 280 67 37 18 240 55 42 10 200 46 45 15 210 38 36 17 260 55 34 20 250 117 21 20 280 65 30 23 260 110 29 20 200 107 28 20 200 76 40 17 295 73 33 21 225 130 36 11 200 76 39 20 240 114 38 18 210 125 26 17 280 94 26 11 310 103 32 18 170 64 31 14 190 60 33 17 330 112 21 11 270 76 33 13 295 55 30 16 345 127 24 20 190 60 34 16 270 125 24 21 250 62 22 16 280 81 20 18 280 120 32 18 260 59 21 19 310 119 25 15 240 62 32 20 225 100 34 30 270 57 31 8 280 69 29 20 345 120 36 18 250 67 31 14 370 70 30 20 360 107 25 23 260 135 39 29 280 40 37 17 250 117 36 16 ];

G1=A(:,1:4);G2=A(:,5:8);G3=A(:,9:12); %三类总体数据 x=[190 67 30 17;315 100 35 19;240 60 37 18]; %待判定的数据 m(1,:)=mean(G1);m(2,:)=mean(G2);m(3,:)=mean(G3);

s1=cov(G1);s2=cov(G2);s3=cov(G3); % 计算样本均值与协方差矩阵

s=19*(s1+s2+s3)/57; % 计算混合样本方差 for i=1:3 for j=1:3 for k=1:3

w(j,k)=(x(i,:)-1/2*(m(j,:)+m(k,:)))*inv(s)*(m(j,:)-m(k,:))'; %计算判别函数 if w(j,k)<0 q=0;break; else q=1; end end if q==1 y(i)=j; end end end y

输出结果为: y =

1 3 2 三、实习题

1.已知X?(x1,x2)服从二维正态分布N(?,?),其中????0??,????0.9???TTT?0??10.9??,试?1?分别求点A?(1,1)和B?(1,?1)到总体均值的马氏距离和欧氏距离,并论述马氏距离的合理性。

2.设G1、G2为两个二维总体,从中分别抽取容量为3的训练样本,见表4.1。 x1 x2 x1 x2 3 2 6 9 G1 G2 2 4 5 7 4 7 4 8 求:(1)计算两总体的样本均值向量x、x?1??2?和样本协方差矩阵S1、S2;

(2)假定两总体的协方差矩阵相等,记为?,用S1、S2联合估计?; (3)建立距离判别法的判别准则; (4)设有一样品x0??2,7?,判别其归属。