统计学简答题及答案 下载本文

统计学简答题及参考答案

1.简述描述统计学的概念、研究内容与目的。

概念:它是研究数据收集、整理和描述的统计学分支。

研究内容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究内容与目的。

概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究内容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本?

总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。

可分为有限总体和无限总体:

?有限总体的范围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。

样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n 。

4.什么是普查?它有哪些特点?

普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点:

1) 通常是一次性或周期性的

2) 一般需要规定统一的标准调查时间 3) 数据的规范化程度较高 4) 应用范围比较狭窄。

5.什么是抽样调查?它有哪些特点?

抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。

它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本内容。

答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。

它应包括的基本内容有: 〈1〉明确调查目的;

〈2〉确定调查对象和调查单位; 〈3〉设计调查项目;

〈4〉设计调查表格和问卷; 〈5〉确定调查时间;

〈6〉组织实施调查计划;

〈7〉调查报告的撰写,等等。

7.简述统计分组的概念、原则和具体方法。

答:(1)概念

根据统计研究的目的和客观现象的内在特点,按照某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。

统计分组标志有两种:品质标志或数量标志。 (2)原则

①穷尽原则;②互斥原则。

即“不重复、不遗漏”的原则。 (3)具体分组方法 ①按品质标志分组 ②按数量标志分组

(A)单项式分组与组距式分组;

(B)间断组距式分组和连续组距式分组;

应遵循“上限不在组内”原则:凡是总体中某一个单位的变量值为相邻两组的界限值,则这一个单位就归入作为下限值的那一组内。

(C)等距分组与异距分组。

8.简述组距分组的基本步骤。

(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的 (2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:

组距=(最大值 - 最小值)÷ 组数

(3)统计出各组的频数,并整理成频数分布表。 9.简述算术平均数的概念及其数学性质。

答:算术平均数是指一组数据的总和,除以这组数据的项数所得的结果。它是最常用的数值平均数,分为简单算术平均数和加权算术平均数两种。 其数学性质是:

(1)算术平均数与变量值个数的乘积,等于各个变量值的总和。 (2)各变量值与其算术平均数的离差之总和,等于零。

(3)各变量值与其算术平均数的离差平方之总和,为最小值。 10.简述均值的概念和特征。

均值就是算术平均数,它的基本公式为:

算术平均数=总体标志总量/总体单位数=∑Xi/n 其特征如下:

1) 集中趋势的最常用测度值 2) 一组数据的均衡点所在 3) 体现了数据的必然性特征 4) 易受极端值的影响

5) 用于数值型数据,不能用于分类数据和顺序数据

6) 可根据原始数据或者分组数据来计算,计算公式略有差异。 11.简述众数、中位数、均值的特点与应用场合。 1) 众数

? 不受极端值影响 ? 具有不唯一性

? 数据分布偏斜程度较大时应用 2) 中位数

? 不受极端值影响

? 数据分布偏斜程度较大时应用 3) 均值

? 易受极端值影响 ? 数学性质优良

? 数据对称分布或接近对称分布时应用。

12.简述算术平均数、众数、中位数的概念及数量关系。

答:(1)概念

算术平均数是指一组数据的总和除以这组数据的项数所得的结果,也称为均值, 可用X表示。它是最常用的数值平均数,分为简单的和加权的算术平均数两种。

众数是指一组数据中出现频数最多、频率最高的变量值,可用 MO 表示。它是最常见、最普遍的状况,是对现象集中趋势的度量。

中位数是指将数据由小到大排列后,位置居中的数值,可用 Me 表示。 (2)三者的数量关系是: 在对称分布中,三者相等。即:X=Me=Mo;

在左偏分布中,一般有X

在轻微偏态时,三者的近似数量关系为:(X?Mo)?3?(X?Me)。 13.测定离散程度的变异指标有哪些?简述其主要作用。

答:常用的变异指标有:异众比率、极差、四分位差、平均差、方差和标准差、离散系数等。

它们的主要作用为:

1.说明数据的分散程度,反映变量的稳定性、均衡性;

数据之间差异越大,表明变量的稳定性或均衡性越差。

2.衡量平均数的代表性高低;

离散程度越大,表明平均数的代表性就越低。 3.作为统计推断的重要依据。

①判别统计推断的前提条件是否成立; ②衡量推断效果好坏的重要尺度。

14.简述方差和标准差的概念及其特征。

方差是指各变量值与均值的离差平方的算术平均数,标准差则是方差的正平方根。

两者都是标志变异指标,具有以下的特征: ? 离散(变异)程度的测度值之一 ? 最常用的测度值

? 反映了数据的分布特征

? 反映了各变量值与均值的平均差异

? 用于数值型数据,不能用于分类数据和顺序数据

? 可根据总体数据或者样本数据来计算,计算公式略有差异。

15.什么是离散系数?

是变异指标与其相应的均值之比 通常是用标准差与均值来对比 是对数据相对离散程度的测度

消除了数据水平高低和计量单位不同的影响 用于对不同组别数据离散程度的比较 计算公式为:

s?v?v??s?sx?x16.简述概率抽样方式的概念和特点。

是指根据一个已知的概率来抽取样本单位,也称为随机抽样。 它包括四种基本抽样方式:简单随机抽样、分层抽样、系统抽样和整群抽样等。 其特点是:

? 按一定的概率以随机原则抽取样本;

抽取样本时,使每个单位都有一定的机会被抽中。

? 每个单位被抽中的概率是已知的,或是可以计算出来的; ? 当用样本对总体参数进行估计时,要考虑到每个样本单位被抽中的概率。

17.什么是抽样分布?

(1)是指样本统计量的概率分布,是一种理论分布

? 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相

对频数分布

(2)随机变量是样本统计量

? 例如样本均值,样本比例,样本方差等 (3)结果来自容量相同的所有可能样本

(4)提供了样本统计量长远而稳定的信息,是进行抽样推断的理论基础,也是抽样推断科学性的重要依据。 18.什么是中心极限定理?

设从均值为μ,方差为σ的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ/n的正态分布,即

x~N(μ,σ/n) 。

2

2

2

19.什么是总体参数?

1) 它是描述总体数量特征的概括性数字度量 2) 是研究者想要了解的总体的某种数字特征值

3) 人们所关心的参数主要有总体均值(?)、总体标准差(?)、总体比率(ρ)等 4) 它是抽样统计推断的对象

5) 总体参数通常用希腊字母表示。 20.什么是样本统计量?

1) 它是用来描述样本数量特征的概括性数字度量,它是根据样本数据计算出

来的一些量,是样本的函数。

2) 人们所关心的样本统计量有样本均值(?x)、样本标准差(s)、样本比例(p)

等。

3) 样本统计量通常用小写英文字母表示。 21.怎样正确理解抽样误差?

(1)抽样误差是由于抽样的随机性所带来的误差

(2)所有可能样本的统计结果与总体真实值之间的平均性差异 (3)通常是可以计算和控制的。

影响抽样误差大小的因素主要有: ? 样本容量的大小 ? 总体的变异程度 ? 抽样方式 ? 抽样方法。

22.简述抽样推断的点估计方法。

点估计就是用样本统计量直接作为总体参数的估计值的抽样推断方法。 例如:用样本均值直接作为总体均值的估计值

又如:用两个样本均值之差直接作为总体均值之差的估计值 它没有给出估计值接近总体参数程度的信息。

点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。 23.简述抽样推断的区间估计方法。

区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间是由样本统计量加减抽样误差而得到的。

根据样本统计量的抽样分布,能够对样本统计量与总体参数的接近程度给出一个概率度量。比如,某班级的平均分数估计在75~85之间,置信水平为95% 。 24.影响置信区间宽度的因素有哪些? 1) 总体数据的离散程度,用σ2来测度 2) 样本容量(n)的大小

3) 置信水平 (1 -α),它影响 z 的大小 4) 抽样方式 5) 抽样方法

25.必要的样本容量(n)与哪些影响因素有关? 1) 总体标准差(σ)或者方差(? 2) 2) 允许误差(E)

3) 可靠性系数(z或者t) 4) 抽样方式 5) 抽样方法

26.什么是假设检验?

假设检验是指先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计推断过程。

有参数检验和非参数检验两类方法。

它在逻辑上运用反证法,统计上依据小概率原理。 27.简述假设检验的概念及基本步骤。

答:所谓假设检验,就是事先对总体的参数或总体分布形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著的系统性差异。所以,假设检验又被称为显著性检验。

一个完整的假设检验过程,包括以下基本步骤:

(1)针对具体问题,提出假设:原假设H0、备择假设H1;

(2)构造适当的检验统计量Z(或者t),并根据样本数据,计算统计量的具体数值;

(3)规定显著性水平α,建立检验规则; (4)做出判断。

①临界值规则:如果Z(或者t)值落在拒绝域中,就拒绝H0。否则,就

接受H0 。

②P-值规则:如果P<α,就拒绝H0;否则P>α,就接受H0 。

28.解释假设检验中的两类错误

第Ⅰ类错误(弃真错误)

指原假设为真时,拒绝原假设。其发生的概率记为α,α称为显著性水

平。

第Ⅱ类错误(取伪错误)

指原假设为假时,未拒绝(即接受)原假设。其发生的概率记为β。

29.简述假设检验中的小概率原理

1) 小概率是指在一次试验中,一个几乎不可能发生的事件发生的概率。 2) 在一次试验中小概率事件一旦发生,我们就有足够的理由拒绝原假设。 3) 小概率由研究者事先确定。 30.解释假设检验的决策规则

1. 给定显著性水平α,查表得出相应的临界值za或za/2, ta或ta/2 2. 将检验统计量的数值与α水平的临界值进行比较 3. 作出决策

? 双侧检验:|统计量| > 临界值,拒绝H0 ? 左侧检验:统计量 < - 临界值,拒绝H0 ? 右侧检验:统计量 > 临界值,拒绝H0 31.简述假设检验的基本步骤

1. 陈述原假设H0和备择假设H1

2. 从所研究的总体中抽出一个随机样本

3. 确定一个适当的检验统计量,并利用样本数据计算出其具体数值 4. 确定一个适当的显著性水平α,并查表得出其临界值,指定拒绝域 5. 将统计量的数值与临界值进行比较,作出决策

? 统计量的数值落在拒绝域中,就拒绝H0。否则,就接受H0

? 也可以直接利用P值作出决策。如果P<α,就拒绝H0;否则P>α,就接

受H0

32.简述相关分析与回归分析之间的联系

1) 有共同的研究对象:都是对变量间相关关系的分析。

2) 只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才

有实际意义。

3) 相关分析只表明变量间相关关系的性质和程度,要确定相关的具体数学形

式依赖于回归分析。

4) 相关分析中相关系数的确定,建立在回归分析的基础上。 33.直线相关系数有哪些特点?

? 相关系数的取值在-1与1之间。

? 当r=0时,表明X与Y没有线性相关关系,但可能存在着其它的非线性相关关系。

? 当 0<|r|<1 时,表明X与Y存在一定程度的线性相关关系: 若r>0, 表明X与Y 为正相关; 若r<0, 表明X与Y 为负相关。 ? 当|r|=1 时,表明X与Y完全线性相关: 若r=1,称X与Y完全正相关; 若r=-1,称X与Y完全负相关。 34.为什么只能对未知的总体参数作估计?

总体参数是未知的、不可直接观测的、不能精确计算的,能够得到的只是变量的样本观测值。

结论: 只能通过变量的样本观测值,选择适当的统计方法去近似地估计回归系数等总体参数。

前提: u是随机变量其分布性质不确定,必须作某些假定,其估计才有良好性质,其检验才可进行。

原则: 使参数估计值“尽可能地接近”总体参数的真实值。 35.编制时间数列的基本原则及其具体要求是什么?

答:可比性原则---保证时间数列中各项数据的可比性,是编制时间序列的基本原则。

其具体要求是: (1)、时间一致; (2)、总体范围一致; (3)、经济内容、计算口径、计算方法、计算价格、计量单位等方面一致。 36.比较时期数列和时点数列之间的4个不同特点。 答:

①时期序列的各个数据为时期指标值(流量),表示时期现象在各段时期内的发展总量。

时点序列的各个数据为时点指标值(存量),反映时点现象在各个时点上

所处的数量状态和所达到的水平。

②时期序列中各期数据具有可加性,通过加总即可得到更长一段时间内的发展总量,有实际意义。

时点序列中各时点数据不能相加,具有不可加性,即它们相加的结果没

有实际意义。

③时期序列中数值的大小与所属时期长短有直接的关系,一般是时期越长,数值就越大。

时点序列中各时点数的大小与时点间隔长短没有直接的联系。并不是时

点间隔长,时点数就大一些。

④时期序列中各期数据是对每段时间内发生的数量连续登记、累计的结果。 时点序列中各数据通常不可能、也不必要连续登记,一般是对代表时点

进行间断计数的结果。

37.时间数列的分解分析有哪些基本假设?

基本假设是:

(一)现象Y只有四个构成要素:长期趋势T、季节变动S、循环变动C和不规则变动I。(二)构成要素存在以下的组合模型:

乘法模型: Y = T·S·C·I 加法模型: Y = T + S + C + I

乘加模型:Y = T·S + C·I ,等等。

38.简述季节变动的概念及其研究意义。

季节变动是指社会经济现象因受自然因素或社会因素影响,而形成的在一年内有规则的周期性变动。

测定季节变动的意义在于:

? 分析与测定过去的季节变动规律 ? 对未来现象的季节变动作出预测 ? 消除季节变动对时间序列的影响。

39.常用的对比分析方法及其相对数指标有哪些?

答: 根据分析目的和比较基准的不同来划分,对比分析主要有下述几种常用方法。

(1)结构分析,可计算结构相对数(即比重); (2)比例分析,可计算比例相对数(简称比例);

(3)空间比较分析,也叫横向对比分析,可计算空间比较相对数; (4)动态对比分析,也称为纵向对比分析,可计算动态相对数; (5)计划完成程度分析,可计算计划完成程度相对数; (6)强度、密度和效益分析,可计算强度相对数。 40.简述统计指数的概念及其分类

指数是一种对比分析指标,具有相对数的形式(%)。 其对比方式有:不同时间、不同空间、实际与计划对比。 指数的分类有:“数量指标指数”与“质量指标指数”;“个体指数”、“总指数”与“类指数”;“动态指数”与“静态指数”;“综合指数”与“平均指数”;“简单指数”与“加权指数”等。 41.简述加权综合指数的概念及其编制原理。

答:采用加权综合方法计算的总指数,称为加权综合指数。 其编制的基本原理是:

⑴.为了解决复杂现象总体的指数化指标不能直接加总的问题,必须引入同度量因素,使其转化成相应的、能够相加的价值总量形式;

同度量因素通常也称为综合指数的权数,因为它具有权衡各个个体重要性的作用。

引入了同度量因素的综合指数,通常被称为加权综合指数。

⑵.为了在综合对比过程中,单纯反映指数化指标的变动或差异程度,又必须将引入的同度量因素的水平固定起来。

要注意同度量因素的两个问题:指标性质(数量或质量指标)的确定、

固定水平所属时期的选择。

42.简述加权平均指数的概念及其编制原理。

答:采用加权平均方法计算的总指数,称为加权平均指数。 其编制的基本原理是:

先计算出个体指数,再将个体指数加以平均即可求得总指数,这种方法计算的总指数也称之为平均指数。

由于各个个体指数的重要性不同,所以,平均指数通常需要加权。

编制平均指数有两大问题:

? 采用哪种平均法?

(1).算术平均法计算较为简便,也比较直观,所以其应用较为普遍。 (2).根据所掌握的数据和服从研究目的之需要,调和平均法和几何平

均法也有一定的实用价值。

? 权数如何确定?

(1).既要考虑实际经济意义,又要考虑获取资料的可行性和简便性。 (2).权数主要有:基期总值 (q0p0)、报告期总值(q1p1)和固定权数(wi)

等三种。

要注意平均指数的两个问题:“权数”的选择、“型式”的选择。