
第6章 统计量及其抽样分布
一、单项选择题
1.在抽样推断中,样本统计量是( )。[中央财经大学2015研]
A.未知但确定的量
B.一个已知的量
C.随机变量
D.惟一的
【答案】C
【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。
2.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从( )。[山东大学2015研]
A.正态分布,均值为12分钟,标准差为0.3分钟
B.正态分布,均值为12分钟,标准差为3分钟
C.左偏分布,均值为12分钟,标准差为3分钟
D.左偏分布,均值为12分钟,标准差为0.3分钟
【答案】A
【解析】中心极限定理:设从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大(通常是大于36)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。故即使总体是左偏分布,该样本均值仍服从正态分布,其均值为12,标准差为3/10=0.3。
3.设总体,X1,…,X16是来自总体X的样本

则服从的分布是( )。[对外经济贸易大学2015研]
A.t(15)
B.t(16)
C.χ2(15)
D.N(0,1)
【答案】D
【解析】由题可知样本均值

则~N(0,1),即
~N(0,1)。
4.1000名学生参加某课程的考试,平均成绩是82分,标准差是8分,从学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准差分别为( )。[华中农业大学2015研]
A.82,8
B.82,0.8
C.82,64
D.86,1
【答案】B
【解析】由中心极限定理得,在大样本条件下,样本均值X的抽样分布近似服从均值为μ方差为σ2/n的正态分布。故该样本均值的数学期望为82,标准差为8/10=0.8。
5.设是来自
的样本,且

则=( )。[浙江工商大学2014研]
A.
B.
C.
D.
【答案】B
【解析】由题,相互独立且服从
,S2为X1、X2、…、X6的样本方差,由样本方差的性质(n-1)S2/σ2服从于参数为(n-1)的卡方分布,n=6,因此,D(5S2/σ2)=2×5=10,D(S2)=10×σ4/25=2σ4/5 即B项。
6.以下关于统计量的说法中错误的是( )。[中央财经大学2014研]
A.总体参数的无偏估计量是唯一的
B.统计量是随机变量
C.统计量可以根据样本数据计算
D.可以使用不同的统计量来估计同一个总体参数
【答案】A
【解析】统计量是直接从样本计算出的,代表样本的特征。当估计量的均值等于被估计总体参数的真值,即为总体参数的无偏估计量。A项,总体参数的无偏估计量不唯一。
7.设随机变量X和Y独立同分布,其分布为正态分布,则

分布为______。( )[中国科学技术大学2013研]
A.自由度为1,1的F分布
B.自由度1,2的F分布
C.自由度为2,1的F分布
D.自由度2,2的F分布
【答案】A
【解析】随机变量X和Y独立同分布


则有


即


因此

8.设是从某总体
中抽取的一个样本,下面哪一个不是统计量( )。
A.
B.
C.
D.
【答案】C
【解析】统计量是从总体中抽取的样本所构造的函数,不依赖于任何未知参数。C项含有依赖于总体分布的未知参数。
9.下列不是次序统计量的是( )。
A.中位数
B.均值
C.四分位数
D.极差
【答案】B
【解析】设 是从总体
中抽取的一个样本,
称为第
个次序统计量,它是样本

满足如下条件的函数:每当样本得到一组观察值时,其由小到大的排序

中,第个值
就作为次序统计量
的观测值,而

称为次序统计量。根据定义可知中位数、分位数、四分位数、极差等都是次序统计量。
10.抽样分布是指( )。
A.一个样本各观测值的分布
B.总体中各观测值的分布
C.样本统计量的分布
D.样本数量的分布
【答案】C
【解析】统计量是样本的函数,它是一个随机变量。样本统计量的分布称为抽样分布。
11.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值和方差分别为( )。
A.,
B.,
C.,
D.,
【答案】A
【解析】根据中心极限定理,设从均值为,方差为
的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为
,方差为
的正态分布。
12.从一个均值=10、标准差
的总体中随即选取容量为
=36的样本。假定该总体并不是很偏的,则样本均值
小于9.9的近似概率为( )。
A.0.1587
B.0.1268
C.0.2735
D.0.6324
【答案】A
【解析】由于n=36≥30,根据中心极限定理有:

故

13.从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( )。
A.保持不变
B.增加
C.减小
D.无法确定
【答案】C
【解析】当总体分布为正态分布时,样本均值
的抽样分布仍为正态分布,即有

由于样本均值的标准差为,可知当样本量增大时,样本均值的标准差变小。
14.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是( )。
A.正态分布,均值为250元,标准差为40元
B.正态分布,均值为2500元,标准差为40元
C.右偏,均值为2500元,标准差为400元
D.正态分布,均值为2500元,标准差为400元
【答案】B
【解析】当比较大时,样本均值的抽样分布近似服从正态分布。题中
为大样本,因此样本均值
近似服从

即样本均值的抽样分布是近似服从均值为2500元,标准差为40元的正态分布。
15.某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。如果从中随机抽取30只灯泡进行检测,则样本均值( )。
A.抽样分布的标准差为4小时
B.抽样分布近似等同于总体分布
C.抽样分布的中位数为60小时
D.抽样分布近似等同于正态分布,均值为60小时
【答案】D
【解析】当比较大时,样本均值的抽样分布近似服从正态分布。题中
为大样本,因此样本均值
近似服从
。
16.假设总体比例为0.55,从此总体中抽取容量为100的样本,则样本比例的标准差为( )。
A.0.01
B.0.05
C.0.06
D.0.55
【答案】B
【解析】当n充分大时,样本比例服从均值为π、方差为
的正态分布,即

题中n=100>30为大样本,故样本比例的期望

标准差为

17.样本方差的抽样分布服从( )。
A.正态分布
B.卡方(χ2)分布
C.F分布
D.未知
【答案】D
【解析】样本方差的抽样分布服从χ2分布的前提是总体分布为正态分布;当总体分布未知时,样本方差的抽样分布也未知。
18.大样本的样本比例之差的抽样分布服从( )。
A.正态分布
B.分布
C.F分布
D.χ2分布
【答案】A
【解析】当样本和
很大时,样本比例之差
的抽样分布近似为正态分布,其均值为
,方差为

二、多项选择题
1.下列关于抽样平均误差、总体变异程度及样本容量之间关系的陈述,正确的有( )。[西安交大2008研]
A.总体变异程度一定时,样本容量愈大,抽样平均误差愈大
B.总体变异程度一定时,样本容量愈大,抽样平均误差愈小
C.样本容量一定时,总体变异程度愈大,抽样平均误差愈大
D.样本容量一定时,总体变异程度愈大,抽样平均误差愈小
E.样本容量一定时,总体变异程度不影响抽样平均误差的大小
【答案】BC
【解析】抽样平均误差为,则当总体变异程度
一定时,样本容量n越大,抽样平均误差越小;当样本容量n一定时,总体变异程度
越大,则抽样平均误差越大。
2.以下关于χ2分布的描述中,哪些是正确的( )?[西安交大2008研]
A.其变量值始终为正
B.属于左偏分布
C.随着自由度的增大趋于对称
D.具有可加性
E.可用于单因素方差分析
【答案】ACD
【解析】B项,如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:均值<中位数<众数。由χ2分布的图形可知,χ2分布属于右偏分布;E项,单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。检验的统计量为F。
3.下列关于统计量的表述中,正确的有( )。
A.统计量是样本的函数
B.估计同一总体参数可以用多个不同统计量
C.统计量是随机变量
D.统计量不能含有任何总体参数
E.统计量不能含有总体未知的参数
【答案】ABCE
【解析】统计量是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量。它是样本的函数,不依赖于任何未知参数。
4.下列属于次序统计量的有( )。
A.中位数
B.均值
C.四分位数
D.极差
E.样本方差
【答案】ACD
【解析】设X1,X2,…,是从总体X中抽取的一个样本,
成为第
个次序统计量,它是样本(X1,X2,…,
)满足如下条件的函数:每当样本得到一组观测值x1,x2,…,
时,其由小到大的排序
…
…
中,第
个值
作为
的观测值,而
…,
称为次序统计量。中位数,分位数,极差(最大次序统计量与最小次序统计量的差)都是次序统计量;均值、方差不是次序统计量。
5.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,下列关于样本均值抽样描述正确的有( )。
A.样本均值服从正态分布
B.样本均值的期望为0.12分钟
C.样本均值的分布也是左偏的
D.样本均值的标准差为0.3分钟
E.样本均值的期望为12分钟
【答案】ADE
【解析】n=100≥30,根据中心极限定理,样本均值的抽样分布近似服从均值为μ=12,标准差为

的正态分布。
三、判断题
1.设总体ξ~N(μ,σ2),则样本均值。( )[东北财大2004研]
【答案】×
【解析】若总体ξ~N(μ,σ2),则样本均值的方差为,从而
。
2.t分布与正态分布的区别是前者的分布形态是不对称的,后者是对称的。( )
【答案】×
【解析】t分布和正态分布都是对称分布,在样本容量n较小时,两者分布区别较大,当n足够大时,t分布近似于正态分布。
3.样本均值的标准差也称抽样估计的标准误差,可用公式表示为。( )
【答案】×
【解析】样本均值的标准差也称抽样估计的标准误差,可用公式表示为。
4.样本均值的抽样分布形式仅与样本量n的大小有关。( )
【答案】×
【解析】当所抽取的样本为小样本时,样本均值的抽样分布不仅与样本量n有关,还与总体的分布形式有关;当为大样本时,由中心极限定理可知,样本均值的抽样分布近似服从正态分布。
5.分别来自两个总体的两个样本,当样本容量足够大时,样本均值之差的抽样分布服从正态分布。( )
【答案】√
四、简答题
1.简述中心极限定理及意义。[对外经济贸易大学2015研、首经贸2007研]
答:(1)中心极限定理
从任意一个均值为μ、方差为σ2的总体中随机抽取一个样本容量为n的样本,当样本量n足够大时,样本均值近似服从均值为μ、方差为σ2/n的正态分布。
(2)中心极限定理的意义
中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明:只要样本容量足够地大,那么未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。
2.简述样本均值和总体分布之间的关系,样本均值分布在统计推断中的具体应用。[中国人民大学2014研]
答:(1)样本均值和总体分布之间的关系
①如果总体是正态分布,无论样本容量的大小,样本均值也服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。
②根据中心极限定理,在样本容量足够大的情况下,不管总体分布是什么,样本均值都会近似的服从正态分布;
③样本均值的期望和方差受总体分布的影响。一个期望为μ,方差为σ2的样本,从其中抽取一个容量为n的样本,则样本均值的期望为μ,方差为。
(2)样本均值分布在统计推断中的具体应用
在统计推断中,样本均值的分布一定程度上是由总体分布决定的。因此,利用样本均值的分布有如下的应用:
①利用样本均值的分布可推测总体的分布;
②利用样本均值的分布可以构建总体均值的置信区间;
③利用样本均值的分布可以对总体的参数进行假设检验。
3.什么是抽样分布?影响抽样分布的因素有哪些?[浙江工商大学2014研]
答:(1)抽样分布指样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。
(2)影响因素包括:①总量分布;②样本容量;③抽样方法;④抽样组织形式;⑤估计量的构造。
4.何谓统计量?χ2分布、t分布、F分布是不是统计量?它们在统计分析中各有何用处?[西南财大2003研]
答:设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量。通常,又称T(X1,X2,…,Xn)为样本统计量。当获得样本的一组具体观测值x1,x2,…,xn时,代入T,计算出T(x1,x2,…,xn)的数值,就获得一个具体的统计量值。
在总体X的分布类型已知时,若对任一样本容量n,都能导出统计量T=T(X1,X2,…,Xn)的分布的数学表达式,这种分布称为精确的抽样分布。在正态总体条件下,主要有χ2分布、t分布、F分布,常称之为统计三大分布。即χ2分布、t分布、F分布是由样本构造的函数(也就是统计量)服从的分布,这些分布与样本无关,它们与统计量有本质的区别,所以说χ2分布、t分布、F分布都不是统计量。
χ2分布:χ2分布可以用来构造t分布与F分布,并且可以用来构造非参数检验中χ2拟合优度检验的检验统计量,该检验统计量常用于列联分析。
t分布:一般当n≥30时,t分布与标准正态分布就非常接近。t分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。例如在单样本、两个样本的均值假设检验与线性回归方程中回归系数的显著性检验中,常用t分布来构造检验统计量。
F分布:在比较两个总体方差的假设检验时通常用F统计量,且F分布常被用来构造检验统计量以应用于线性回归方程的整体显著性检验与方差分析中。
5.什么是抽样平均误差?影响抽样平均误差的因素有哪些?[西安交大2007研、湖南大学2007研]
答:抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。
影响抽样平均误差的因素有四个:
(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。
(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。
(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n相对N非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。
(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
6.重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
答:样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的1/n,即

在不重复抽样条件下,样本均值的方差则需要用修正系数去修正重复抽样时样本均值的方差,即

对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数趋向于1;对于有限总体,当N很大而n很小时,其修正系数
也趋向于1,这时样本均值的方差也可以按公式
来计算。
7.解释总体分布、样本分布和抽样分布的含义。
答:总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。假设X为总体随机变量,那么总体分布就是指X的分布。很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的。
样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。假设x为总体随机变量X在样本中的体现,那么样本分布就是指x的分布,或者说是关于n个观测值的分布。同样,同一变量不同的样本或同一样本不同的变量,其分布是不同的。
一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样本观测值计算而来的。具体地说,抽样分布就是从容量为的总体中抽取容量为
的样本时,所有可能的样本统计量所形成的分布。假设从容量为
的有限总体中最多可以抽取
个容量为
的不同样本,那么把所有
个样本统计值形成频率分布,就是抽样分布。可以说,抽样分布是研究样本分布与总体分布之间的桥梁。
五、计算题
1.某保险公司为50个集体投保人提供医疗保险,假设他们医疗花费相互独立,且花费(单位为百元)服从相同的分布律

当花费超过百元时,保险公司应支付超过百元的部分;当花费不超过百元时,由患者自己负担费用。如果以总支付费X的期望值E(X)作为预期的总支付费,那么,保险公司应收取总保险费为(1+θ)E(X);其中θ为相对附加保费。为使公司获利的概率超过95%,附加保费θ至少应为多少。(已知Φ(1.41)=0.92,Φ(1.65)=0.95)[中南财经政法大学2005研]
解:设Yi(i=1,2,…,50)为保险公司支付给每个投保人的费用,且。则由题意知Yi(i=1,2,…,50)相互独立并且分布律为:

因此



那么,由中心极限定理可得:

可得=1.65,

即为使公司获利的概率超过95%,附加保费至少应为0.34。
2.设总体x~N(μ,4),x1,x2,…,x n是取自总体x的简单随机样本。试问n取多大,才能使得E|-μ|2≤0.1。[深圳大学2006研]
解:由题意得

则


故。
3.假定总体比例π=0.55,从该总体中分别抽取样本量为100、200、500和1000的样本。
(1)分别计算样本比例的标准差。
(2)当样本量增大时,样本比例的标准差有何变化?
解:(1)n=100时,样本比例的标准差为:

同理,可以计算出n=200,500,1000时的样本比例的标准差分别为0.035,0.022,0.016。
(2)当样本量增大时,样本比例的标准差越来越小。
4.甲、乙两家化肥厂生产化肥,甲厂平均每小时生产100袋化肥,且服从正态分布,标准差为25袋;乙厂平均每小时生产110袋化肥,也服从正态分布,标准差为30袋。现从甲、乙两厂各随机抽取5小时计算单位时间的产量,问出现乙厂比甲厂单位时间产量少的概率为多大?
解:由于两个已知总体都服从正态分布,所以5小时的单位时间产量和
也分别服从正态分布且相互独立,从而
服从以均值为
、方差为
的正态分布,即

根据题意,乙厂的单位时间产量少于甲厂的单位时间产量,就意味着,即
,则

即出现乙厂比甲厂单位时间产量少的概率为0.2835。
5.设总体X服从正态分布N(μ,σ2),(X1,X2,…,X10)为来自总体X的简单随机样本,试求下列概率:
(1)

(2)

(3)

解:(1)由于

因此

(2)由于

因此

(3)由于

因此,则

6.假设(X1,X2,…,X9)和(Y1,Y2,…,Y16)为来自总体N(μ,22)的两个相互独立的简单随机样本,令

求满足下列各式的常数a,b和c:=0.95,
=0.95
解:由条件知:


因此

所以

查表得

即=2.306,解得a=0.2038。
又

查表得F0.025(8,15)=3.20,F0.975(8,15)=1/F0.025(15,8)=1/4.10,即

解得b=0.1301,c=1.7067。