内容导航:
分层抽样所取的方差代表什么
分层抽样是一种抽样技术,将总体分为多个层次,从每个层次单独抽取样本,以形成样本集合的方法。分层抽样的目的是提高样本的代表性和效率,同时减少估计误差。
当使用分层抽样方法进行统计推断时,从每个层次抽取的样本数量不同,因此每个层次的样本方差也可能不同。因此,为了对样本均值进行有效估计,需要考虑每个层次的方差。分层抽样所取的方差代表了每个层次内单位总体元素方差与单位总体元素数的比值。
每个层次的方差取决于层次内单位元素方差,也就是层次内所有个体数据的差异,以及抽样数量。如果层次内元素差异较大,方差就会较大,若抽样数量增加,方差会减小。通过考虑分层抽样中的方差,可以更准确地估计总体的参数,并将误差降至最低。
简单随机抽样中,我们主要介绍了总体总量、均值、比例、比率估计以及对应的无偏性、方差与方差估计,分层抽样中也是考察这些内容。
分层抽样在第01讲简单介绍过,这里再定义一下。
子总体与层:把总体的 N 个单元分成 L 个子总体,每个单元属于且仅属于某个子总体(不重不漏),称这样的子总体为“层”。设每层的单元数为 N1,...,NL,则有 N1+...+NL = N。
分层抽样:假设样本量为 n,从各层中分别抽取 n1,...,nL 个样本,则 n1+...+nL = n。
分层随机抽样:每一层都是简单随机抽样的分层抽样,所得样本为分层随机样本。
效率高,估计精度高。估计量的方差只与层内方差有关,与层间方差无关。
不仅对总体指标推算,还能对各层指标推算。
层内抽样方法可以不同,便于抽样工作的组织和开展。
分层原则(不重不漏)
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。
便于估计:层内单元具有相同性质,按调查对象的类型进行划分。
关注精度:层内指标值接近,层间指标值差异大。
以上两点可以同时考虑,先把对象分为不同类型,看哪些类型的指标值是接近的就把他们归为同一层。
为了方便:按照行政管理结构分层。
例1 对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货运汽车完成的运量,还要推算不同经济成分(国有、集体、个体)汽车完成的运量。
首先为了方便,按省分层,各省分别开展工作。其次为了估计各经济成分,按照经济成分划分。再次,为了提高效率按照汽车吨位分层。
例2 调查大学生体育锻炼情况,由于男女生参加体育锻炼的情况差异较大,在抽样前对学生按男生和女生进行分层是有必要的。