第六章 抽样
一 抽样与抽样调查
1抽样是指从调查对象的总体中抽取一部分作为总体代表的过程(程序)。选取的这部分代表称为样本。以此样本作为调查对象的调查称为抽样调查。
2与普查相比,抽样调查具有的优势:(1)费用低 (2)速度快 (3)应用范围广 (4)获得资料丰富 (5)准确性高
3抽样方法分为两类:概率抽样 依据抽样理论与严格的程序,具有科学性
非概率抽样 根据研究任务的要求与调查对象的性质,有意识地选取样本
4抽样调查的关键在于:怎样才能抽到一个我们所要求的精度的样本,如何判断一个样本的误差大小。
二 抽样的术语与程序
1个体(分析单位)是收集信息的基本单位。(青年、妇女、家庭、组织、社区等)
2抽样单位与个体在有些研究中是相同的。但实际抽样时,抽样单位往往是多层次的。
3研究总体是在理论上明确界定的个体的集合体
4调查总体是研究者实际抽取样本的个体的集合体
5抽样框(抽样范畴)是抽取样本的所以抽样单位的名单。抽样框的数目与抽样单位的层次相对应的。
6参数值是关于总体中某一变量的综合描述。
7统计值是关于样本中某一变量的综合描述。
8抽样误差:由于总体的异质性和样本与总体范围的差异性,用样本的统计值去推论总体的参数值就会存在误差,即抽样误差。
总体异质性小,样本所含个体越多,代表性就越高,抽样误差就越小。注意的是,抽样中因误抄、计算等人为过失和其他因违反随机原则而产生的误差并不算这里所说的抽样误差
9置信水平是指总体参数值落在样本统计值某一区间内的概率。
10置信区间是指在某一置信水平下,样本统计值与总体参数值间的误差范围。置信区间越大,置信水平越高
11抽样的基本步骤:
(1)界定研究总体和调查总体,制定抽样框。确定调查对象、调查内容、分析单位(抽样单位)、抽样框。
(2)设计和抽取样本,包括确定样本大小和选择抽样方法。
(3)评估样本的代表性。
三 概率抽样
1概率抽样 依据概率理论,按照随机原则选择样本,完全不带调查者的主观意识的抽样方法。它能是使总体中每个个体被抽中的概率都相等。这样的样本叫随机样本。随机样本的代表性最高。
2简单随机抽样(纯随机抽样)抽样时不进行任何分组、排列使总体内每一抽样分子具有同等概率进入样本。 简单随机抽样是最简单的概率抽样。
3等距抽样(机械抽样、系统抽样)是将总体中所有分子排列并编以序号,然后按计算好的抽样距离依次等距抽样。等距抽样要求抽样框完整外,还要排除总体分子的周期性。如果总体排列有规律分布,就会使等距抽样产生极大的误差。
4分层随机抽样是将总体按某一标准分类,分层抽取子样,合起来即为样本。
分层的原则是使层内的同质性高而层间异质性高。(如分干部类,群众类)
各层的样本数是按此层在总体中所占的比例分配的。(即按比例分层抽样)
分层的标准应选择那些与调查变量高度相关的变量。
5整群随机抽样(聚类抽样)是将总体按照某种标准划分为一些子群体。每个子群体作为一个抽样单位,将抽取出的子群体中每一个个体合在一起作为总体的样本。
分群原则是使群内同质性低而群间同质性高。(如部队内以每一连队做为子群体)
6多阶段抽样:不是将分类的子群体中的所以个体作为样本,而是再从中用随机抽样的方法抽出最终的样本。
四 非概率抽样
1非概率抽样 就是依据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象地总体中进行选择地抽样方法。总体中每个个体被抽中的概率都是未知的。无法保证样本代表性,不能作推理总体之用。
2偶遇抽样(方便抽样) 是指研究者将其在一定时间内、一定环境里所能遇到的调查对象均选入样本的方法。如街头拦人“。
3主观抽样、立意抽样、判断抽样 研究人员主观选取样本。
4定额抽样(配额抽样) 与分层随机抽样相似,但各层的子样本是非随机抽取的。
5滚雪球式抽样 依靠已知调查对象介绍新的调查对象,样本由小到大的抽样方式。
五 样本大小
1样本大小指样本内所含抽样分子的数目。
2样本大小对样本的代表性、调查人力、耗费资金以及最终的调查效果都有影响。
3在统计学中,将容量少于30个个体的样本称为小样本,大于或等于50个个体的样本称为大样本。
习题
1抽样调查始于1891年的人口调查
2抽样的成功首先要求所选取的样本能够代表总体。在抽样方法中,概率抽样最具科学性。
3抽样误差主要取决于总体的异质性和样本所含的个体多少
4评估样本主要是检查样本对总体的代表性
5分层抽样可分为按比例分层抽样和最优分层抽样
6概率抽样中效果最好的抽样方式是分层抽样
7整群抽样的最大缺点是样本分布不均匀和样本代表性差