第五节 选择研究对象——抽样
一、抽样的基本原理
抽样(Sampling)就是从一个总体(population)中抽取部分具有代表性的个体作为样本(sample),然后用这一样本的结果去推断总体。在这里,总体指研究对象的全体,样本是指从总体中抽取的部分个体。
例如做汤,为了知道汤的咸淡,没有必要等到一锅汤喝完后再对汤的味道下结论,只需舀一勺汤品尝一下,然后根据尝的味道推断这锅汤的味道。在这里,一锅汤就是研究的的总体,而这一勺汤则是从总体中选取得到的样本。又如,我们要了解上海市小学三年级学生的识字量是多少?由于全市小学三年级学生数量巨大,不可能给每个学生都测量一下,研究只能在上海市小学三年级学生总体中抽取部分个体对他们进行识字量测验,然后从得出的研究结果推断全市小学生的识字量。假设上海市小学三年级学生总体为100000人,从中随机抽取样本1000人,并对这1000人进行识字量测试,获得结果为平均识字量1600字,然后根据测试结果推断上海市小学三年级学生平均识字量为1600字左右。
抽样是以概率论为理论基础。抽样的作用是为了合理地减少研究对象,既可以节约人力、物力、时间,又可使研究力量相对集中,使研究工作深入、细致,从而提高研究的准确性和可靠性。
一般来说,定性研究中抽取的样本很小,样本有时仅仅是一个案例或一个个体,研究目的是为了对所研究对象进行更深入的了解。而定量研究的样本数较大,样本可以是一群个体,并要考虑样本能否准确代表总体,能否对总体作出推断。
二、抽样的基本要求
抽样是按一定规则进行的,抽样的基本要求是:
1.确定研究总体范围
抽样,首先要明确抽样的总体范围,通常研究课题和研究目的决定了总体的范围。如,“上海市6岁儿童识字量的调查”,这个课题的总体就是上海市全体6岁儿童,不包括外省市的6岁儿童,也不包括上海市其他年龄的儿童。如果总体范围不很清楚,在抽样前应对总体做出明确规定。否则,会对抽取样本和结果推断造成麻烦。需要注意的是:研究者打算将来把结果推广到哪一范围,就应该在那个范围(总体)内抽样。
2.抽样的随机化
随机化是指总体中的每个个体被选入样本的概率不为零。换句话说,总体中的每个个体入选的机会均等。抽签、摇奖就是根据抽样的随机化原理设计的。抽样必须是随机的,这样可避免研究者的主观倾向或人为因素造成的偏差。
3.样本的代表性
样本的代表性指样本应具备总体的性质或特征,样本能在较大程度上代表总体。样本的代表性会影响研究结论的可靠性,影响研究结论的推断程度。对样本代表性的最大威胁是抽样偏差,常为人引用的例子是:1936年,美国《文摘》杂志上的一项有关总统大选的民意调查,调查结果预测兰登将在总统选举中获胜,罗斯福落选。但事实正好相反,选举结果是罗斯福当选总统。虽然民意调查是随机抽样的,而且样本数也不少,但调查者的样本主要是从电话号簿和汽车登记册中抽取的。1936年有电话和汽车的人仅代表了美国选民中的某个特定阶层,对于选民总体来说不具有代表性。这次民意调查的失败在于抽样偏差,样本没有代表性,抽取的样本在质上与总体特征不吻合。
4.合理的样本容量
样本容量是指抽取样本的具体数量。样本数量的多少,既要符合研究目的、内容,满足教育统计的要求,又要考虑抽样的可能性,并使误差减少到最低限度,一般来说,样本数越多,代表性越好;样本数过少,抽样误差较大,代表性也较差。但是,仅仅依赖增大样本数并不是保证充分代表性的必要条件,如果抽样的程度发生偏差,遗漏了总体的某些部分,增加样本就意味着偏差更大。另外,样本数过多,会造成不必要的浪费。
样本数量多少为宜,这是一个复杂的问题。一般来说,样本大小取决于以下一些因素:
①研究的类型、范围;
②统计分析的精确程度;
③允许误差的大小;
④总体的同质性程度;
⑤抽样的方法;
⑥研究成本,包括时间、精力、财力;
⑦分析类别的多少。
如果研究是定量研究,研究范围广,要求的精确度高,允许的误差值小,总体的变异性大,变量的相关程度低,条件控制不严,测定指标信度低,因果关系复杂,分析的类别多,那么样本数量可多些。反之,则可少些。
根据经验,在教育研究的调查研究中,样本数量最好不要少于100;相关研究中,样本数量最好不要少于50;实验研究中,样本数量最好不要少于30。当然以上给出的数字仅仅供参考。在研究中具体样本数为多少,还需根据实际情况作出决定。
另外,推算样本数可用公式计算出总体数量与样本数量的参照数据,见表2—2。
表2—2 有限总体数量与样本数量关系表
总体数(N) | 10 | 20 | 50 | 100 | 200 | 500 | 1000 | 2000 | 5000 | 10000 | 50000 | 100000 |
样本数(n) | 10 | 19 | 44 | 80 | 133 | 217 | 278 | 322 | 357 | 370 | 382 | 384 |
注:可信度为95%,允许误差为5%。
从总体与样本数量的关系表中可以看出,样本数并不是与总体数量的增加而同步增加的。当总体数量不断增加,样本数的增长逐步减缓。如,总体数为1000,抽取278个被试便可满足可信度95%,允许误差不超过5%的抽样要求。如果总体为10000,满意样本数为370;总体为100000,满意样本数为384。由此可见,当总体达到10000以上,接近于无限总体时,样本数的增长很少。
三、抽样的基本方法
抽样的方法多种多样,主要分为两大类:概率抽样和非概率抽样。
1.概率抽样
概率抽样就是每个研究对象被抽取的概率是已知的,抽样方式是随机的。概率抽样常用于定量研究或大规模的正式研究中。具体的抽样方法有:
①简单随机抽样
简单随机抽样是随机抽样方法中最基本的,运用最广泛的,简便易行的抽样方法,是其他抽样方法的基础。简单随机抽样总体中的每一个体都有被抽到的同等机会,可通过抽签、随机数字或摇号机摇号来实现抽样,具体方式:
抽签 先将总体的每一个体编上号码,每个号码做一个签,将全部的签充分混合后,随机从中抽取,被抽到签号的相应个体就进入样本,直到取够所需样本数目为止。
随机数字表 随机数字表是由许多随机组合排列的数字组成的表(见表2—3),用它可以进行简单随机抽样。
例如,要从总体800人中抽取100人的样本,首先把800人从1—800编号排列,然后从随机数字表的任何一行,任何一列的任何数字开始,按任意方向依次取三位数(由于总体为800,是三位数),凡碰到1—800范围内的数字即为中选的号,直至取足100个号为止。其中如果某号大于800或已被抽取过再次出现,则跳过不算。例如从表2—3随机数字表第18行,第1列开始向右取三位数,803(略去,因为超过800),207,267,198,191,843(略去),429,081,349,268……直到抽足100个号为止。这100个号码的被试就组成了研究所要的简单随机样本。
另外,功能较全的计算器都编有随机数字程序,可利用计算器的这一功能进行随机抽样。以卡西欧(CASIO)fx—3600型计算器为例,操作过程为:开机后,按INV· ,显示屏上就会不断地出现随机数字。用计算器随机抽取样本的基本程序与随机数字表的基本程序一样,直到取足样本数量为止。
②系统随机抽样
系统随机抽样又称等距抽样或机械抽样,是把总体中的所有个体按某种顺序排列编号,
然后依固定的间隔抽取样本(间隔的大小视总体与样本数量的比率而定)。换句话说,当样本的第一个个体被随机选定后,其他的个体就可按一定的规律抽出。例如,要研究幼儿的身体发育情况,要从某幼儿园大班120人中抽取30人为研究对象。首先将全体大班幼儿按身高顺序排列编号,1—120,然后求出抽样的固定间隔为120÷30=4,即4个号为一组,共30个组,再随机决定每组中第几号为抽取对象,假定每组中第3个号为抽取对象,那么编号3,7,11,15,19,23……119这30个号就组成系统随机抽样的样本。
系统随机抽样使样本分配均衡,更具代表性,抽样误差较简单随机抽样小,操作也较简单,实际运用较广。
③分层随机抽样
分层随机抽样又称分类抽样或配额抽样,是将总体按某一属性或特征分成若干层次或类别(子总体),然后以各层或各类在总体中所占比重,按比例随机抽取样本。例如,对某校800个学生的学习态度进行调查,拟抽取十分之二的学生(160人)作为样本。首先按成绩评定标准将学生分成优、良、中、差四层,优(160人),良(320人),中(240人),差(80人)。然后用简单随机抽样在四层中按比例分别抽取样本,从优等中抽取160×2/10=32人;从良等中抽取320×2/10=64人;从中等中抽取240×2/10=48人;从差等中抽取80×2/10=16人。这160人组成了分层随机抽样的样本。
分层随机抽样确保每层子总体都被包容在抽样范围内,避免了某一子总体出现“超载”现象或出现意外样本。由于样本中各层数量构成了与总体中的数量构成比例相当,从而能保证样本的代表性。对于总体构成比较复杂,总体数量较大,各层次标志明显的情况下,宜采用分层随机抽样。
④整群随机抽样
整群随机抽样就是以自然群体(学校、班级等)为单位,从较大的群总体中随机抽取样本,整群随机抽样与其他抽样方式的区别在于,它的样本单位是群体,不是个体。例如,在全市幼儿园中随机抽取20所幼儿园进行一项新的教学方法的实验研究。
采用整群随机抽样比较方便,切实可行。这种抽样不会因研究而打乱原有的班级,能兼顾到常规的教学秩序,师生配合等问题。另外,群可作为分析的单位,对统计分析具有意义。但是整群随机抽样所获样本分布不均匀,群体间可能会存在差异,在一定程度上会影响样本的代表性,因此,在选择研究群体时需要慎重考虑。
2.非概率抽样
非概率抽样是指每个研究对象被抽取的概率是未知的,抽样方式不是随机的,样本是按研究目的而选择的。非概率抽样常用于定性研究或小范围的非正式的研究中。具体的抽样方法有:
①目的抽样
当研究情境不能运用随机抽样时,为达到研究目的而选择样本称为目的抽样。目的抽样与随机抽样的区别在于它们抽取样本的方式不同,它们运用的逻辑基础不同。随机抽样的逻辑基础是所选择的样本要有代表性,而目的抽样的逻辑基础是想掌握和了解样本的实际情况。目的抽样并非是随意的,样本的选择是以事先确定目的、准则为依据的。
例如,有位研究者想进行一项幼儿课程改革的实验研究,由于人力、物力等条件的限制,无法以随机抽样的方式获取被试,他只能按目的选择所在幼儿园的一个班进行实验。虽然这样的研究结果不一定能推断到总体,但获取样本方便。
②完全抽样
完全抽样是样本数量和总体数量完全一致。这是抽样的特例,通常在总体数量极少的情况下适用。例如,某幼儿园有8个多动症儿童,研究者就将这8个儿童全部作为样本进行研究。
③异质抽样
异质抽样就是抽取某种特征完全不相同的,差异最大的个体为样本,目的是为获得两类信息,一是不同个体之间的区别和差异;二是不同个体之间的共同之处。例如,要描述幼儿园工作现状,可选择儿童特征、教师管理方式、所处社区环境以及其他统计特征都不相同的幼儿园作样本,也可选择反差最大的,处于问题两头的极端个案作为样本。采用异质抽样的研究常常是比较研究。
④同质抽样
选择具有典型意义的、特征相近的个体为样本。与异质抽样相比,同质抽样走的中间道路。如在一项研究中,所选择的幼儿园既不是最好的,也不是最差的,而是中等程度的幼儿园。这些幼儿园的特征具有典型性和相似性,能代表大多数的普通幼儿园。
⑤立意抽样
立意抽样又称定标抽样,是研究者根据自己确定的标准,凭自己的经验和主观判断来决定所需样本。立意抽样注重样本质的方面,能针对性地研究某些问题,经济实用,但抽样的主观性较强。如研究者认识某一重点幼儿园的园长,征得同意,就以该园幼儿作为研究样本。
⑥随意抽样
随意抽样又称偶然抽样,指按研究者的需要和方便,利用现有的机会对偶然遇到的对象进行抽样。例如,抽取商店里买东西的顾客进行调查;抽取过路的行人进行调查;抽取某次演讲的听众或正在阅览室看书的读者进行调查等。随意抽样简便易行,是新闻记者常采用的方法,但它受研究者主观意志支配,很难保证样本的代表性。
在教育研究中,选择研究对象是需要考虑的实际问题。当选择概率抽样时,研究目的是为了能从样本推断总体,因此必定要用随机抽样的方法,这样样本才具有代表性。然而,随机抽样并非在任何情况下都是可行的,不同的研究目的会要求不同的抽样方法来与其相适应。当运用非概率抽样时,代表性就不可能在概率的基础上进行讨论,而必须在逻辑的基础上进行讨论。通常非概率抽样灵活性较强,使用方便,不受统计原理严密的框架限制,但抽样的主观性较强,缺乏代表性。
总之,具体抽样的类型、标准、方法以及样本容量的大小,应视研究的实际情况而定。一般来说,概率抽样不受抽样者主观意志的影响,能确切地定义样本,确定抽样概率,抽样误差较小,并能从样本推断总体,为研究结果的准确性和可靠性提供保证。因此,在条件许可的情况下,应尽可能采用概率抽样。
四、抽样的原则
任何抽样大有讲究,但不管采用哪种方法抽样,随机性原则和代表性原则是必须遵循的两条基本原则,除此以外,一个好的抽样设计还应满足以下4条原则:
1.方向性原则
方向性原则指决定采用抽样方法时要以研究目的为依据,从研究课题的实际情况出发,整体上综合考虑哪种抽样方法最符合研究目标。抽样方法之间无所谓好与坏之分,每一种方法都有它自己的适用范围和使用条件,关键要看是否与研究目标、研究内容相吻合。
2.可测性原则
可测性原则指选择抽样方法时要考虑为统计分析提供必要的数据。抽样的基本原理就是要由样本推断总体,由部分推论整体,这种推断需要以数据来说明。可测性要求样本数量足以保证统计分析的需要,能使研究者从样本数据有效地推断出总体特征。
3.可行性原则
可行性原则指选择抽样方法时要考虑抽样方案在现实情境中是否行得通。理想上的抽样方案与具体实施方案可能是两码事,例如,要在一所幼儿园某个年级进行一项对比实验,理想的抽样方案是将这个年级的班级打乱,再按随机分配的方式重新编班,分成实验组和对照组。但是这样的抽样方案很少能行得通,幼儿园一般不愿意这样做,因为这将打乱原有的教学秩序。因此较为可行的方案是采用整群随机抽样。可行性原则要求抽样设计更多地从实际情况考虑,方案更详尽,操作更具体。
4.经济性原则
经济性原则指选择抽样方法时要考虑与可得资源相吻合,资源包括时间、财力、人力等。由于教育研究的经费往往很有限,获取样本又是以时间和经费为代价的,而且样本数量并非是越大越好。用两匹马可以拉的车,用10匹马来拉就是浪费了。经济性原则要求抽样既要保证达到研究目标,又不奢侈浪费。
科学地设计抽样方案,可以收事半功倍之效。同时最大限度满足以上原则往往难以作到,有时为了满足抽样的代表性和可靠性,样本容量可增加至最大,但同时却牺牲了经济性原则,因此选择抽样方法实际上是所有原则的综合平衡问题。这也正是为什么有时研究者不采纳简单的抽样方法,而去运用比较复杂的抽样方法的原因。