第三节 实验配组和实验设计类型
如何控制无关变量是实验研究中最棘手的问题。实验设计就是试图通过不同的配组形式和不同的实验模式来达到控制无关变量的目的。
一、实验配组
简单地说,实验配组就是指如何将被试分配到实验组和控制组中去。配组的基本要求是尽可能使组与组之间等质,以避免被试的差异对实验结果的影响。为叙述方便,先引入几个符号。
X 表示实验处理或自变量;
—表示无实验处理;
O 表示实验观测,包括因变量的测定;
G 表示组,实验组或控制组;
R 表示被试已作随机分配;
S 表示被试;
…… 表示虚线上面和下面的组不是等组。
另外,字母后下标的数字表示次数,如O1,表示观测1,O2表示观测2;X1表示实验处理l,X2表示实验处理2。
实验设计过程中,研究者必定要考虑:设多少实验组和控制组?如何选择被试?如何配置各组被试?要解决以上问题,研究者首先要知道:自变量的数量是多少?每个自变量中包含几种水平?实验是否需要设控制组?以及因变量测定的次数与程序安排?而这些问题实际上都取决于实验的目的、要求,实验的假设。
1.完全随机设计
完全随机设计又称随机分组法,是用随机化的方法,随机分配被试给实验组和控制组。从理论上说,每个组被试之间无差异。完全随机设计是一种比较方便的配组方法,无需事先测试,适用被试较多,个体差异不大的情况。与此相应的分组方法还有抽签法、随机数字表法,等距抽样法等。如,将学号尾数为5的学生作为实验组被试,学号尾数为8的学生作为控制组被试。
2.随机区组设计
随机区组设计是事先对被试进行测试,根据测试成绩将被试分成若干个同质的区组,然后将每个区组内的被试随机分配给实验组和控制组。这种设计以测验成绩为依据,再行配组,可保证实验组与控制组所处水平基本相同,精确程度比完全随机设计高。
例如,研究者考虑到这60名幼儿的智力可能会影响实验处理的效果,可先对幼儿进行智力测验,然后根据测验分数将幼儿分成好、中、差三个同质的区组,人数分别为8、36、16,最后将每个区组内的被试随机分配给实验组和控制组。
与随机区组设计相似的分组方法还有测量分组法,其具体步骤是:
①对被试进行测试;
②按测试成绩高低排列;
⑧按排列顺序分组;
④检验各组平均数、标准差;
⑤用抽签法决定哪组为实验组,哪组为控制组。
在第③步按排列顺序分组,可以将被试测试成绩由高到低排列编号,然后将单号编入一组,双号编入另一组,最后随机决定实验组和控制组。分组排列顺序分组也可按另外一种形式进行。
分成两个等组
第一组 1 4 5 8 9 12 13
第二组 2 3 6 7 10 11 14
分成三个等组
第一组 1 6 7 12 13 18 19
第二组 2 5 8 11 14 17 20
第三组 3 4 9 10 15 16 21
3.配对组设计
配对组设计是指在实验自变量介入之前,通过测量将条件一致的被试一对一配对,然后再随机地分配给实验组和控制组。通常的做法是对全部被试进行测试,测试性质和内容与实验性质和内容相似或相关,然后按测试成绩排列,将相同分数或分数接近的被试配对,并形成等组,最后随机确定实验组和控制组。
例如,要研究两种不同的教学方法对学习效果的影响,研究者采用现场实验,随机抽取两个平行班,先对这两个班进行测验,然后将两班中成绩相同的幼儿配对,70分对70分,83分对83分等,一共匹配成20对,再随机决定哪个班为实验组,哪个班为控制组。
没有配上对的幼儿与配对幼儿一样跟班接受实验处理,只是在实验结果统计时不把他们的成绩计算在内。
配对组设计目的是为了严格控制两组被试的个别差异可能对实验结果的影响,尽力使两组被试达到同质。但是配对往往只是某个变量、某个方面相同,很难找到几个变量、几个方面都匹配完好的被试。
4.被试间设计
被试间设计又称非重复测量设计,指把不同的被试随机分配到不同的组里(实验组和控制组),各自接受各自的实验处理,即每个被试只接受一种实验处理,互不交叉。
实验处理1 实验处理2
(X1) (X2)
S1 S2 S3 S4 S5 S6 S7 S8
实验组 1 实验组2
被试间设计比较安全,二种或多种实验处理之间不会通过被试相互“污染”,实验条件互不干扰,但是不同组之间被试的差异控制得不够理想,因此采用这种设计时,应使二组被试尽可能相似,一般用随机化或配对分组。
5.被试内设计
被试内设计又称重复测量设计,指把相同的被试分配到不同的实验条件中去,接受不同的实验处理,即每个被试均接受整个实验的各种处理。
被试内设计效率比较高,每位被试在不同实验条件下与自身前后状态相比较,不需要分组,不需要很多被试,并可控制被试个别差异对实验结果的影响。但很可能产生实验处理的“污染”,二种或多种实验条件互相影响。采用被试内设计是有条件的,即先实施的实验处理对后实施的实验处理不会有长期影响。如实验处理为学习效果、记忆效应等,就不能使用被试内设计。一般在被试个体差异比较大的情况下,宜选用被试内设计,当实验处理可能造成多重处理“污染”时,应采用被试间设计。
6.混合设计
混合设计指在一个实验设计中既有被试间设计,又有被试内设计。这种设计比较复杂,但是一种有实用价值的实验设计。例如,在一个2×3的两因素混合设计中,A因素为被试间设计,有A1、A2两个水平,具体指被试的性别,B因素为被试内设计,有B1、B2、B3三个水平,具体指三种不同形式的背诵材料。
背诵材料1 背诵材料2 背诵材料3 B1 B2 B3 | |
A1 男 | S1 S1 S1 S2 S2 S2 S3 S3 S3 S4 S4 S4 |
A2 女 | S5 S5 S5 S6 S6 S6 S7 S7 S7 S8 S8 S8 |
混合设计在实验研究中是一种应用十分广泛的设计,适用于两个自变量,并且每个自变量具有两个或多个水平的研究。
二、实验设计类型
实验设计的类型多种多样,每一种类型有其基本的设计模式,每一种基本模式均可派生出次一级的具体模式,基本模式的互相组合还可以扩展出许多变式。通常对实验设计类型或模式的选择要考虑:哪种类型或模式更适合研究的需要,能简洁地验证实验假设,能有效地控制无关变量的影响。
1.前测和后测设计
在讨论实验设计时,经常用到两个术语:前测和后测。前测指在实验处理之前对被试进行的测量,后测指在实验处理之后对被试进行的测量。在实验设计中,并非所有的设计都需要前测,但后测对每个设计来说是需要的。
①后测设计
任何实验设计都有后测,典型的两个组后测设计是将被试随机分配到实验组和控制组,在引入自变量(实验处理)以后测量因变量。两个组的基本模式为:
RG1 X Ol
RG2 — O2
式中,R表示被试是随机抽取和分配的,G表示组,X表示实验处理,—表示无实验处理,O表示观测。实验结果是比较后测的两组数据的差异,即O1一O2。
②前测—后测设计
将被试随机分配到实验组和控制组,在实验处理介入前后各进行一次测量,即在后测设计的实验处理前加上测量,这样一个后测设计就扩展为前测—后测设计了。加前测的目的是为了了解实验处理前被试的原有水平;为了分析被试在实验处理前后的差异。两个组的基本模式为:
RGl Ol X O2
RG2 O3 一 O4
式中,用奇数作下标的O表示前测,用偶数作下标的O表示后测。实验结果是比较两组前后测数据的差异,即(O2一Ol)一(O4一O3)。
以上提到的两种实验设计模式是最典型的模式,在这些模式基础上还会有其他变式,如一个组的前后测设计,三个以上组的后测设计等。
2.单组、等组、轮组设计
按照实验的组织形式,根据是否设控制组可将实验设计划分为单组设计、等组设计、轮组设计三种类型。
①单组设计
指被试不设控制组,即只有一个实验组,通过实验处理前后两次测量的差异,看实验处理的效果。单组的前后测设计模式为:
G Ol X O2
实验结果O2一 Ol.。单组设计只作自身比较,不与外部比较,虽然避免了不同被试差异可能造成的影响,但在前测和后测中间可能有许多干扰因素难以控制,如被试的成熟,前测对后测的影响,情境的改变等因素,常与实验处理的效果相混淆,运用时应谨慎。
单组设计的例子:有人用两种不同的运动器材对儿童运动量大小进行比较研究,研究者以儿童运动后心跳的速率为测量指标。先让儿童在锻炼前测定心率(前测),然后规定时间用第一种器材进行锻炼,运动结束后即测儿童的心率(后测)。一周后,再用同样的程序测得第二种器材的运动量效果。最后将获得的两种运动量效果进行比较。
这是一个有两种实验处理的单组设计,其设计模式为:
G Ol X1 O2 O3 X2 O4
式中虚线表示间隔,实验结果是将第一种运动器材使用后的效果与第二种运动器材使用后的效果进行比较,即(O2— Ol)一(O 4—O 3),从而得出两种实验处理谁优谁劣的结论。这种实验设计要注意:两个实验处理(X1和X2)之间不应互相影响;每次测定之间不应互相影响,即前测不应对后测造成影响;每次测定的指标应统—。
②等组设计
等组设计是教育实验研究中最基本的设计形式。它具有两个或两个以上等质的实验组和控制组。它的特点是:随机分配被试到实验组和控制组,两组在总体上同质,实验组接受实验处理,控制组不给予实验处理,最后对实验组和控制组的结果进行比较。其基本模式为:
RGl X O1
RG2 一 O2
这是一个等组的后测设计,它可控制几乎所有的影响实验内在效度的因素,是被广泛采用的一种理想的实验设计。
例如,要比较三种不同教学方法对儿童计数能力的影响,研究者通过测验,用随机区组设计将儿童分成三个等质的实验组。每个组分别进行—种教学方法的实验处理,经一段时间的教学,对三个组计数能力进行统一测验,比较三种教学方法的优劣。这个实验的设计模式为:
RGl X1 O1
RG2 X2 O2
RG3 X3 O3
等组设计之所以被广泛应用,在于实验组与控制组基本同质,这样可以控制偶然事件、成熟、统计回归、被试选择等对实验结果造成影响的因素,内在效度较高。只要能随机安排被试,都可采用等组设计。另外可以避免几种实验处理在单组设计中可能出现的混淆。等组设计的不足之处在于有前测的设计中,前测有可能产生前测效应(即前测对后测的结果造成影响),以及前测与实验处理的交互作用。
③轮组设计
轮组设计也称平衡设计,是对不同的组,以不同的顺序,轮流施加不同的实验处理的实验设计。即将不同的实验处理轮流地施予各组,根据每个处理的总和效果来确定实验处理的效应。模式为:
G1 X1 O1 X2 O2
G2 X2 O3 X1 O4
轮组设计的特点是:实验组可以为不等组,当然如果是等组则更好;每个组都接受了不同的实验处理(X1、X2),都是实验组;每个组中实验处理的介入顺序不同,第一组先引入X1,再引入X2,第二组先引入X2,再引入Xl;实验处理介入前后都有测定;结果是将两组中实验处理l(X1)和实验处理2(X2)的效应分别相加,然后再对两种实验处理的效果进行比较。。
G1 X1 O1 X2 O2
G2 X2 O3 X1 O4
结果:
( O1 + O4 ) — ( O2 + O3 )
轮组设计的实例:对幼儿用动手法和不动手法进行常识教学,来探讨究竟用动手法教学好,还是用不动手法教学好,设计两个课程内容:一为《认识磁铁》,二为《认识水》,分别随机选择两组中班幼儿,第一组中班幼儿先用动手法学习《认识磁铁》,再用不动手法学习《认识水》;第二组中班幼儿先用不动手法学习《认识磁铁》,再用动手法学习《认识水》。
轮组设计较适合于自然情境下的实验,无需为配置等组而打乱班级,并可通过对实验处理的轮换达到某种均衡,由于是对实验处理总和效应进行比较,在平衡配置过程中很多无关因素被互相抵消了。另外,轮组设计对分组的要求和对无关变量控制的要求都比等组设计低,易于操作。但轮组设计周期较长,被试反复测试可能产生多重处理的干扰。
3.前实验、真实验、准实验设计
根据实验设计的可靠性程度,可分为前实验设计、真实验设计、准实验设计三类。
①前实验设计
前实验设计具有实验设计的基本成分,但缺乏对无关变量的控制,效度很差,尚未达到实验研究的起码要求。通常不把它看作正式的实验设计,故称前实验设计,又称非实验设计。前实验设计的模式主要有:
A.单组后测设计
G X O
这种设计只有一组被试,只给予一种实验处理,只有一次后测,并且后测的结果就是实验处理的效应。例如,某幼儿园对5岁儿童进行英语教学(X),一年后,所教儿童英语有所长进(O),研究者下结论,幼儿学习英语以5岁为宜。这样的结论是无效的,因为这个实验研究没有用不同年龄组作对照,人们无法知道4岁或6岁儿童学英语一定不如5岁儿童。
又如,某幼儿园老师实行每天午餐后给儿童喝一小碗水的计划(X),结果发现儿童午睡入睡时间快了,睡不着的人少了(O),她的结论是午餐后喝水有助于午睡。这个实验设计可能会有许多难以回答的问题,如,除了午餐后给水外,幼儿园是否还有其他特殊事件会对午睡造成影响,比如,周围环境变安静了;天气热,消耗大,容易疲劳;以及班里遵守纪律,争得小红星的活动等。另外是否老师管理得更严格,午睡时一直在监督儿童,或儿童是否由于成熟,更自觉地遵守规则等。总之,不解决上述问题,很难下结论说午睡行为的变化一定是由午餐后喝水引起的。像这样的实验设计,既不对无关变量作控制,又不随机选择被试,不作内部或外部的比较,应尽量少用。
B.单组前后测设计
G O 1 X O2
这一设计比单组后测设计有所改进,增加了前测(O1),这样可对实验处理前后的差异进行比较,实现了被试自身的部分控制,实验效度有所提高,但它仍未能控制偶然事件、成熟、前测效应、统计回归等因素。如上例,在午餐给水计划实施前,先对儿童午睡状况进行观察,获取数据,增加了前测。但前后测的比较仍无法解决上述问题,仍然不能确定午餐后喝水与午睡行为改善之间存在必然的联系。
C.固定组比较设计
G1 X O 1
G2 一 O 2
这种设计比单组设计有所改进,它使用了控制组,但实验组和控制组被试都不是随机选择和随机分配的,通常以自然班为单位,故称之为固定组比较设计,又称整组比较设计。固定组比较设计引入了控制组作外部比较,在一定程度上偶然事件、成熟得到了控制。也就是说如果实验期间发生的事件或被试自身的成熟影响了实验结果,那么对两个组来说产生的影响可能是一样的。但由于被试不是随机选择的,又没有对被试进行前测,因此无法判断被试是否是等质组,两组的可比性大打折扣。人们难以知道实验处理前是否有一组程度已高于或接近于后测水平,以至于使该组在后测中的成绩超过另一组。
例如,研究者在两个班上进行教改实验,实验班引入新的教学方法(X1),控制组沿用传统的教学方法(X2),一学期后进行测验,并对两组测验成绩进行比较,看哪种教学方法更有效。这种实验的主要问题在于被试的差异没有控制,不易判断实验结果是否是由实验处理所引起的。既使最后测验成绩是新的教学方法优于传统的教学方法,也有可能是由于实验组在实验处理前的水平本来就高于控制组所致。固定组比较设计的实验效度较低,除非能获得有关两组被试相似的资料,否则应避免采用这种设计。
前实验由于设计简单,获取被试容易,操作方便,因此在教育研究中常被采用。但由于没有控制组或无法提供等质的控制组,不能令人满意地控制无关变量的影响,不易判断自变量和因变量之间的因果关系,因此在解释实验结果时要谨慎。
②真实验设计
真实验设计又称实验设计,它的基本特点有:包含两个或多个组;在随机化的基础上选择与分配被试;能充分控制绝大多数影响实验内在效度的因素;可获得比较准确的实验结果。真实验设计的模式有多种,下面仅介绍最典型的三种。
A.等组后测设计
RG1 X O1
RG 2 — O2
这种设计将被试随机分配到实验组和控制组,从而能控制偶然事件和成熟;另外由于两组是随机等组,能控制被试的选择和统计回归效应;再有由于不进行前测,可避免前测效应。这是一种比较理想的实验设计,几乎可以控制所有影响实验效度的因素。因此,在有条件随机分配被试的情况下;当前测可能与实验处理发生交互作用时;或无法实行前测时,最好采用这种设计。
B.等组前后测设计
RGl Ol X O 2
RG2 O3 — O4
这种设计与等组后测设计不同之处在于用了前测。用前测可以检查随机分组是否存在偏差,控制抽样误差,确认两组的等同性和可比性。然而前测有时会给实验增添麻烦。如,前测可能使被试取得经验或对实验处理有所觉察,从而使后测成绩提高,影响实验的内在效度。换句话说,前测与后测的交互作用在这种设计中是不受控制的。
例如:何飙、冷莹和覃小娟的《在艺术欣赏活动中发展中班幼儿词汇》实验研究中就采用等组前后测设计方式,从幼儿家庭基本条件、教师年龄、学历、基本水平等方面做到实验组和对照组相当。研究结果主要比较幼儿的词汇量和词汇运用水平在实验前后的不同。(《基础教育研究》2002年增刊二)
等组前后测设计的适用范围:当研究者需要收集被试原始状态的数据,并且不担心前测会对后测成绩造成影响时;当研究者需要通过前测来验证两组是否为等组,或对两组被试的前后变化程度感兴趣时,可采用这种设计。但是,当研究者有理由怀疑前测会对实验结果造成影响,或者前测很花费时间和经费,那么最好回避前测,采用等组后测设计。
C.所罗门四组设计
RGl Ol X O 2
RG2 O3 一 O 4
RG3 X O 5
RG4 一 O 6
这种设计是所罗门(R.L.Solomon)1949年提出的,这种设计的主要目的是为了克服等组前后测设计中前测对后测可能造成的交互作用,即前测效应,并且能将前测效应分离出来,从而增进实验效度。所罗门四组设计实际上是等组前后测设计和等组后测设计的组合。在四个组中,前两个组为等组前后测设计,后两个组为等组后测设计。
所罗门四组设计的实验结果的分析比较复杂,例如,如果O2>O4,并且O5>O6,则说明实验处理效果显著,因为无论是否有前测,实验组的观测值总是显著大于控制组。如果O2>O4,并且O5>O4,也可认定实验处理有效。如果(O2一O1)>(O4—O3),并且O5>O6,也说明实验处理有效。如果O2>O5,并且O4>O6,则说明前测对实验结果有明显的影响,具有前测效应。因为无论是实验组还是控制组,有前测的组的观测值总是显著大于无前测的组。如果O2>O4,并且O5=O6,则说明实验处理本身效果不明显,有可能前测与实验处理产生交互作用。
所罗门四组设计是一种内在效度较高的,比较理想的实验设计,它可将前测效应分离出来,可作多种比较。但这种设计在现实研究中很少被采用,这是因为同时进行四个组的实验耗费时间、精力、经费;也很难找到四组同质的被试。
③准实验设计
准实验设计又称类似实验设计。在控制程度上,是介于前实验设计与真实验设计之间的一种实验设计。它比前实验设计的效度要好得多,能对一部分影响实验效度的因素进行控制,但又不如真实验设计那样对整个研究过程作充分、严格的控制,因此在实验前冠于“准”字,以示区别。
准实验设计通常在难以或不可能进行真实验设计的情况下采用。如,学校不允许拆班以提供等组样本;不允许实验处理只给予班上的部分学生,而不给予其他学生;不愿意提供基础测试,如智力测验,不能随机分配被试等。准实验设计与真实验设计的最大区别是,没有运用随机化程序,即被试的选择、配组、实验处理的分配都不是随机安排的。
准实验法通常是在自然情境或现场背景中实施,避免了实验条件过分高度控制可能带来的环境失真,并且操作相对简单,适用于更广泛的研究目的,具有较高的可行性,是教育实验研究中最具前途和价值的研究方法。
准实验设计的模式很多,并且每种模式的再生能力也很强,富于创造性,基本常用的模式有以下几种:
A.非等组前后测设计
这种设计在教育实验中应用最普遍。它比固定组比较设计多了前测。它与真实验设计中的等组前后测设计的区别在于实验组与控制组不是等质的,两组被试不是随机分配的,常以现实情境中的自然教学班为单位。非等组前后测设计的结果分析有两种,一是如果前测两组数据相等,无显著差异,则O2一O4,直接比较实验组和控制组的后测数据;如果前测两组数据不等,有差异,则(O2一O1)一(O4一O3),即对实验组前后测的增值分数与控制组前后测的增值分数进行比较。
B.时间序列设计
时间序列设计又称定时重复观测设计,是指在实验处理之前与实验处理之后,对被试进行一系列定时的重复观测,然后对前后系列观测结果进行比较、分析,判别实验处理的效应。其基本模式有:
单组时间序列设计
G Ol O2 O3 O4 X O5 O6 O7 …………
单组时间序列设计是前实验设计中单组前后测设计的一种扩展形式,由单一的前后测变为多次的、定时的前后测序列,实验处理(X)的插入点是随机决定的,即实验处理可以在任意两次测定之间介入。测定次数可视实际情况而定,一般前测次数不要少于三次。时间序列设计有许多不同的结果模式,通常实验结果可通过曲线图直观地表示。
时间序列设计中的多次测定对确定实验处理效果颇有用处,假设在曲线C中,如果只有O3和O4两次观测结果,那么研究者会认为实验处理有效。其实两次观测的结果可能是其他原因造成的。但是如果将前后测向两头延伸,就能比较清楚地看到实验处理的作用。在曲线B中,如果只观测O3和O4,那么可能存在的实验处理的迟效应将会被忽略。正如股票价格的走势图一样,单凭一、二次的价格数据是很难作出买卖的正确判断的,只有长期地跟踪描绘才有可能看出股票价格的趋势。
时间序列设计采用的是定时的重复观测,为了保证实验结果的可靠性,实施过程中要注意:
①实验处理之前的观测次数一般不要少于3次;
②要等前测数值趋于稳定后再介入实验处理;
③实验处理的插入点要随机安排;
④实验处理介入后的观测应持续较长一段时间,一般要到观测数值趋于平稳为止;
⑤每次观测的指标应是统一的,观测时间应定时;
⑥观测指标最好运用有大量复本的测验,或采用学校常规的测验分数。
C.单个被试设计
大多数实验研究的样本是多个被试的群体。在教育研究中,在特殊情况下有时可以单个被试作样本,如,心理治疗,行为矫正,行动研究、个案研究等。因为单个被试不存在随机选择与分配的问题,所以单个被试设计被认为是准实验设计。单个被试设计与时间序列设计一样,通常要进行反复观测,并且—次实验仅改变或处理一个变量。单个被试设计模式主要有:
A—B设计
A—B设计是最简单的单个被试设计。A表示基线条件,或前测阶段,即实验处理介入前的持续观测,B表示实验处理条件,即持续的实验处理观测,A、B两段的时间相同,测定次数也相同,至于每段测多少次根据实际情况定。
A—B设计的基本思路是:先取得被试行为的基线值,然后引入实验处理并观察被试行为变化。
A—B—A设计
A—B—A设计又称倒返实验设计,是A—B设计的展开。它是在前测阶段或称基线阶段(A)和实验处理阶段(B)之后,再加上一个第三阶段实验处理撤除阶段(A),即这一阶段相当于又回到基线阶段(A)对被试进行基础观测。A—B—A设计的三阶段观测时间、次数相等,设计的基本思路是想通过前测阶段与实验处理撤除阶段测定数据的比较来检验实验处理的长期效应。
例如,幼儿多动症药物疗效的观测,基线阶段定时观测被试的基本行为状态;在观测趋于稳定的情况下,介入实验处理,即给被试服药,并继续观测;一段时间后,撤除药物,仍保持观测,直到行为状态保持稳定,最后将定时观测数据在坐标图上描点连线构成曲线图,并对服药前后被试的行为变化作出分析判断。
A—B—A—B设计
在A—B—A设计的基础上,再加上一个实验处理阶段就构成了A—B—A—B设计。
由于这种设计将基线阶段和实验处理阶段循环运用了两次,它的内在效度比A—B设计和A—B—A设计要高。如果两次循环的结果相仿,那么可比较有把握地作出实验结论。
例如,某教师对班上一个男孩经常打人,破坏纪律伤透脑筋,她尝试着用行为矫正法来改变这个男孩的打人行为。她所用的刺激物(奖品)是该男孩喜欢的玩具和吃的东西,实验处理为每小时如无打人行为就给予一个奖品,一共观测四周,每周5天,共20天。采用A—B—A—B设计,第一周为基线阶段,第二周为实验处理阶段,第三周撤除实验处理,第四周再次实施实验处理。
4.单因素设计和多因素设计
因素通常指实验中研究者感兴趣的变量,这个变量也称自变量。只有一个自变量(因素)的实验设计叫单因素设计,有两个或两个以上自变量的实验设计叫多因素设计。
①单因素设计
在单因素设计中,研究者只操纵一个自变量,通过自变量的变化来观测对因变量的影响,并试图说明自变量和因变量之间的对应关系。
前面所描述的实验设计模式基本上都是单因素设计。虽然在单因素设计中,有时也会有X1、X2同时出现在一个设计模式中,如要对两种不同的教学方法进行比较研究,可采用真实验中的等组前后测设计,其模式为:
RGl O 1 Xl O 2
RG2 O 3 X2 O 4
在这里X1、X2分别代表两种不同的教学方法,是一个自变量(教学方法)的两种水平或两种实验处理方式,并不是两个自变量。因为在这样的实验设计中不涉及X1和X2:的相互作用,因此仍把这些设计看作单因素设计。
②多因素设计
多因素设计也称因素设计或析因设计,指实验中含有两个或多个自变量(因素)的实验设计。它的特点是:能把每个自变量的各种水平组合起来进行实验。
在现实的教育实验研究中,常常需要探讨比一一对应关系更为复杂的问题,因为教育研究的一个重要特点就是多变量、多因素,绝对的一对一的因果关系极其有限。某种现象的变化,某种结果的产生,往往并非出于单一的原因,而是许多因素互相作用的产物。如果硬要想从中抽出其中一部分,孤立地加以探讨研究,说明其成效,这既不符合实际,理论上也说不通。随着教育研究的不断深入,运用多因素设计已成为教育实验研究的发展趋势。
例如,杨丽珠等在《四种注意情境下幼儿自我延迟满足的实验研究》一文中,采用两因素4×3随机实验设计,实验自变量为注意情境(A 两种奖励物同时呈现、B 只呈现即时奖励物、C 只呈现延迟奖励物、D 两种奖励物都不呈现)和幼儿年龄(3,4,5岁)。一共12个实验处理结合,每个实验处理结合分配10名被试,每名被试只接受一种实验处理。实验因变量为幼儿的延迟时间(以分钟为单位)。研究最终发现:(1)幼儿自我延迟满足在两种奖励物都不呈现情境下平均延迟时间最长,在呈现奖励物的三种情境下平均延迟时间较短,表现出跨年龄稳定性;(2)3~5岁幼儿自我延迟满足发展存在显著年龄差异,表现出随年龄增长而提高的趋势。(参见:《心理发展与教育》,2003年第4期)
多因素设计的优点在于:不必对每个自变量进行设计,它可将多个自变量糅合在一个实验设计中,经济方便,并且可以研究自变量各个水平之间的交互作用,以及对因变量的综合影响。多因素设计比单因素设计可获得更多的信息,可使实验研究更加深入,可探索更为复杂的现象,同时使研究结果更加精确、可靠。
多因素设计至少要有两个自变量,每一自变量至少要有两种水平,因此最简单的多因素设计称为2X2因素设计。多因素设计通常以数字来命名设计模式,阿拉伯数字的个数表示自变量的数目,数字的值表示自变量的水平。如2×3因素设计,在乘号前后各有一个数,意味着有2个自变量,前后2个数的数值分别为2和3,意味着前一个自变量有2种水平,后一个自变量有3种水平。假如再增加一个具有2种水平的自变量,那么这个设计模式就是: 2X3X2因素设计,即有3个自变量,各个自变量的水平分别为2、3、2。
在多因素设计中,随着自变量和水平的增加,分组的数目也在迅速增加。分组的数目是自变量每个水平的互相组合数,即数字的连乘积。如,最简单的2×2因素设计要分成4个组;3×3因素设计要分成9个组;2×3×2因素设计要分成12个组。
下面我们以最简单的2×2因素设计为例作些解释。
一个研究要探讨两种不同教学方法对两种不同能力水平儿童学业成绩的影响。研究涉及两个自变量(因素),一个自变量是教学方法(因素X),它有两种水平X1和X2;另一个自变量(因素)为儿童的学习能力(因素Y),也有两种水平Y1和Y2。这个实验设计的基本模式如下:
RGl Xl Yl Ol
RG2 X2 Y1 O2
RG3 X1 Y2 O3
RG4 X2 Y2 O4
式中X和Y分别代表两个因素,X和Y的下标表示不同的水平。后测是X和Y不同水平组合的效果。