第四节 推断统计
推断统计是在描述统计的基础上,在一定可靠性水平上,根据样本的统计量对总体参数进行推断的统计方法。在教育研究中,涉及的总体包含的个体数目较大,我们不可能对所有个体逐一进行考察,而通常依照某种抽样思想从总体中随机抽取一定数目的样本进行研究,然后根据样本的信息推断总体的情况,这样的统计方法叫做推断统计。
假设检验是常用的推断统计方法,它指研究者利用样本信息,根据一定的概率,对总体参数或分布的某一假设进行拒绝或保留的决断。
假设检验包括参数检验与非参数检验。平均数差异显著性检验是常见的参数检验;卡方检验是常见的非参数检验。
在进行平均数差异显著性检验时,我们首先应对样本两个方面的信息进行考查:
1.样本的性质,看两样本是相关样本还是独立样本;
相关样本包括两种情况:(1)同一组被试在某项测验前测与后测中所获得的两组测验结果;(2)根据一定条件,将被试一一配对,分别编入实验组与对照组,并对两组被试实施不同的实验处理之后,用同一测验所获得的测验结果。
2.样本的容量(样本中个体的数目),看样本是大样本还是小样本。
在统计上,我们常将两样本容量皆大于30(即n1>30且n2>30)的样本称为大样本;如两样本中有一样本的容量小于或等于30(即n1≤30或n2≤30),我们称这样的样本为小样本。
对两平均数差异进行显著性检验,对于不同的样本性质和样本容量,我们所采用的检验方法也不尽相同。
—、相关样本平均数差异显著性检验
1、同一组情况
中教育研究中,我们常会遇到同一组情况。如,要检验某种新教学方法的有效性,我们采用“单组前测——后测”实验方法,在未实施该教学方法之前先对某群体进行测试(前测),然后采用新的教学方法,经过—段时间,对同样的群体再进行一次测试(后测),并比较两次测试的结果,若后测结果明显好于前测结果,则认为该方法有效;否则,认为该方法无效。
例如,要检验集中训练法对幼儿识字能力的影响,我们随机抽取15名幼儿作为研究对象。在训练前后分别进行一次测试,结果如表10—5中第2、3列所示,问集中训练法是否有效?
表10—5 10名幼儿在接受集中训练法前后的识字成绩
序号 (1) | 训练前X1 (2) | 训练后X2 (3) |
1 2 3 4 5 6 7 8 9 10 | 80 70 85 74 68 74 69 83 75 71 | 85 80 90 80 68 82 76 85 88 78 |
总计 | 749 | 812 |
问:男女成绩有无差异?
检验步骤及方法为:
①提出假设:
H0表示零假设,指假设总体与真实总体无差异的假设。此例中,这一零假设是假设幼儿训练前识字成绩的总体平均数与训练后识字成绩的总体平均数相等;
Hl表示备择假设,指假设总体与真实总体有差异的假设。此例中,这一备择假设是假设幼儿训练前识字成绩的总体平均数与训练后识字成绩的总体平均数不相等。
②选择检验统计量并计算其值
对于小样本,由于总体标准差未知,两样本平均数之差与两相应总体平均数之差的离差统计量呈t分布,因而用t作为检验统计量。
③确定检验形式
检验形式有双侧检验和单侧检验两种形式。当有资料表明两总体平均数存在差异时用单侧检验;当无资料表明两总体平均数是否存在差异时,用双侧检验。
对于该例,由于没有资料说明集中训练前后幼儿的识字水平,孰高孰低,于是采用双侧检验形式。
④统计决断
进行统计决断,需要遵循一定的规则。下面是t检验的统计决断规则:
表10—6 t检验统计决断的规则
t值 | P值 | 显著性 | 差异性 |
t<t(df)0.05 | p>0.05 | 接受零假设H0 | 无显著差异(ns) |
t(df)0.05≤t<t(df)0.01 | 0.01<p≤0.05 | 在0.05显著性水平上拒绝零假设,接受备择假设H1 | 有显著差异(*) |
t≥t(df)0.01 | p≤0.01 | 在0.01显著性水平上拒绝零假设H0,接受备择假设H1 | 有极其显著差异(**) |
根据自由度df=n-1=10-1=9,查t值表(附表1),表中,df表示自由度,P(2)代表双侧检验时的显著性水平,P(1)代表单侧检验时的显著性水平。本例使用双侧检验,在0.01显著性水平上,自由度df为9的临界值,,则零假设出现的概率P<0.01,根据上表所示t检验统计决断规则,在0.01显著性水平上拒绝零假设而保留备择假设,其结论为:集中训练前后幼儿的识字量间存在极显著性差异。由于训练后的平均分高于训练前,说明训练有显著效果。
2.配对组情况
除了同—组,我们也常用到配对组。
例如,我们想知道,对幼儿进行常识教学,是采用计算机辅助教学法好呢,还是采用情境教学法好?
首先,我们选取100名幼儿,并根据智力、年龄等条件基本相同的原则,将其一一配对为50对,组成A、B两组;然后,对A组施以计算机辅助教学,对B组施以情境教学,—段时期之后,对两组幼儿进行常识测试,得到如下测试结果(见表10-7):
表10—7 A、B两组幼儿的常识测试结果
组别 | 人数n | 平均数 | 标准差 | 相关系数r |
A组 B组 | 50 50 | 76.50 75.60 | 10.52 11.61 | 0.82 |
问:幼儿常识教学中,采用计算机辅助教学法和采用情境教学法之间有无显著差异?
检验步骤为:
①提出假设
Ho表示零假设,本例中是说A、B两组幼儿常识的总体平均成绩相等;
H1表示备择假设,本例中是说A、B两组幼儿常识的总体平均成绩不相等。
②选择检验统计量并计算其值
两总体标准差未知,两样本平均数之差与两相应总体平均数之差的离差统计量呈t分布;而对于大样本,t分布接近Z分布,于是可用Z作为检验统计量。
③确定检验形式
由于没有资料说明计算机辅助教学法和情境教学法在幼儿常识教学中的效果谁好谁差,于是采用双侧检验。
④统计决断
本例中采用双侧Z检验,其统计决断规则为:
表10—8 双侧Z检验统计决断的规则
Z值 | P值 | 显著性 | 差异性 |
Z<1.96=Z0.05 | P>0.05 | 接受零假设 | 无显著差异(ns) |
Z0.05=1.96≤Z<2.58= Z0.01 | 0.01<p≤0.05 | 在0.05显著性水平上拒绝零假设,接受备择假设 | 有显著差异(*) |
Z≥2.58= Z0.01 | P≤0.01 | 在0.01显著性水平上拒绝零假设,接受备择假设 | 有极其显著差异(**) |
本例中,|Z|=0.94<1.96=Z0.05,则P>0.05,根据上表所示双侧Z检验统计决断规则,在0.05显著性水平上保留零假设而拒绝备择假设。其结论为:A、B两组幼儿常识成绩无显著性差异,在幼儿常识教学中,采用计算机辅助教学法和采用情境教学法的效果一样。
二、独立样本平均数差异显著性检验
教育研究中,除了相关样本,还有独立样本。要比较独立样本的平均数差异,需要使用独立样本平均数差异显著性检验。
1.独立大样本平均数差异显著性检验
例如,要比较中美两国幼儿的计算能力,我们从两个总体中分别随机抽取2000名和1500名幼儿,并对其计算能力进行测试,结果如下:
表10—9 中美幼儿计算能力测试结果
国家 | 人数n | 平均数 | 标准差 |
中国 美国 | 2000 1500 | 78.50 76.90 | 22.30 20.70 |
问:中美幼儿计算能力有无显著性差异?
检验步骤为:
①提出假设:
H0表示零假设,本例中是说中美两国幼儿计算能力的总体平均成绩相等;
H1表示备择假设,本例中是说中美两国幼儿计算能力的总体平均成绩不相等。
②选择检验统计量并计算其值
对于大样本,两样本平均数之差与两相应总体平均数之差的离差统计量接近正态分布,因而可用Z作为检验统计量。
③确定检验形式
由于缺乏资料表明中美两国幼儿的计算能力孰高孰低,于是采用双侧检验。
④统计决断
本例中,根据表10—8的双侧Z检验统计决断规则,在0.05显著性水平上拒绝零假设而保留备择假设。其结论为:中美两国幼儿计算能力存在显著性差异,中国幼儿的计算能力优于美国幼儿。
2.独立小样本平均数差异显著性检验
独立小样本平均数差异显著性检验,当总体方差齐性(相等)时,常采用t检验。
例如,某班7名男幼儿和12名女幼儿进行简单加法计算测验,测验共有200道试题,规定2个小时,答对1题记1分,测验结束后,得到如表10—10第2、3列所示成绩:
表10—10男女幼儿简单加法计算测验成绩
序号 (1) | 男幼儿X1 (2) | 女幼儿X2 (3) | X12 (4) | X22 (5) |
1 2 3 4 5 6 7 8 9 10 11 12 | 80 118 101 98 107 132 94 | 83 126 119 104 120 111 107 134 115 129 99 123 | 6400 13924 10201 9604 11449 17424 8836 | 6889 15876 14161 10816 14400 12321 11449 17956 13225 16641 9801 15129 |
总计 | 730 | 1370 | 77838 | 158664 |
问:男女成绩有无差异?
检验步骤为:
(1)做方差齐性检验:
提出假设:H0:σ12=σ22,:σ12≠σ22
H0选择检验统计量F:从表9-10中,计算得到:
幼儿 | 容量n | 标准差 | 方差 | 平均数 |
男幼儿 | 7 | 15.627 | 244.20 | 104.286 |
女幼儿 | 12 | 13.71 | 187.97 | 114.167 |
F值与F 临界值比较,对总体方差齐性与否做推断,推断规则见表所示:
表10-11 F检验统计推断规则表
F值与临界值的比较 | P值 | 检验结果 | 显著性 |
F<F(df1,df2)0.05 | p>0.05 | 接受零假设 | 无显著差异(ns) |
F(df1,df2)0.05≤F<F(df1,df2)0.01 | 0.01<p≤0.05 | 在0.05显著性水平上拒绝零假设,接受备择假设 | 有显著差异(*) |
F≥F(df1,df2)0.01 | p≤0.01 | 在0.01显著性水平上拒绝零假设,接受备择假设 | 有极其显著差异(**) |
此题中,查F值表(附表3),F(6,11)0.05=3.09,F=1.39<3.09= F(6,11)0.05,
当F检验结果F的实际值小于0.05显著性水平上的临界值时,方差齐性。本题方差齐性。可继续做独立小样本平均数差异显著性检验。
做t检验:
①提出假设
H0表示零假设,本例中是说男、女幼儿简单加法计算的总体平均成绩相等;
H1表示备择假设,本例中是说男、女幼儿简单加法计算的总体平均成绩不相等;
②选择检验统计量并计算其值
对于小样本,两样本平均数之差与两相应总体平均数之差的离差统计量呈t分布,因而用t作为检验统计量。
③确定检验形式
由于没有资料说明男女幼儿简单加法计算能力孰高孰低,故采用双侧检验。
④统计决断
根据自由度df=n1+n2-2=12+7-2=17,查t值表(附表1)P(2),在0.05显著性水平上;P>0.05,根据表10—6的t检验统计决断规则,于是在0.05显著性水平上拒绝备择假设而保留零假设。其结论为:男女幼儿简单加法计算能力之间无显著性差异。
三、卡方检验
卡方检验作为一种极为重要的非参数检验,它是对样本的频数分布所来自的总体分布是否服从正态分布或某种假设分布所作的假设检验。与参数检验(Z检验、t检验等)相比,卡方检验具有如下三个特点:
1、数据属于间断型点计数据;
2、数据所来自总体的分布是未知的,不一定呈正态分布;
3、该检验不是对总体参数而是对总体分布所作的检验。