方差分析
方差分析
第一模块:单因素方差分析 (ANOVA)
1. 核心逻辑:为什么要叫“方差”分析?
很多同学一直困惑:“我们要比较的是3组数据的平均值($\mu_1, \mu_2, \mu_3$)是否相等,为什么要分析‘方差’?”
这里有一个非常经典的**“信号与噪声”**理论:
我们将数据的总波动(SST)拆解为两部分:
- 组间波动 (SSA):这是信号。是由不同的“因素”造成的(比如用了三种不同的组装方法,效率自然不同)。这部分波动是我们想看到的。
- 组内波动 (SSE):这是噪声。是随机误差(比如同样是用方法A,小张和小李的手速不一样)。这部分波动是我们想消除的。
判决逻辑(F检验):
$$ F = \frac{\text{组间方差 (信号)}}{\text{组内方差 (噪声)}} = \frac{MSA}{MSE} $$
- 如果 $F$ 值很大(信号远强于噪声):说明组和组之间的区别是实打实的,不是运气。$\rightarrow$ 拒绝 $H_0$,认为各组均值显著不同。
- 如果 $F$ 值接近 1:说明组间区别还没组内瞎波动的区别大。$\rightarrow$ 接受 $H_0$,认为各组没啥区别。
2. 实战解题:ANOVA 表格填空(考试必考)
这就像在玩数独,格子里是有勾稽关系的。一定要背下来这个关系网!
假设我们在做题目:3种组装方法 ($k=3$),总共调查了 30 名工人 ($n=30$)。
| 差异源 | 平方和 (SS) | 自由度 (df) | 均方 (MS) | F 值 |
|---|---|---|---|---|
| 组间 (SSA) | 填空1 | $k-1 = 3-1 = 2$ | $MSA = \frac{SSA}{2}$ | $F = \frac{MSA}{MSE}$ |
| 组内 (SSE) | 3836 | $n-k = 30-3 = 27$ | $MSE = \frac{3836}{27}$ | |
| 总计 (SST) | 填空2 | $n-1 = 29$ |
- 填空逻辑:
- 先算均方 (MS):$MS = SS \div df$。
- 题目若给了 $MSA=210$,那我们反推 $SSA = 210 \times 2 = 420$。(填空1)
- 再算加法:$SST = SSA + SSE = 420 + 3836 = 4256$。(填空2)
- 最后算 F 值:
- 先算出 $MSE = 3836 \div 27 \approx 142.07$
- $F = 210 \div 142.07 \approx 1.48$
- 下结论:
- 查表 F临界值(假设是 3.35)。
- 因为 $1.48 < 3.35$,不能拒绝 $H_0$。
- 人话结论:这三种组装方法效率差不多,没必要折腾换方法。
- 先算均方 (MS):$MS = SS \div df$。
来个题目练练手吧:
10.4 某企业准备采用3种方法组装一种新的产品,为确定哪种方法每小时组装的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每名工人组装的产品数进行方差分析得到下面的结果:
方差分析表
| 差异源 | SS | df | MS | F | P-value | F crit |
|---|---|---|---|---|---|---|
| 组间 | 210 | 0.245 946 | 3.354 131 | |||
| 组内 | 3 836 | — | — | — | ||
| 总计 | 29 | — | — | — | — |
(1)完成上面的方差分析表。
(2)若显著性水平 $\alpha=0.05$,检验采用3种方法组装的产品数量之间是否有显著差异。
第一步:梳理已知信息和逻辑关系
从题目文字和表格中,我们提取出以下关键信息:
- 因素水平数 ($k$):有 3种 方法组装,所以 $k=3$。
- 总样本量 ($n$):随机抽取了 30名 工人,所以 $n=30$。
- 表格已知数据:
- 组间均方 ($MS_A$) = 210
- 组内平方和 ($SSE$) = 3836
- 总自由度 ($df_T$) = 29
- P-value = 0.245946
- F crit (临界值) = 3.354131
核心公式关系(一定要背下来):
- 自由度关系:总自由度 = 组间自由度 + 组内自由度
- 平方和关系:总平方和(SS) = 组间SS + 组内SS
- 均方(MS)计算:$MS = SS \div df$ (反过来就是 $SS = MS \times df$)
- F值计算:$F = 组间MS \div 组内MS$
(1) 完成上面的方差分析表
我们要填补表格中的空缺项。
1. 计算自由度 (df)
- 组间自由度 ($df_A$):公式是 $k - 1$。
$$df_A = 3 - 1 = 2$$ - 组内自由度 ($df_E$):公式是 $n - k$,或者 总自由度 - 组间自由度。
$$df_E = 30 - 3 = 27$$
(验证:$2 + 27 = 29$,与题目给的总计29一致)
2. 计算平方和 (SS)
- 组间平方和 ($SSA$):已知 $MS_A$ 和 $df_A$。
$$SSA = MS_A \times df_A = 210 \times 2 = 420$$ - 总计平方和 ($SST$):组间SS + 组内SS。
$$SST = 420 + 3836 = 4256$$
3. 计算均方 (MS)
- 组内均方 ($MSE$):已知 $SSE$ 和 $df_E$。
$$MSE = SSE \div df_E = 3836 \div 27 \approx 142.074$$ (保留三位小数)
4. 计算 F 值
- $$F = MS_A \div MSE = 210 \div 142.074 \approx 1.478$$
填好的完整表格如下:
| 差异源 | SS (平方和) | df (自由度) | MS (均方) | F | P-value | F crit |
|---|---|---|---|---|---|---|
| 组间 | 420 | 2 | 210 | 1.478 | 0.245946 | 3.354131 |
| 组内 | 3836 | 27 | 142.074 | — | — | — |
| 总计 | 4256 | 29 | — | — | — | — |
(2) 检验采用3种方法组装的产品数量之间是否有显著差异
步骤 1:提出假设
- 零假设 ($H_0$):$\mu_1 = \mu_2 = \mu_3$ (三种方法的平均组装数量没有显著差异)
- 备择假设 ($H_1$):三种方法的平均组装数量不全相等(至少有一种方法与其他不同)
步骤 2:进行判断
这里有两种判断方法,结论是一致的:
-
方法 A:利用 P-value 判断(最快)
- 题目给出的 $P\text{-value} = 0.245946$
- 显著性水平 $\alpha = 0.05$
- 因为 $P\text{-value} (0.246) > \alpha (0.05)$,所以不拒绝零假设。
-
方法 B:利用 F值与临界值 判断
- 我们计算出的 $F = 1.478$
- 题目给出的临界值 $F_{\text{crit}} = 3.354131$
- 因为 $F < F_{\text{crit}}$,统计量没有落入拒绝域,所以不拒绝零假设。
步骤 3:得出结论
在 $\alpha=0.05$ 的显著性水平下,我们要接受零假设。
结论:没有证据表明采用3种方法组装的产品数量之间有显著差异(即这三种方法的效率基本是一样的)。
一、 题目文字内容
8.2 一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上一样,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是初级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是 1~10,10 代表非常满意):
| 高级管理者 | 中级管理者 | 初级管理者 |
|---|---|---|
| 7 | 8 | 5 |
| 7 | 9 | 6 |
| 8 | 8 | 5 |
| 7 | 10 | 7 |
| 9 | 9 | 4 |
| 10 | 8 | |
| 8 |
取显著性水平 $\alpha=0.05$,检验管理者的层次不同是否会导致评分的显著差异。
二、 解题过程解析
第一步:提出假设
- 零假设 ($H_0$):$\mu_1 = \mu_2 = \mu_3$
(即:高级、中级、初级管理者对讲座的平均满意度没有显著差异,或者说完全相同。) - 备择假设 ($H_1$):$\mu_1, \mu_2, \mu_3$ 不全相等
(即:至少有一组管理者的平均满意度与其他组不同。)
第二步:整理数据与计算基本统计量
我们需要计算每一组的样本量 ($n$)、总和 ($T$) 和平均值 ($\bar{x}$)。
-
高级管理者 (组1):
- 数据: 7, 7, 8, 7, 9
- $n_1 = 5$
- 和 $T_1 = 7+7+8+7+9 = 38$
- 均值 $\bar{x}_1 = 38 / 5 = 7.6$
- 平方和 $\sum X_1^2 = 49+49+64+49+81 = 292$
-
中级管理者 (组2):
- 数据: 8, 9, 8, 10, 9, 10, 8
- $n_2 = 7$
- 和 $T_2 = 62$
- 均值 $\bar{x}_2 = 62 / 7 \approx 8.86$
- 平方和 $\sum X_2^2 = 64+81+64+100+81+100+64 = 554$
-
初级管理者 (组3):
- 数据: 5, 6, 5, 7, 4, 8
- $n_3 = 6$
- 和 $T_3 = 35$
- 均值 $\bar{x}_3 = 35 / 6 \approx 5.83$
- 平方和 $\sum X_3^2 = 25+36+25+49+16+64 = 215$
总体数据:
- 总样本量 $N = 5 + 7 + 6 = 18$
- 总和 $T = 38 + 62 + 35 = 135$
- 总均值 $\bar{\bar{x}} = 135 / 18 = 7.5$
- 原始数据总平方和 $\sum \sum x^2 = 292 + 554 + 215 = 1061$
第三步:计算平方和 (Sum of Squares) 【SSA,SSE公式不用记考试不会考】
我们需要计算三个关键指标:SST(总平方和)、SSA(组间平方和)、SSE(组内平方和/残差平方和)。
为了方便计算,我们要先算一个校正数 (Correction Factor, C):
$$C = \frac{T^2}{N} = \frac{135^2}{18} = \frac{18225}{18} = 1012.5$$
-
总平方和 (SST, Total Sum of Squares):
$$SST = \sum \sum x^2 - C$$
$$SST = 1061 - 1012.5 = 48.5$$ -
组间平方和 (SSA, Sum of Squares Between Groups):
公式:$SSA = \sum (\frac{T_i^2}{n_i}) - C$
$$SSA = (\frac{38^2}{5} + \frac{62^2}{7} + \frac{35^2}{6}) - 1012.5$$
$$SSA = (\frac{1444}{5} + \frac{3844}{7} + \frac{1225}{6}) - 1012.5$$
$$SSA = (288.8 + 549.143 + 204.167) - 1012.5$$
$$SSA = 1042.11 - 1012.5 = 29.61$$
(注:这里保留了两位小数,计算过程可能有微小舍入误差) -
组内平方和 (SSE, Sum of Squares Error):
$$SSE = SST - SSA$$
$$SSE = 48.5 - 29.61 = 18.89$$
第四步:计算自由度 (Degrees of Freedom)与均方 (Mean Square)
-
自由度:
- 组间自由度 ($df_A$) = 组数 $k - 1 = 3 - 1 = 2$
- 组内自由度 ($df_E$) = 总样本 $N - 组数 k = 18 - 3 = 15$
- 总自由度 ($df_T$) = $N - 1 = 17$
-
均方 (Mean Square):
- 组间均方 ($MSA$) = $SSA / df_A = 29.61 / 2 = 14.805$
- 组内均方 ($MSE$) = $SSE / df_E = 18.89 / 15 \approx 1.259$
第五步:计算检验统计量 F值
$$F = \frac{MSA}{MSE} = \frac{14.805}{1.259} \approx 11.76$$
第六步:查表与决策
-
临界值: 我们需要查找F分布表。
- 显著性水平 $\alpha = 0.05$
- 分子自由度 = 2
- 分母自由度 = 15
- 查表得 $F_{0.05}(2, 15) = 3.68$ (大约值,具体看课本附表,通常是3.68)
-
比较:
$$F_{计算值} (11.76) > F_{临界值} (3.68)$$ -
结论:
因为计算出的F值落在拒绝域内(远大于临界值),所以我们拒绝零假设 ($H_0$)。
最终结论
在 $\alpha=0.05$ 的显著性水平下,管理者的层次不同会导致评分有显著差异。
(从数据也能直观看出:中级管理者评分很高[均值~8.9],而初级管理者评分较低[均值~5.8],差异很明显)。
双因素方差分析(Two-Way ANOVA)比单因素稍微复杂一点,因为它不仅要看两个因素各自的影响(主效应),还要看它们凑在一起会不会产生化学反应(交互效应)。
考试重点:通常绝不会让你手算双因素的 SSA、SSB、SSAB 等繁琐数据(计算量太大),而是像 10.4 那样,给你一个半成品的表格,让你填空并做决策。
我们把 10.4 改造一下,这就成了一个标准的双因素方差分析考题:
【模拟考题】10.4 改编版(双因素方差分析)
场景描述:
某企业为了提高生产效率,想研究两个因素对“每小时组装产品数量”的影响:
- 因素 A(组装方法):有 3 种方法(A1, A2, A3)。
- 因素 B(工龄长短):有 2 个水平(熟练工、新员工)。
企业随机抽取了 30 名工人进行试验(每个“方法+工龄”的组合里分配了 5 人,即 $3 \times 2 \times 5 = 30$ 人),得到如下部分方差分析表。
已知信息:
- 总样本量 $n = 30$。
- 误差(组内)均方 $MSE = 10$。
- 显著性水平 $\alpha = 0.05$。
方差分析表(请填空):
| 差异源 | 平方和 (SS) | 自由度 (df) | 均方 (MS) | F 值 | F 临界值 ($F_{crit}$) |
|---|---|---|---|---|---|
| 因素 A (方法) | 100 | (1) __ | 50 | (4) __ | 3.40 |
| 因素 B (工龄) | 80 | (2) __ | 80 | (5) __ | 4.26 |
| 交互作用 (A $\times$ B) | 300 | (3) __ | 150 | (6) __ | 3.40 |
| 误差 (组内) | 240 | 24 | 10 | — | — |
| 总计 | 720 | 29 | — | — | — |
问题:
- 计算表格中 (1) ~ (6) 处的数值。
- 检验 交互作用 是否显著?这意味着什么?
- 检验 因素 A(组装方法) 和 因素 B(工龄) 是否对产量有显著影响?
【解题与解析】
这种题目的解题逻辑是“拼图”。
1. 填补表格 (1) ~ (6)
第一步:搞定自由度 (df)
这是最简单的部分,背公式即可:
- 因素 A 的自由度 ($df_A$) = 水平数 - 1 = $3 - 1 = 2$。 -> (1) 填 2
- 因素 B 的自由度 ($df_B$) = 水平数 - 1 = $2 - 1 = 1$。 -> (2) 填 1
- 交互作用的自由度 ($df_{AB}$) = $df_A \times df_B = 2 \times 1 = 2$。 -> (3) 填 2
(检查:$2 + 1 + 2 + 24 = 29$,总自由度吻合)
第二步:计算 F 值
公式永远是:$F = \frac{\text{某因素的MS}}{\text{误差的MSE}}$
题目已知误差 $MSE = 10$。
-
因素 A 的 F 值:
$$F_A = \frac{MS_A}{MSE} = \frac{50}{10} = 5$$ -> (4) 填 5 -
因素 B 的 F 值:
$$F_B = \frac{MS_B}{MSE} = \frac{80}{10} = 8$$ -> (5) 填 8 -
交互作用 的 F 值:
$$F_{AB} = \frac{MS_{AB}}{MSE} = \frac{150}{10} = 15$$ -> (6) 填 15
2. 检验交互作用 (Interaction Effect)
这是双因素分析中最关键的一步。我们先看交互作用。
- 假设:$H_0$: 不存在交互作用(方法和工龄互不影响)。
- 判断:
- 计算出的 $F_{AB} = 15$
- 临界值 $F_{crit} = 3.40$
- $15 > 3.40$,落入拒绝域。
- 结论:拒绝零假设,交互作用非常显著。
这“意味着什么”?(考试常考的简答)
这意味着**“工龄”对产量的影响,依赖于使用的是哪种“方法”**(或者反过来说)。
举例解释:可能对于“熟练工”来说,方法 A 最快;但对于“新员工”来说,方法 A 太难了反而最慢,方法 C 最快。单纯说“方法A好”或者“熟练工快”是不准确的,必须结合起来看。
3. 检验主效应 (Main Effects)
虽然交互作用显著时,单独讨论主效应有时会失真,但考试通常还是会让你判断一下。
-
因素 A (组装方法):
- $F_A = 5 > F_{crit} = 3.40$
- 结论:显著。不同的组装方法对产量有差异。
-
因素 B (工龄):
- $F_B = 8 > F_{crit} = 4.26$
- 结论:显著。不同的工龄对产量有差异。
总结:双因素方差分析怎么考?
- 填表题:利用 $df$ 的加减关系,以及 $F = MS/MSE$ 的关系填空。
- 概念题:自由度怎么算?
- $A$ 的自由度 = $a-1$
- $B$ 的自由度 = $b-1$
- 交互自由度 = $(a-1)(b-1)$
- 误差自由度 = $ab(r-1)$ (其中r是每组样本数)
- 决策题:先看交互作用。如果交互作用显著,说明两个因素搅在一起了,不能简单地只看单因素。
练习一下:
明白,这种题型在考试中非常常见:考逻辑关系而不是考计算器手速。
这就为你出一个单因素方差分析的“填空题”,完全模仿 10.4 的风格。
【模拟考题】单因素方差分析(填表练习)
场景描述:
某销售公司为了提升业绩,试图比较 3 种不同的销售话术(A、B、C) 的效果。公司随机挑选了 18 名 销售人员,平均分成 3 组,每组使用一种话术。一个月后,记录他们的销售额(单位:万元)。
对数据进行方差分析后,得到如下残缺的表格。请利用已知信息补全表格,并进行检验。
已知信息:
- 总平方和 ($SST$) = 600
- 组内平方和 ($SSE$) = 150
- 显著性水平 $\alpha = 0.05$
方差分析表:
| 差异源 | 平方和 (SS) | 自由度 (df) | 均方 (MS) | F | P-value | F crit |
|---|---|---|---|---|---|---|
| 组间 (话术) | (1) _____ | (2) _____ | (4) _____ | (6) _____ | 0.00012 | 3.68 |
| 组内 (误差) | 150 | (3) _____ | (5) _____ | — | — | — |
| 总计 | 600 | 17 | — | — | — | — |
问题:
- 计算表格中 (1) ~ (6) 处的数值。
- 根据计算结果,检验 3 种销售话术的效果是否有显著差异?(写出判断依据)
🛑 先自己拿笔算一下,再看下面的解析
.
.
.
.
.
.
.
【答案解析】
1. 填补表格数值
这是一道典型的“倒推/顺推”题。
-
第 (1) 空:组间平方和 ($SSA$)
- 公式:$SST = SSA + SSE$
- 计算:$SSA = SST - SSE = 600 - 150 = \mathbf{450}$
-
第 (2) 空:组间自由度 ($df_A$)
- 公式:$k - 1$ ($k$是组数,题目说了是 3 种话术)
- 计算:$3 - 1 = \mathbf{2}$
-
第 (3) 空:组内自由度 ($df_E$)
- 公式:总自由度 - 组间自由度(或者 $N-k$)
- 计算:$17 - 2 = \mathbf{15}$
- (验证:$N=18, k=3 \rightarrow 18-3=15$,正确)
-
第 (4) 空:组间均方 ($MSA$)
- 公式:$SSA / df_A$
- 计算:$450 / 2 = \mathbf{225}$
-
第 (5) 空:组内均方 ($MSE$)
- 公式:$SSE / df_E$
- 计算:$150 / 15 = \mathbf{10}$
-
第 (6) 空:F 值
- 公式:$MSA / MSE$
- 计算:$225 / 10 = \mathbf{22.5}$
填好的完整表格:
| 差异源 | SS | df | MS | F |
|---|---|---|---|---|
| 组间 | 450 | 2 | 225 | 22.5 |
| 组内 | 150 | 15 | 10 | |
| 总计 | 600 | 17 |
2. 检验结论
步骤 A:提出假设
- $H_0$: $\mu_1 = \mu_2 = \mu_3$ (三种话术效果一样)
- $H_1$: 三种话术效果不全相等
步骤 B:判断
这里可以用两种方法判断(考试时任选一种即可):
-
方法 1:看 F 值
- 计算得到的 $F = 22.5$
- 表格给出的临界值 $F_{crit} = 3.68$
- 因为 $22.5 > 3.68$,F值落入拒绝域。
-
方法 2:看 P-value
- 表格给出的 $P\text{-value} = 0.00012$
- 显著性水平 $\alpha = 0.05$
- 因为 $0.00012 < 0.05$,拒绝零假设。
结论:
拒绝零假设。有充分证据表明,3 种销售话术的销售业绩存在显著差异。
如果你能做对上一题,说明你对自由度(df)的加减关系以及 F=MS/MSE 的核心逻辑已经完全掌握了。
双因素方差分析的填表题,难点主要在于自由度(df)的分配。只要这一步搞定,后面全是简单的除法。
准备好了吗?来挑战这道双因素的“终极填空题”。
【模拟考题】双因素方差分析(填表进阶)
场景描述:
某农业研究所想研究 “肥料种类” 和 “种植密度” 对小麦产量的影响。
- 因素 A(肥料):选用了 3 种 肥料。
- 因素 B(密度):选用了 2 种 密度。
- 试验共使用了 24 块 试验田(即总样本量 $N=24$),所有条件下的重复次数相同。
数据处理后得到如下方差分析表(部分数据缺失)。
已知信息:
- 总平方和 ($SST$) = 250
- 显著性水平 $\alpha = 0.05$
- 部分临界值:$F_{crit}(1, 18) = 4.41$, $F_{crit}(2, 18) = 3.55$
方差分析表:
| 差异源 | 平方和 (SS) | 自由度 (df) | 均方 (MS) | F |
|---|---|---|---|---|
| 因素 A (肥料) | 100 | (1) _____ | (4) _____ | (7) _____ |
| 因素 B (密度) | 20 | (2) _____ | 20 | (8) _____ |
| 交互作用 (A $\times$ B) | 40 | (3) _____ | 20 | (9) _____ |
| 误差 (组内) | (10) _____ | 18 | (5) _____ | — |
| 总计 | 250 | (6) _____ | — | — |
问题:
- 填空:计算表格中 (1) ~ (10) 处的数值。(这是最关键的一步!)
- 决策:
- 交互作用是否显著?
- **因素 A(肥料)**对产量是否有显著影响?
- **因素 B(密度)**对产量是否有显著影响?
💡 小提示(解题锦囊)
- 自由度:记得 $A$ 是 3 水平,$B$ 是 2 水平,总数是 24。
- SS关系:总SS = A + B + AB + 误差。
- 核心分母:算 F 值的时候,分母永远是 误差的 MS。
请动手算一下,然后往下看答案!
.
.
.
.
.
.
.
.
【答案解析】
第一步:填补自由度 (df) —— 也就是 (1), (2), (3), (6)
这是解题的突破口。
- 因素 A ($df_A$): 水平数 - 1 = $3 - 1$ = 2 $\rightarrow$ (1)
- 因素 B ($df_B$): 水平数 - 1 = $2 - 1$ = 1 $\rightarrow$ (2)
- 交互作用 ($df_{AB}$): $df_A \times df_B = 2 \times 1$ = 2 $\rightarrow$ (3)
- 总自由度 ($df_T$): 总样本量 - 1 = $24 - 1$ = 23 $\rightarrow$ (6)
- 检查验证:$df_A + df_B + df_{AB} + df_{Error} = 2 + 1 + 2 + 18 = 23$。完美吻合!
第二步:填补平方和 (SS) —— 也就是 (10)
利用加减法关系。
- 误差平方和 ($SSE$):
$SSE = SST - (SS_A + SS_B + SS_{AB})$
$SSE = 250 - (100 + 20 + 40) = 250 - 160$ = 90 $\rightarrow$ (10)
第三步:计算均方 (MS) —— 也就是 (4), (5)
利用公式 $MS = SS / df$。
- 误差均方 ($MSE$): (最重要的一个数,因为它是F值的分母!)
$MSE = SSE / df_E = 90 / 18$ = 5 $\rightarrow$ (5) - 因素 A 均方 ($MS_A$):
$MS_A = 100 / 2$ = 50 $\rightarrow$ (4)
第四步:计算 F 值 —— 也就是 (7), (8), (9)
利用公式 $F = MS_{某因素} / MSE$。
- 因素 A 的 F: $50 / 5$ = 10 $\rightarrow$ (7)
- 因素 B 的 F: (注意表里给了 $MS_B=20$)
$20 / 5$ = 4 $\rightarrow$ (8) - 交互作用的 F: (表里给了 $MS_{AB}=20$)
$20 / 5$ = 4 $\rightarrow$ (9)
最终完整表格
| 差异源 | SS | df | MS | F |
|---|---|---|---|---|
| A (肥料) | 100 | 2 | 50 | 10 |
| B (密度) | 20 | 1 | 20 | 4 |
| A $\times$ B | 40 | 2 | 20 | 4 |
| 误差 | 90 | 18 | 5 | — |
| 总计 | 250 | 23 | — | — |
第二部分:决策与结论
1. 交互作用显著吗?
- $F_{AB} = 4$
- 查临界值:交互作用的自由度是 (2, 18),对应的临界值是 3.55。
- 比较:$4 > 3.55$
- 结论:显著! (意味着肥料的效果受种植密度影响,反之亦然)。
2. 因素 A (肥料) 显著吗?
- $F_A = 10$
- 查临界值:自由度 (2, 18),临界值 3.55。
- 比较:$10 > 3.55$
- 结论:显著! (不同肥料确实导致产量不同)。
3. 因素 B (密度) 显著吗?
- $F_B = 4$
- 查临界值:自由度 (1, 18),对应的临界值是 4.41。
- 比较:$4 < 4.41$ (注意这里!)
- 结论:不显著。 (单纯看密度这一项,差异没那么大,或者被误差掩盖了)。
做题总结
如果这道题你也能做对,尤其是算出了 MSE = 5 并且正确判断了 密度是不显著的,那你的方差分析这块内容(ANOVA)已经可以去考试了!满分预定!🎉




