當配適一個迴歸或 ANOVA 模型時,我應該在殘差圖中檢查什麼?
殘差圖中的圖形模式
常態機率圖中的圖形
殘差的常態機率圖應該大致為一條直線。下列這些圖形可以確定殘差不是常態:
圖形 |
圖形代表什麼 |
非直線 |
非常態 |
尾部為曲線 |
偏斜 |
遠離直線的點 |
異常值 |
斜率不斷改變 |
未確定的變數 |
▲註
如設計僅有固定因數,設計為平衡或幾近平衡,且您具有足夠多的觀察值,則略微偏離常態不會嚴重影響結果。
下列圖形違反了誤差為常態分配的假設。
S 曲線表示長尾分配。
反向 S 曲線表示短尾分配。
下凸曲線表示非對稱分配。
遠離線的幾個點表示分佈中有異常值。
如果發現非常態圖形:
1. 使用其它診斷圖來確定非常態是否由非常態母體中的數據之外的因素所導致。
2. 使用 Stat > Basic Statistics > Normality Test 來進行非常態檢定。
3. 如果確定數據來自非常態母體,則可以在繼續分析之前轉換數據。
▲註 修正變異不一致問題的轉換方法通常也可修正常態問題。
殘差與配適值圖中的圖形
這些圖形可以確定不是隨機誤差:
圖形 |
圖形代表什麼 |
殘差相對於配適值呈現扇形或不均勻分散 |
變異不相等 |
曲線 |
缺少高階項 |
一系列遞增或遞減的點 |
異常值 |
正殘差佔優勢或負殘差佔優勢 |
異常值 |
遠離 0 的點 |
異常值 |
在 x 方向遠離其它點的點 |
有影響點 |
下列圖形顯示異常值和違反誤差一致性的假設。
異常值圖
右上角的殘差比此圖中其他所有殘差都大很多,因此為異常值。如果異常值夠多,此模型可能不被接受。異常值可能是由於測量錯誤所導致。您應該調查異常值以確定其原因。
變異不一致圖
殘差的變異隨配適值增加。請注意,隨著配適值的增加,殘差在零殘差線周圍分散的更廣,表示不相等的變異 (不一致)。此圖形表示誤差的變異隨平均數的增加而增加。數據的轉換會有助於穩定這些變異。
非隨機圖形 |
解決圖形問題的步驟 |
變異不一致 |
首先,使用 Stat > ANOVA > Test for Equal Variances 來檢驗變異一致的假設 如果圖或檢定表示變異不一致,則考慮轉換反應變數。 |
離群值或影響點 |
首先,檢驗觀察值並非測量或數據輸入錯誤。 考慮進行分析時不包括此觀察值來確定它是否影響結果。 |
缺少高階項 |
增加高階項並重新配適模型。 |
殘差與順序圖中的圖形
圖中的殘差應該在中心線附近隨機波動。下列圖形違反了誤差彼此獨立的這一假設。
隨著觀察值的順序由左至右增加,殘差系統性的降低。
殘差的值從低 (左) 到高 (右) 突然變化。
您應該至少考慮下列一種補救措施:
1.由於誤差的非獨立性往往難以修正,因此如果要進行實驗設計,應該盡量透過隨機化進行以防止出現這種問題。
2. 在模型中增加一個時間效應可消除誤差項的相關性。例如:您要檢驗幾個月內的每日收入,增加一個表示一週中某天的因數,會消除誤差項中的非獨立性。
殘差與變數圖中的圖形
這些圖形可以表示某種問題:
圖形 |
圖形代表什麼 |
殘差出現趨勢 |
該變數正系統性地影響反應結果。如果該變數不在模型中,請為該變數增加一項並重新配適模型。 |
點出現彎曲 |
應該在模型中包括該變數的高階項。例如:曲線圖形表示您應該增加一個次方項。 |