如何檢驗多重共線性的嚴重程度 spss線性回歸模型的四個標準假設?
土壤和植被養(yǎng)分是影響作物產量的重要因素。為了探討土壤和葉片營養(yǎng)元素對作物產量的影響,在某地區(qū)30個樣地測定了作物產量、土壤pH值、有機質含量(SOM)、堿解氮含量(SAN)、有效磷含量(SAP)、葉片
土壤和植被養(yǎng)分是影響作物產量的重要因素。為了探討土壤和葉片營養(yǎng)元素對作物產量的影響,在某地區(qū)30個樣地測定了作物產量、土壤pH值、有機質含量(SOM)、堿解氮含量(SAN)、有效磷含量(SAP)、葉片氮含量(STN)和磷含量(STP)。一些數據如下:
注:表中數據隨機生成,不能用于其他用途。
在本研究中,我們希望建立變量(pH、SOM、SAN等)之間的回歸方程。)和產量。這時候可以考慮采用多元線性回歸分析。
數據分析
值得注意的是,多元線性回歸分析要求數據滿足以下四個假設:
(1)至少需要2個自變量,且相互獨立(本次為6個);
(2)因變量是連續(xù)變量(這種情況下的輸出是連續(xù)變量);
(3)數據具有方差齊性、無異常值、正態(tài)分布的特點(檢驗方法);
(4)自變量之間不存在多重共線性。
前兩個假設可以根據實驗設計直接判斷;假設(3)的測試已經在前面的教程中介紹過了,單擊 "測試方法 "查看它。
假設(4)的檢驗方法如下:
1.點擊分析→回歸→線性。
2.在自變量框中選擇自變量,如pH,在因變量框中選擇輸出,然后單擊統(tǒng)計。
3.在統(tǒng)計窗口中選擇共線性診斷,單擊繼續(xù),然后單擊主頁上的確定。
4.結果判斷:我們只需要關注結果中的系數表。當VIF值大于或等于10時,我們認為變量之間存在嚴重的共線性。當VIF值小于10時,我們認為數據基本符合多元線性分析的假設(4),即不存在多重共線性問題。
所以這種情況下的數據都滿足以上四個假設,可以進行多元線性回歸。
SPSS分析步驟
一.準備工作
SPSS軟件(我用的是IBM SPSS Statistics 25的中文版,其實每個版本的模式都差不多。如果需要我的版本,可以直接點擊(安裝包)下載;
共線性會導致系數估計的標準差增加。同樣,可以通過自變量的相關矩陣進行診斷?;蛘呤褂猛ㄓ肰IF進行診斷。
在了解了多重共線性是如何影響我們對模型的分析和預測能力之后,學習如何檢測數據中多重共線性的存在是非常重要的。
隨著以下方法可用于檢測多重共線性:
r平方值較大,但作為β-權值統(tǒng)計意義不大,即整體模型的F檢驗顯著,但個別系數估計的T檢驗不顯著。
變量對之間有很大的相關性。
差別通貨膨脹系數。