GLM中的斜率檢驗,斜率的顯著性檢驗
Excel數據分析工具庫是個很強大的工具,可以滿足基本的統計分析,這里介紹用Excel數據分析工具庫中的回歸做回歸分析。
本節知識點:
??在經過GLM描述之后,分析的對象就發生了 。原本是對Y的統計分析,現在轉向了擬合得到的β。SPM得到的腦功能激圖實際上就是根據對參數β的統計推斷而得到的。概率論里面有兩個主要的研究內容,參數估計和假。
Excel數據分析工具庫—回歸
線性回歸和非線性回歸
簡單線性回歸和多重線性回歸
邏輯斯蒂回歸
一、什么是回歸分析(Regression)
1、定義
確定兩種或兩種以上變量間相關關系的一種統計分析方法。通過數據間相關性分析的研究,進一步建立自變量(i=1,2,3,…)與因變量Y之間的回歸函數關系,即回歸分析模型,從而預測數據的發展趨勢。
2、分類
按照涉及的變量的多少,分為一元回歸和多元回歸分析;
:t Stat 和·P-value 是檢驗得到的Coefficients 值用的。 如果t檢驗值的絕對值大于2或者P檢驗值絕對值小于0.05,就是顯著的。要拒絕原假設。 相關分析的話要看相關系數,也就是Multiple R,越接近1相關程度越高。 好。
按照因變量的多少,可分為簡單回歸分析和多重回歸分析;
按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。
二、線性回歸
1、簡單線性回歸
簡單線性回歸又叫一元線性回歸,即回歸模型中只有一個自變量和一個因變量,其回歸方程可以表示為:
Y=a+bx+
其中,Y表示因變量,x表示自變量,a是 常數,b是斜率。
是隨機誤差。
2、最小二乘法:
如何確定參數a和b,則要用最小二乘法來實現。通過最小化誤差的平方和尋找數據的最佳函數匹配,斜率的顯著性檢驗,即使得觀測點和估計點的距離的平方和最小。,
3、線性回歸分析的步驟:
確定自變量和因變量
其次,檢驗性別交互作用的假設,即女性和男性研究被試在相關斜率上可能存在顯著差異。基于此,本研究建立了一個新的GLM,再次使用年齡作為回歸因素,以揭示女性被試相比男性被試會在哪些區域表現出更高/更陡峭的增長,反之亦然。該分析旨在復制先。
繪制散點圖,確定回歸模型類型
估計模型參數,建立回歸模型:最小二乘法進行模型參數估計
對回歸模型進行檢驗
利用回歸模型進行預測
4、多重線性回歸
定義:一個因變量與多個自變量的線性回歸問題,是一元線性回歸的推廣。其回歸方程可以寫為:
多重線性回歸方程中回歸系數的估計也是用到最小二乘法
那么問題來了,如何用GLM或者LM分析兩個處理件的差異呢?其實可以簡單的用上圖的擬合直線的斜率來解釋,如果不同處理之間存在差異,那么這個擬合線的斜率必定不為零,也就是與X軸平行。但是這是一種便于理解的方式(雖然你也未必能理解),實。
三、用Excel做回歸分析
我們研究銷售額Y和推廣費用X1之間的關系,數據如下:
首先我們用數據分析—相關系數分析計算一下自變量和因變量之間的相關系數為0.95157,為強相關。
繪制散點圖如下:
然后,我們用數據分析庫里的回歸來做分析
注意Y值和X值輸入區域,X值是自變量,Y是因變量。
四、線性回歸方程的檢驗
評價回歸擬合程度好壞(重要):
其他列統計簡易的線性回歸和相關性計算含置信區間的斜率和截距。強制回歸線穿過指定點。擬合以復制 Y 值或均值 Y。其他線性回歸廣義線性模型(GLM)使用新的多變量數據表生成多個自變量與單個因變量的相關模型。多元線性回歸(。
2、 回歸統計表中的R Square是R平方值,R平方即R的平方,又可以叫判定系數、擬合優度,取值范圍是[0,1],R平方值越大,表示模型擬合的越好。一般大于70%就算擬合的不錯,60%以下的就需要修正模型了。這個案例里R平方0.9054,相當不錯。
4、 第二張表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F統計量,Significance F是回歸方程總體的顯著性檢驗,其中我們主要關注F檢驗的結果,即Significance F值,F檢驗主要是檢驗因變量與自變量之間的線性關系是否顯著,用線性模型來描述他們之間的關系是否恰當,越小越顯著。這個案例里F值很小,說明因變量與自變量之間顯著。
5、 殘差是實際值與預測值之間的差,殘差圖用于回歸診斷,回歸模型在理想條件下的殘差圖是服從正態分布的。
這里簡單總結了一下什么是回歸分析,如何用excel做線性回歸分析,以及如何評價回歸方程擬合程度的好壞。入門很簡單,精通還很遙遠,我們都在學習中。
版權聲明:本站文章均來源于網絡,如有侵權請聯系刪除!