卡方檢定 (Chi-square Test) 小筆記
在之前有提到ANOVA (這邊)
ANOVA是用來檢視不同的組別
比方說豚骨拉麵和奶油烏龍兩種麵之間得分有沒有明顯差異
而麵類就是屬於類別變項(因子有兩種水準:豚骨拉麵、奶油烏龍)
而得分就是連續的
這種就適合用ANOVA
但是如果今天我們想要討論的是:
這間店推出套餐:
麵+附餐→大爽滿足套餐
麵類有:(1)豚骨拉麵、(2)奶油烏龍、(3)紅醬義大利麵
附餐有:(1)味噌醬炸豬排、(2)鹽烤鯖魚片、(3)羅勒蕃茄披薩
我們想知道點餐的人
在點麵和點飯的種類上是不是有關聯
比方說是不是點豚骨拉麵的人也會特別搭豬排?
這種就適合用卡方
Ho:點什麼麵和點什麼附餐無關 (點什麼麵不影響點什麼附餐,也就是獨立)
H1:點什麼麵和點什麼附餐有關
只是這樣要怎麼比較呢?
首先把資料整理一下
因為是類別變項所以基本上就是跟次數有關
麵類分別是豚(豚骨拉麵)、奶(奶油烏龍)、義(義大利麵)
配餐則是豬(豬排)、魚(烤鯖魚片)、披(披薩)
把總共50個客人點的套餐整理次數如下表
左邊是麵上面是附餐
但是我們想要驗證看看這樣的次數分配
是不是麵和附餐是有關、或者獨立互不影響
所謂獨立就代表說一個細格(就裡面的格子)會是兩個邊際的機率相乘
所以說比方像點豚骨拉麵、又點豬排的人
出現機率應該是豚骨拉麵的機率乘上豬排的機率
也就是
(16/50) x (17/50) = 272/250 = .1088
那那格期望的值就應該是 50 x .1088 = 5.44
所以整理如下表的話
表中的細格部份就是期望的次數
我們想知道到底實際上的值(觀察值)和期望相距大不大
所以卡方的公式就用這樣:
因為那個長得像x的唸chi(開)
然後有平方所以叫Chi-square
也因此翻譯作卡方
計算如下:
(7-5.44)2/5.44 + (9-5.44)2/5.44 + (0-5.12)2/5.12 + ...... + (11-5.44)2/5.44
= 1.562/5.44 + 3.562/5.44 + 5.122/5.12 + ...... + 5.562/5.44
= 18.04
這個用excel拉一拉就出來了
或者用spss也可以
跑出來的值就要看它的自由度
然後再去查表
本例的自由度是(3-1)x(3-1)=4
前面3是麵有三種、後面的3是附餐有三種
根據查表可得知
結果是顯著的
也就是說
要拒絕掉虛無假設(H0:兩者是獨立的)
表示兩者並非獨立
對主餐麵食的選擇和選擇的附餐是有關聯的!
這種作法就是卡方檢定的其中一種功能:獨立性考驗 (或稱關聯性考驗)
SPSS步驟
如果是像上面的例子
在SPSS裡是在敘述統計→交叉表
把一個放列一個放欄
點選統計量
把卡方分配打勾
跑出來結果就會像這樣:
他結果跟我們計算的結果一樣
會先幫我們把次數表先做出來
然後下面就會有卡方檢定
看第一個Pearson卡方的值和顯著性
來決定是否拒絕虛無假設
結果要回報的話可以寫:
卡方檢定結果顯示麵食與附餐選擇之間具顯著關係(X2(4)=18.036, p=.001)。
不過這篇舉例的數字其實並不是那麼正確
因為卡方其實有一些限制比方細格不可為0、且80%以上大於5才能夠讓剩下20%限制下修至1
所以說在做之前,應該要注意Data要收到多少才能跑卡方~
(待補)
留言列表