SPSS 

卡方檢定 (Chi-square Test) 小筆記

在之前有提到ANOVA (這邊)
ANOVA是用來檢視不同的組別
比方說豚骨拉麵和奶油烏龍兩種麵之間得分有沒有明顯差異

 

而麵類就是屬於類別變項(因子有兩種水準:豚骨拉麵、奶油烏龍)
而得分就是連續的
這種就適合用ANOVA

 

但是如果今天我們想要討論的是:

這間店推出套餐:
+附餐大爽滿足套餐

 

麵類有:(1)豚骨拉麵、(2)奶油烏龍、(3)紅醬義大利麵
附餐有:(1)味噌醬炸豬排、(2)鹽烤鯖魚片、(3)羅勒蕃茄披薩
我們想知道點餐的人
在點麵和點飯的種類上是不是有關聯
比方說是不是點豚骨拉麵的人也會特別搭豬排?
這種就適合用卡方

 

Ho點什麼麵和點什麼附餐無關 (點什麼麵不影響點什麼附餐,也就是獨立)
H1點什麼麵和點什麼附餐有關

 

只是這樣要怎麼比較呢?
首先把資料整理一下
因為是類別變項所以基本上就是跟次數有關
麵類分別是(豚骨拉麵)、(奶油烏龍)、(義大利麵)
配餐則是(豬排)、(烤鯖魚片)、(披薩)

卡方檢定  
 

把總共50個客人點的套餐整理次數如下表
左邊是麵上面是附餐

卡方檢定  

但是我們想要驗證看看這樣的次數分配
是不是麵和附餐是有關、或者獨立互不影響

 

所謂獨立就代表說一個細格(就裡面的格子)會是兩個邊際的機率相乘
所以說比方像點豚骨拉麵、又點豬排的人
出現機率應該是豚骨拉麵的機率乘上豬排的機率
也就是
(16/50) x (17/50) = 272/250 = .1088
那那格期望的值就應該是 50 x .1088 = 5.44

所以整理如下表的話
表中的細格部份就是期望的次數

卡方檢定  
 

 

我們想知道到底實際上的值(觀察值)和期望相距大不大
所以卡方的公式就用這樣:

卡方檢定

因為那個長得像x的唸chi(開)
然後有平方所以叫Chi-square
也因此翻譯作卡方

 

計算如下:

(7-5.44)2/5.44 + (9-5.44)2/5.44 + (0-5.12)2/5.12 + ...... + (11-5.44)2/5.44
= 1.562/5.44 + 3.562/5.44 + 5.122/5.12 + ...... + 5.562/5.44
= 18.04

這個用excel拉一拉就出來了
或者用spss也可以

跑出來的值就要看它的自由度
然後再去查表
本例的自由度是(3-1)x(3-1)=4
前面3是麵有三種、後面的3是附餐有三種

根據查表可得知

卡方檢定  結果是顯著的

也就是說
要拒絕掉虛無假設(H0:兩者是獨立的)
表示兩者並非獨立
對主餐麵食的選擇和選擇的附餐是有關聯的!

這種作法就是卡方檢定的其中一種功能:獨立性考驗 (或稱關聯性考驗)



SPSS步驟

如果是像上面的例子
在SPSS裡是在敘述統計→交叉表

卡方檢定 

 

 

把一個放列一個放欄
點選統計量

卡方檢定

 

 

把卡方分配打勾

 卡方檢定 

 

 

 跑出來結果就會像這樣:

卡方檢定 

他結果跟我們計算的結果一樣
會先幫我們把次數表先做出來
然後下面就會有卡方檢定
看第一個Pearson卡方的值和顯著性
來決定是否拒絕虛無假設

結果要回報的話可以寫:
卡方檢定結果顯示麵食與附餐選擇之間具顯著關係(X2(4)=18.036, p=.001)。

 

 

不過這篇舉例的數字其實並不是那麼正確
因為卡方其實有一些限制比方細格不可為0、且80%以上大於5才能夠讓剩下20%限制下修至1
所以說在做之前,應該要注意Data要收到多少才能跑卡方~

(待補)

創作者介紹
創作者 belleaya (愛) 的頭像
belleaya (愛)

B E L L E A Y A 雜七雜八創作小窩

belleaya (愛) 發表在 痞客邦 留言(17) 人氣()