SPSS  

定性變數 與 定量變數 以及可用的統計圖

對於要處理的資料
在處理之前一定要先瞭解他是什麼樣的資料
它的特性是什麼
也才能夠知道怎麼去畫圖、怎麼去選擇統計方法
出來的結果也才能夠去解釋它

一般來說
資料分為兩大類
一種叫定性變數
一種叫定量變數

 

◎定性變數 = 質變數 = 類別變數

變數本身沒辦法以數量、數值呈現
僅能代表不同的類別
比方:血型、性別、年級、職等

這邊我們可以發現有的類別像是性別就是沒有高低之分
但職等、年級是有高低之分的
所以要細分的話
定性變數可以再細分為以下兩種:

一般類別
例如問卷中設定的「性別」
作答後的資料庫可以用1代表男性、0代表女性

或是對於三個班級做準實驗時「班別」
第一個班用1代表、第二個班用2、第三個班用3表示

這些變數本身就只是分類
並沒有高低差異
所以這種變數做平均、標準差等是沒有任何意義的

等級類別
比方產業中央銀行裡的職等有「課長」、「分行長」、「次長」、「部長」......等
同樣可以用數字來表示不同職等
像是3代表課長、5代表分行長、8代表次長、10代表部長等等
雖然數字越大代表職位越高
只是數字之間的差距並不是等量也就是說分行長5、部長10
至不代表部長就是分行長的兩倍

同樣的年級如果用1~6表示一到六年級
也不代表六年級是一年級的六倍
所以這種變數做平均、標準差也都是沒有意義

 

用來表示定性變數的統計圖型可以用:
1. 條形圖/長條圖 (Bar chart)

長條圖 (bar chart)   
橫軸代表類別 (如本例1代表男、0代表女)
縱軸代表次數、相對次數或百分比等等 (如本例就是人數,男113人、女95人)
要注意的是類別的條與條之間不相連

 

2. 圓餅圖/單圓圖 (Pie chart)

圓餅圖/單圓圖 (pie chart)  
  

這種圓餅圖就是用來顯示「各類別的資料的次數」佔「全部次數」的百分比
整個圓是100%
半圓就是50%
依此類推本圖例是用不同的拉麵種類(1:醬油;2:豚骨;3:味噌;4:鹽味)
分別賣140碗、162碗、165碗、128碗 (共595碗)
也就是分別佔大約 23.5%、27.2%、27.7%、21.5% (共100%)
畫成圖的話就分別佔了360角裡的84.7、98.0、99.8、77.4
也就如上面圖所示
對於瞭解不同類別所佔的百分比更容易一目瞭然

 

3. 柏拉圖/巴瑞多圖 (Pareto diagram)

這個柏拉圖是指義大利的經濟學家Pareto
跟古希臘哲學家的那個柏拉圖(Plato)是無關的呦!!
(有些書為了區別而翻譯成巴瑞多圖,但很多統計軟體還是翻柏拉圖)此外Pareto diagram也是「品管的七大工具」之一
目的在於協助品質改善

柏拉圖的原理核心是「Major few, trivial many. 」(重要少數,瑣碎多數)
找出重要、關鍵的原因
來針對重要的問題改善
則其他細碎的不用管它也會跟著改善
這原理又稱ABC原理(A~Z有26字母中只挑前面重要的)、80/20原理
改善前後各畫柏拉圖
來比較是否有效改善那些關鍵問題

柏拉圖 (Pareto diagram) 
以上面這圖為例
先看右邊的座標和上面的累計折線圖
可以發現用餐的錢、書錢加起來已經84.98%
也就代表這兩者是佔了超過80%的重要關鍵花費
(也就是80/20原理;當然80%是個建議的原則~不是一定要80%)
想要改善、節省花費就從這兩項來改
最起碼改善吃飯花的錢
比方不要吃宵夜啦、花錢買飲料啦之類的

不過如果沒有打算要改善問題
就不用畫柏拉圖了
直接用長條圖或圓餅圖即可

※話說,用excel 2010要畫柏拉圖有點麻煩......以後有機會再講怎麼畫

 

◎定量變數 = 量變數 = 數值變數

這種變數的數字代表的就是數量
比方:年收入、成績、網站瀏覽人次、體重、身高......等

同樣的也可以把這種表示數量的分兩類:

離散型
這種是經由計數的方式就像算人頭算出幾個就是幾個人
例如「今天拉麵店的豚骨拉麵賣出了207碗」
那就是207整數
原始資料中不會有什麼207.35碗這種情形
或是「班上有45人」
那就是45個人
再多增加人的話就是46、47、48......
原始資料中不會有46.75人這種情形
這種就叫做離散型
數值是不連續的

連續型
最基本的像是「體重跟身高」
這種就是連續型的

數值變數在做像平均數、標準差
就都有它的意義了
代表資料本身在定量的尺度下
分佈的情形

 

用來表示定性變數的統計圖型可以用:
1. 點圖 (dot diagram)
在手邊沒有統計軟體時可以臨時用手畫一條數線
然後再把出現的數字一個一個標上去
算是相當直觀、克難的畫圖方式
例如下面這個例子
拉麵店針對地獄麻辣拉麵讓顧客評分(0~100分)
在顧客給分後就將點標上去
次數就往上加上去這樣
很容易能夠看出大部份人評分的落點

點圖 (dot diagram)  
※在excel製作點圖的方法我找到一個老外的 [YouTube教學影片] 蠻清楚的

 

2. 直方圖 (histogram)
直方圖也是品管七大工具之一
(一樣是改善前後各一張來比較用)
表示連續資料次數分佈的圖
一個長條就是每一固定區間內資料的次數
要注意的是:
-要分幾組比較好? (當然這受到資料筆數的影響~可以利用「2的冪次方法則」幫忙判斷)
-固定區間的組限&組界?

直方圖 (histogram)  
  

※畫直方圖需要先打開excel的分析工具箱,這邊有一個蠻清楚的中文教學 [YouTube影片]

 

3. 散佈圖 (scatter plot/X-Y plot)
散佈圖是針對成對兩個連續變數
例如下圖例子是今年初我的部落格人次紀錄
每天紀錄(Word頁碼與目錄教學人次, Blog每日總人次)的成對紀錄
像這樣成對的資料在座標上標示起來

在統計的應用中
一般會把這兩個變數其一當作是自變數(X)
另一個當作是依變數(Y)
找出自變數與依變數的關係
所以也稱為X-Y plot

散佈圖 (scatter plot/X-Y plot)  

如果這些點越長得像一條線的話
也代表這兩個變數是正向影響
比方Word那篇人次越高、我的部落格人次也跟著越高

 

 

 

 

  

belleaya (愛) 發表在 痞客邦 PIXNET 留言(1) 人氣()


留言列表 (1)

發表留言
  • 訪客
  • Hello, thank you sooooo much for your sharing. Really helpful and can't wait to see more posts about statistics!!!
  • Thank you!

    belleaya (愛) 於 2014/08/23 22:52 回覆