統計學的結果是寫醫學論文的一個重要根據,一個研究的結論通常都需要利用統計學的方法來解釋。在一個醫師的角度更是希望知道我所觀察的一組病患的特質跟另外一組病患有沒有不同。
這跟兩個小學生在抬槓時的情況很像:
甲說:我們班成績比你們好比較好,因為我們班有一半以上同學成績大於90分。乙說:才沒有呢,我們班有3個100分,所以我們班比較行。到底是那一班的程度比較好?
舉一個婦產科醫師常常碰到的例子:a組孕婦跟b組孕婦生產的週數是否有差別?假設我要比較有沒有妊娠糖尿病的孕婦其生產的週數是否有差別,這要如何比較?你可能觀察了93位之產婦,其中有17位有妊娠糖尿病。其平均生產的週數在沒有妊娠糖尿病之產婦(76位) 是35.2週,有妊娠糖尿病之產婦(17位)是31.6週。你可以下結論說有妊娠糖尿病之產婦其生產的週數比較小嗎?(因為31.6週比35.2週小)
如果這76位沒有妊娠糖尿病之產婦其生產的週數都比17位有妊娠糖尿病之生產的週數來得大,下這個結論應該是對的。但是通常不會有這樣完美的資料,沒有妊娠糖尿病之產婦其生產週數有一部份也會小於31.2週,這要如何是好?
一般我們比較兩組之數值,譬如像剛剛談到的班級成績或者是產婦之生產週數,我們是比較其平均值(mean)。如果像甲班之平均值如果大於乙班,就算是乙班有比較多的100分,我們仍然認為甲班之成績比乙班好。但是從統計學的角度上來看,怎樣才能說甲班之成績之平均值比乙班之平均值好呢?甲班成績之平均值95分比上乙班之94分,甲班就比較好嗎?乙班之學生會服氣嗎?
因為篇幅的限制我們先討論何為t test?甚麼是p value?受周宏學主任指示:要淺顯生動的解釋統計學,所以我們先拋開煩悶的數學理論。在甚麼狀況之下我們會說,有妊娠糖尿病的孕婦其生產的週數比較小或是甲班95分比上乙班之94分比較高。這就是統計學上要討論之p value。
甚麼是p value小於 0.05?統計學上我們說在p value小於0.05之下,有妊娠糖尿病的孕婦其生產的週數比較小。這是說如果這個實驗(或觀察) 重復做100 次 其中有95次以上有妊娠糖尿病的孕婦其生產的週數比較小,.如果這個實驗(或觀察)重復做100次其中有99次以上有妊娠糖尿病的孕婦其生產的週數比較小,那我們就說在p value小於0.01。
t test (independent t test)通常是醫師做統計之入門,此檢定為筆名為Student的Gossett所創建,此常常被稱為「學生Ttt檢定」 (Student's t test),用來檢定兩個標準差未知之常態分配的平均值是否相等,如果兩組資料(例如有妊娠糖尿病的孕婦跟沒有妊娠糖尿病的孕婦)都是常態分配 (normal distribution)之情況下,要比較其平均值(mean)是否有不同,可以採用t test。
目前比較常使用之統計軟體是SPSS:簡介一下操作程序:我們先建兩行數據:Line 1是GDM,line 2是生產週數把有GDM之產婦定義為0沒有 GDM之產婦定義為1。
點SPSS選項之analysis之Compare means中之選項之independent-samples T Test
:把生產週數(GAD)選入test variables,GDM選入grouping variable,Define group的按鍵按下去, group定義為0有(GDM)跟1(沒有GDM)。然後按OK鍵。
得到如下之表格先看Levene's Test for Equality of Variances在這邊是0.024 因為<0.05所以代表有GDM跟沒有GDM兩組之variances不相同所以pvalue要看Equal variances not assumed這一行,不過因為Equal variances not assumed跟 Equal variances assumed這兩行p value都是0.00 (代表 p value < 0.01)所以你可以說有GDM之孕婦其生產週數比較小。
比較兩組之mean(平均值)之大小當然不是全部都可以使用T test,當兩組數據之數目(case number)太小或者是其中有一組不是normal distribution的情況之下:可能就要使用無母數分析(non-parameter test),這就留待以後的篇幅再說明。
可以由T test來分析之兩組資料為必須是常態分配(normal distribution),如何說這兩組資料是否為常態分配(normal distribution)?一般來說如果資料之數目大於 30 以上,因為趨中定律我們認為是常態分配(normal distribution)。如果資料之數目如果小於30我們可以用One-Sample Kolmogorov-Smirnov Test來檢定,如果p 值>0.05我們認為是常態分配(normal distribution)。如何進行One-Sample Kolmogorov-Smirnov Test ?
在DATA之欄位按select case,選if condition satisfied:選
GDM=1。選analysis中之nonparametric test之One-Sample
Kolmogorov-Smirnov Test。把gad (gestational age of delivery)選入test variable。按OK得到table,two tailed之p value =
0.930>0.05,所以因為沒有GDM之 產婦case number > 30,而有GDM之產婦case number < 30但是因為是normal distribution,所以這一個統計可以用t test 進行。
|