:::

區間估計不用再查表了!信賴區間計算器 / Confidence Intervals Calculator

簡報1

區間估計是學習推論統計的第一道關卡,但是計算區間的門檻卻相當的高。計算區間估計時,要知道資料適用的分佈、各種分佈對應的誤差範圍的計算公式、並搭配z分佈t分佈的查表等技巧,儘管如此,這些步驟其實也只是機械化的動作已,用人腦來算其實是挺沒效率的一件事情。

因此,我參考深入淺出統計學的公式與範例,以JavaScript製作了一份純網頁版本的信賴區間計算器。當任何研究使用想要從樣本來推估母體參數時,都可以用這個信賴區間計算器來計算母體參數可能位於的區間。



信賴區間計算器 / Confidence Intervals Calculator

使用說明 /  Instruction

此信賴區間計算器有兩種模式,請根據資料類型來選擇。

image

第一種模式是估計母體平均數的區間,適用於抽樣資料有很多筆連續數值的情況。此模式能使用兩種分佈來計算,當樣本數量未達30時適用於小樣本的t分佈,而樣本數量在30以上時,根據中央極限定理,適用於常態分佈。

image

另一種模式是估計母體比例的區間,適用於樣本為一個介於0到1之間的比例值,還需要輸入樣本的數量。這種比例資料適用於二項分佈,不可與常態分佈、t分佈混為一談。

image

此外,信賴區間計算器中還可設定信心水準,以百分比表示。在推論統計研究的共識中,大多是為90%、95%、99%等三種數值。信心水準越大,估計出來的區間越有可能包含母體參數(不管是平均數或比例),但區間上限與下限的範圍也會越大。

最後是顯示報表的小數點位數。預設採用的是小數點後第三位四捨五入,跟SPSS一樣。


試算範例 / Example

以下我以兩個試算範例來說明信賴區間計算器如何使用。

估計母體平均數的信賴區間 / How to estimate confidence intervals of the population mean

口香糖工廠要估計口香糖產品的母體平均值,並希望找到95%信賴水準之下的信賴區間。

品管人員抽樣10顆口香糖,秤重之後如下:

COPY
POPUP
0.7
0.895
0.305
0.4
0.3
0.735
0.115
0.1
0.9
0.55

接著我們來到信賴區間計算器,進行以下設定:

  • 模式:多筆數值(常態分佈/t分佈)
  • 輸入數值資料:將上面的樣本重量輸入進去,一筆資料一行。
  • 母體分佈模式選擇:根據樣本數量選擇。在此例子中,因為樣本數量小於30,程式會選擇t分佈來估計。
  • 信心水準百分比:95%

image

設定之後的畫面如上圖。

image

數值設定之後就會立刻計算結果,分析結果報表如上圖。從此表來看,母體平均數為0.5,而最後一句話「分析結果顯示,(0.285, 0.715)有95%的機會包含母體平均數」就是區間估計,其中0.285就是區間估計的下限、0.715則是區間估計的上限。至此計算結束。


估計母體比例的信賴區間 / How to estimate confidence intervals of the population proportion

民意調查想知道某候選人的母體支持度,以及其在95%信心水準底下的信賴區間。在抽樣1110位民眾之後,計算樣本中支持某候選人的比例為58% 。在點估計的層次來看,此樣本比例可視為母體比例。但如果要計算信賴區間,則還需要進行更進一步的計算:

接著我們來到信賴區間計算器,進行以下設定:

  • 模式:單筆比例(二項分佈)。因為支持率是比例,適用於二項分佈。
  • 樣本比例:0.58。這裡不是用百分比,請用介於0到1的比例來呈現。
  • 樣本數量:1110
  • 信心水準百分比:95%

image

設定之後的畫面如上圖。

image

數值設定之後就會立刻計算結果,分析結果報表如上圖。從此表來看,點估計的母體比例為58%,而最後一句話「分析結果顯示,(55.1%, 60.9%)有95%的機會包含母體平均數」就是區間估計,抽樣誤差為2.9%。至此計算結束。

image

附帶一提,如果此資料以「支持=1、不支持=0」的多筆數值輸入到「多筆數值」模式中(如上圖),那麼計算結果仍會跟上述用單筆比例的方式計算相同。


參考資料 / Reference

封面

信賴區間計算器的公式主要來自於深入淺出統計學。這本書是我目前看過統計教科書中對區間估計講解最完整的例子,說明了許多教科書沒有釐清的資料分佈區別。參考書目如下:

Griffiths, D.(2009)。深入淺出統計學(楊仁和譯)。臺北市:美商歐萊禮公司臺灣分公司。(ISBN:978-986-6840-35-7)

候選人支持度的例題來自於林柏佐老師的「信賴區間與信心水準的解讀」,信賴區間計算機的結果與其文中的例子結果相符。

程式中查詢z分佈c值的函式來自於「How do I convert probability into z-score」中的Gregory解答,查詢t分佈t值的函式來自於Robsteraniumstatistics-distributions.js」。在對照z分佈與t分佈機率表之後,兩者函式運算結果都與查表結果相符。


小結 / In closing

區間估計的統計技術從20世紀中期就已經發展成熟,而在今日在大學的統計相關課程中則是推論統計的第一道關卡。儘管如此,許多研究在估計母體參數時,仍然只有用到點估計的層次,沒有到應用到區間估計。例如在進行學生的學業成績調查時,大多研究僅止於計算成績的平均數。若此時應用區間估計,加入「在95%的信心水準之下,學業成績母體平均數會落在(下限)與(上限)之間。」的分析。這樣子更能顯著提升研究的層次。

缺乏區間估計的計算工具

既然區間估計這麼好用,為什麼大家都不做呢?我在想理由可能是「沒有好用的工具,不想用手算」。就如開頭所言,區間估計的計算手續很麻煩。不僅計算式繁雜,還要搭配查表。其中一步算錯,後面就整個都錯,手動計算的過程實在是很令人灰心。我在大學學統計的時候也是很反對手動計算區間估計,由衷對於這種制式化的動作還要人手計算感到反感。直到現在,學習統計的學生也仍然對區間估計感到不解,而手動計算容易出錯的結果,也會讓教學的統計老師覺得很洩氣。

而統計界大家最喜歡的SPSS雖然也有區間估計,但大家學到的卻都是平均數差異值的區間估計(t檢定),反而不知道如何從樣本來進行母體參數的區間估計。這也是我撰寫這個信賴區間計算器的主要原因之一,希望能夠讓區間估計技術更容易使用。也算是了了大學時的心願:我就是不想用手算來計算區間估計啊。

區間估計的混亂

再來講區間估計另一個問題:計算區間估計的混亂。

許多信賴區間的計算雖然都名為區間估計,但背後的計算方式卻差非常多。我得特別強調,差非常非常非常多,不是所有的區間估計都用同一套算法。這個差異取決於抽樣樣本的資料性質,以及資料背後的資料分佈。

大部分的統計課本都會先從已知母體參數的情況下,以常態分佈(z分佈)開始介紹區間估計的計算。然而,我認為這意義並不大。在信賴區間計算器中,我刻意忽略了「已知母體是常態分佈」(除非是樣本數超過30以上,符合中央極限定理的情況)、「已知母體平均數」、「已知母體標準差」的這種前提假設。通常在實務應用上,我們並不會知道母體的平均數跟標準差是多少,這種情況大多只是統計課本跟考試才會出現的例題,並不實際,所以我做的信賴區間計算器並未納入這些考量,僅從樣本統計量來計算信賴區間。

另一個問題在於大多數區間估計並沒有詳細說明「多筆樣本連續數值算母體平均數」跟「單筆比例來算母體比例」的這兩種情況,前者適用於z分佈或t分佈,後者適用於二項分佈。兩者在計算區間估計的時候做法差別相當的大,卻很少看到區間估計教學有指明這一點。有些區間估計教學會以常態分佈開始教起,但這時候適用的資料僅是多筆連續數值的情況,並不適用於單筆比例。有些區間估計著重於「候選人支持度」的區間估計,這個資料是比例數值,適用於二項分佈,但教學中大多寫得跟前面的常態分佈一樣,計算公式卻並不相同,令學習者帶來許多困擾。

image

我看到現在,也只有「深入淺出統計學」這本書有講清楚這兩者之間的差別。雖然深入淺出系列價格很貴,但的確有它的價值在啊。

理論派的堅持?

話說有些硬派理論統計學家蠻不齒這種簡單使用的計算器,計算器只求結果、讓使用者忽略背後理論的做法,簡直就是失去了統計的靈魂!不過,老實說,推論統計背後的理論其實已經多到難以全部吸收的程度了。姑且不論信賴區間的計算公式,z分佈跟t分佈的查表、95%信賴水準的制定、中央極限定理的證明等等眾多理論才能建構出區間估計的基礎,而這些背後理論並不是非統計主修的課程所能講得完的程度。

換個角度來看,放輕鬆點,何必這麼嚴肅?我個人看來,享受推論統計能夠帶給我們的好處,比起搞懂背後的理論來說更加重要。在開車的時候,即使我們搞不懂車上使用了多少顆螺絲,我們還是可以享受車子帶給我們的便利性。如果對車子很有興趣的人,自然而然就會想要進一步去研究車子的構造、甚至改良車子本身。師父領進門,修行在個人,不就是這樣嗎?

好啦,其實我也只是寫個信賴區間計算器,方便未來使用而已,不知不覺就閒聊了一堆事情。那我們這次就閒聊到這裡囉。

總共25 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

  1. 回覆刪除
    回覆
    1. 回覆刪除
  2. 回覆刪除
    回覆
    1. 回覆刪除
  3. 回覆刪除
    回覆
    1. 回覆刪除
  4. 回覆刪除
  5. 回覆刪除
    回覆
    1. 回覆刪除
  6. 回覆刪除
    回覆
    1. 回覆刪除
  7. 回覆刪除
  8. 回覆刪除
    回覆
    1. 回覆刪除
  9. 回覆刪除
    回覆
    1. 回覆刪除
    2. 回覆刪除
    3. 回覆刪除
  10. 回覆刪除
    回覆
    1. 回覆刪除