放對假就有票?

政治經濟學研究方法實證

前有文章指出,經過統計分析的結果,「當縣市長做出「正確」的決策時,台灣民眾會顯著地以選票作為回報。」真的是如此嗎?我們從知了新聞上下載的資料試圖複製這篇的討論。從我們重製的表看來,迴歸係數是 1.982,但這代表每多放對一天假,得票率就可以增加 1.98% 嗎?


圖 1: 放對假天數和得票率變化關係。黑色的線是依照這些點畫出的回歸線,深灰色的部分是最有可能涵蓋到那條線的區間(95%),一個縣市有可能出現兩次,因為在資料中有兩次選舉。

迴歸分析是一套強大的工具,但因果關係沒有那麼容易證實。我們重製了該文的表,並另外畫了幾張圖。乍看之下的確好像有那麼點關聯,似乎多放對假就可以獲得較高的得票率。這樣的分析在統計上犯了「遺漏變數」的謬誤。當我們看見溼滑的地板還有路人撐起雨傘,我們不會說因為大家撐雨傘所以地板變濕了。他們都是由下雨造成的。

圖 2: 依照政黨關係加上顏色更清楚

同樣的,颱風假放得對和投票率增加,有沒有其他可能性呢?我們在原本的迴歸分析裡面加上現在最夯的「國民黨」變數。我們可以看到控制是否為國民黨之後,那 些變數通通都不再顯著了。我們再切成一些圖來看,可以發現同樣是國民黨的縣市,我們可以看到放對假和得票還有微弱的關係,但如果是綠營這邊,你多放對假和得票率甚至是負相關。

圖 3: 只看國民黨執政的縣市。黑線和灰色區塊和前面有一樣的詮釋。

圖 4: 只看民進黨執政的縣市。灰色的區塊變得非常寬大。一方面樣本數太少,另一方面關係不太明顯,所以看起來是這個樣子。

相關性不等於因果關係。

或許我們看到這樣資料的模式原因是國民黨輸到脫褲,所以國民黨要亂放假來拯救自己(國民黨縣市和亂放假有微弱的正相關)。但真正重要的結論是:在這樣稀少的樣本下我們很難陳述有趣的故事,另外就算我們看到相關性,也要記得因果關係沒有那麼單純。

楚門

楚門

If his was more than just a vague ambition, if he was absolutely determined to discover the truth, there is no way we could prevent him. 如果他有貫徹追尋真理的決心,我們沒有任何辦法阻止他。