社會科學幹嘛要量化?

計量經濟學研究方法實證

還記得高中公民課的經濟學,都是左畫一條直線叫需求,右畫一條直線叫供給,不管題目出的是什麼,答案永遠都是這兩條線的交點。上了大學,直線變成曲線,獨佔寡佔越來越複雜最後只好背答案。看看白經濟目前介紹過的經濟學議題,從村上春樹為什麼拿不到諾貝爾獎,到咖啡豆要怎麼賣,怎麼這些當年背得要死的答案都還沒出現過?另一個相關但不太一樣的問題:拿經濟學套用在這些題目,到底是有什麼用?人與人之間的互動比水分子複雜,但當我們連天氣的預測都不一定會準,拿著經濟模型去研究人類有用嗎?

這兩個問題都指向一個目前已經在白經濟上出現過,但我們還沒說明的東西:實證研究。實證研究其實就是拿資料去驗證關於這個社會的假說。過去談到的實驗統計、以及自然實驗都是運用資料,藉此分析一些雖然沒有畫供需線,但仍需要考量誘因對人的影響的經濟問題。然而在拿資料給電腦跑之前還有一個重要的步驟,也就是要釐清:假如有一份完美的資料,我們有沒有辦法用這份資料回答我們我們所想的問題?1


想模型就是在說故事

還記得上一篇〈數學經濟,豆漿油條〉裡談的「模型」嗎?這個聽起來有點神祕的玩意兒,其實就是用一個故事來描述一些經濟學家觀察到的現象。一個好的故事能讓我們更認識這世界運作的機制,同時也要是個可以檢驗的故事。過去我們總在談個別主題的故事,比如死刑央行政策環保稽查等,這次我們換個方向,來談「說故事」這件事。如果您從上次考完期中考(不管是兩個月還是二十年前)後就再也沒看過數學這種邪惡的東西,一行式子就讓您腎上腺素飆升、反射性的想要 Page Down 跳過,別急別急,我們會一步一步拆解。以下只是個胡謅的模型,用途是要拿來示範社會科學「說故事」這件事,沒有特別要解釋什麼,也沒有經過什麼精密的推導。而這個模型,就只是「一條線」:

你看,真的就是一條線吧!還記得國中數學老師都說,看到一個坐標軸上畫的圖,首先要看兩個軸是什麼。既然這是個胡謅的模型,基本上我要說這是什麼都可以。為求理解方便,就先塞一個可能的例子。我們就把縱軸當作「每個月上凱道次數」,橫軸則代表鄉民對於社會上的變動反應的傾向,姑且稱之為「不爽值」。不爽值是個介於 0 和 1 之間的「參數」;這個聽起來有點假專業的字眼,其實就是想說這個「不爽值」對每個人來說是固定的,並且會透過我們的模型(也就是這條長得像海豚的線)決定觀察到的結果。閱讀這模型的方法很簡單:先選定橫軸上的一個位置,向上垂直移動直到碰到線,然後看看左邊對應的上凱道次數。不爽值如果在 0 到 0.3 間,那麼隨著不爽值越高,上凱道次數就越多。過了 0.3 以後一直到 0.7 之間,可能是因為光是平日加班爆肝就快升天了沒有多餘的力氣上街頭更多次,最多就上凱道 15 次。如果不爽值超過 0.7,那麼可能就已經進入一個哀莫大於心死於是放棄治療的境界,上凱道次數反而開始下降。

就這麼簡單,這就是一個「模型」,但就是個掰出來的模型。因為長得像海豚 (蛤?),接下來都叫它海豚線好了。在這模型裡有兩個成分,一個是多事的經濟學家可以觀察到的「上凱道次數」,另一個則是觀察不到、但會透過這條「海豚線」決定上凱道次數的「不爽值」。這個不爽值除了會決定每個月凱道夜市開張的次數,同時因為反映了鄉民有多容易被政府挑釁 / 招安,可能也會透過不同的模型去影響青年投票率、上 PTT 爆卦等行為,因此對於和政治相關的各路人馬來說是個重要資訊。為了讓簡單更簡單,我們先假設每個人的不爽值都一樣。經濟學家的研究目標,則是與剛剛「不爽值→海豚線→上凱道次數」的方向相反,要用「上凱道次數→海豚線→不爽值」的順序,透過上凱道次數往回推算出「不爽值」。


但模型「有用」嗎?

假想這位經濟學家在寫了落落長的證明後算出這個長得像海豚的模型,在他的研究框架裡上凱道的次數真的就是由這條海豚線決定的。然而看看這條海豚線,我們就會發現那位經濟學家的任務也許根本就不可能。假設上凱道次數是 5,那麼根據海豚線,不爽值就等於 0.1,簡單輕鬆沒煩惱。如果上凱道次數是 10 呢?那麼不爽值可能是 0.2,也有可能是放棄治療的 0.95。如果上凱道的次數是 15,那麼不爽值從開始爆發的 0.3 到瀕臨崩潰的 0.7 都有可能。如果超過 15 次呢?那麼就代表海豚線這個模型是錯的,因為海豚線的預測是不管不爽值有多大,上凱道次數都不可能高於 15。

所以即便不討論模型是錯的這種常見的狀況,就算這個經濟學家真的狗屎運,剛好他提出的海豚線模型真的是對的,他還是只有在不爽值和 0.1 相近的時後才有可能知道答案。剩下的狀況,不是可能的值一大一小,就是有一整段的區間都有可能。假設今天政府想要推動某個具爭議性的政策「伏冒半分鐘」,擔心的不是上凱道次數,而是另一個也受不爽值決定的結果「菜市場會被攻佔幾天」。於是政府找來經濟學家問說:「根據目前的資料推算,人民的不爽值大概等於多少?如果推行伏冒半分鐘的話,菜市場會被攻佔幾天?」結果這經濟學家回答:「過去一個月人民上凱道 10 天,不爽值有 0.2 和 0.95 兩種解,所以菜市場也有不會被攻佔、以即被攻佔一個月兩種可能的結果。」這個經濟學家大概接下來就會被賞兩顆籃球丟進台灣海峽。

然而沒辦法,現實世界就是這麼有趣。有時侯社會就是長成就算你是諾貝爾等級的大師也摸不透的樣子。上面那個例子還不是最悲慘的;用同樣的例子來看,讓經濟學家晚上做噩夢的研究主題大概會長這樣:

如果這只是個模型,那就是個沒用的爛模型。在這模型裡,人民每個月上凱道次數從 0 到 689 次,對應的不爽值永遠都是 0.4。而一個月最多 31 天,最好是有可能觀察到超過 689 次凱道夜市,因此也無法透過統計學的方法來證明這模型是錯的。這模型一則無論資料(上凱道次數)是什麼,答案永遠都一樣;二來是根據自身邏輯永遠都不會錯。最爛的模型大概就是這兩個特徵齊備。這次的形狀比較像經典手機遊戲貪食蛇,接下來都叫這條線貪食蛇好了。2

另一種可能的情況是,也許這世界就真的是長這樣。有些人反對量化社會科學、認為強調量化的經濟學沒有「以人為本」、註定是垃圾進垃圾出的統計遊戲,不可能有任何用處;他們的想法其實也是個模型,那就是這世界的運作方式就像這條貪食蛇,或是其他類似的機制。如果這世界上所有的社會機制都長這樣,那麼經濟學家就真的可以打包回家了。不過從目前為止經濟學帶給我們的知識看來,現實世界其實是兩種狀況都有:有些問題就是不管你怎麼算仍逃不出貪食蛇的肚子,但也有些狀況是可以從海豚的弧線回推出一些社會的機制。量化不是唯一的真理,但有些問題透過量化的方式,可以稍為增進對人與人之間的互動的認識。


愛吵架的經濟學家吵的就是這個(咦?不是凱因斯 v. 海耶克嗎?)

然而模型要怎麼建立?經濟學談的是面對誘因下的選擇。有些選擇是經濟學家擅長寫模型講故事的,譬如買賣、就業、上大學等,但如果是像之前介紹過的制度對國家未來的影響呢?那篇經典研究裡的選擇是殖民者在挑殖民地,以及決定殖民地的管理方式。經濟學家要寫個殖民者模型也是可以寫,但大概很難像「變貴了就少買一點」有個清楚而有說服力的故事。這就扯上了經濟學界過去十餘年吵得最兇的辯論:結構計量 (structural econometrics) 與無模型計量 (atheoretic econometrics,有時也稱作 reduced-form) 間的對決。

如果你以為愛吵架的經濟學家還在吵新古典和凱因斯,那麼你的資訊可能就有些落後了。不只研究貨幣、經濟成長、通貨膨脹等主題的「總體經濟學家」永遠都在吵架,而且還可以吵到結束十幾年了大家都以為他們還在吵(不過當然沒有不吵,只是換吵下一個主題),研究消費、教育、健康、犯罪的「個體經濟學家」也很愛吵。上面提到的「結構計量」派個體經濟學家認為經濟學的實證研究應該要先寫好模型,像是一條海豚線,然後根據資料來檢驗模型是否成立,以及用這模型推算一些社會上的機制,比如不爽值。

另一種無模型計量的方法,則是不去管背後的機制的曲線到底長得像海豚海狗還是海象,直接推算一些個別狀況的特徵。回到海豚線的例子,假想政府推動「伏冒半分鐘」後會改變不爽值與上凱道之間的關係,將海豚線從原本的藍線移到紅線。這時候可以觀察到的是上凱道的次數上升了,而原本的不爽值作為鄉民上街頭的傾向並沒有變。

做無模型計量研究的人通常好奇的是政策對一些可以觀察的結果的影響。在這個例子,如果這個未知的不爽值實際上位於 0.2,因為海豚線由藍翻紅(怎麼聽起來好像電視一百多台的在講股票?),上凱道次數就會由 10 上升到 15。無模型計量經濟學所做的,就是想辦法在研究中確保沒有除了伏冒半分鐘以外的因素在干擾觀察到的結果 3,然後拿 15 減去 10 得到「給定外在條件不變,伏冒半分鐘使上凱道次數上升 5 次」的結論。因為他們沒有先算出海豚線長什麼樣子,自然也沒有不爽值這個參數要去算。如果是研究結構計量的經濟學家,他們的工作就是先在藍線的情況下推測不爽值,然後試著用不爽值預測伏冒半分鐘會讓人民多上幾次凱道。


以上這是個極度簡化的假想情況,實際上自然沒這麼簡單。如果要舉一個經濟學家真的會去算的例子,那麼可以回到不少讀者關心的基本工資。在基本工資、稅制和其他可能會影響工時、薪資的政策裡,有個關鍵數字被稱為「勞動供給彈性」。這個聽起來終於比較像會出現在經濟學課本裡的玩意兒,可以反映勞工在工時和就業的選擇上對政策反應會有多大。舉例來說,假如改變勞健保在薪水裡的計算公式,每個越多扣一點,到底是會讓人覺得工作賺得比以前少,只好爆肝爆更兇呢?還是因為多做幾個小時賺的錢反正會被扣光光,乾脆把時間省下來拿去把肝養好?顯然兩種狀況都有可能,但如果能知道「勞動供給彈性」這數字有多大,就能判斷對整個經濟而言,哪一個方向的效果會比較明顯。而計算勞動供幾彈性的方法就是透過模擬經濟學家擅長寫模型(講故事)的消費和工作等,去拼湊出到底勞工比較傾向「輪班救台灣」還是「不爽不要做」。無模型計量也許可以給出「輪班星 5 年前調漲基本工資後整體工時沒有變化」這樣的答案,但背後的邏輯比較不適合用這答案去推測「如果輪班星今年調漲所得稅 1% 會有什麼影響?」相對的,如果知道勞動供給彈性這神奇的數字,只要算出這些個別政策會讓勞工每天工作後口袋裡增加或減少多少錢,就能大致推算兩個政策的影響。麻煩就在於,要算這數字實在是霹靂無敵困難啊QQ

不過做研究也不是在這兩種方法之間二選一,不少研究其實是介於這兩者之間。這只是要介紹當社會科學家透過量化方法在分析社會現象時,腦袋中設想的題目大概是長什麼樣子(至少不能長得像貪食蛇)。你說這兩種看起來就是不一樣的研究啊到底是在吵啥?說真的呱牛我也不知道。兩種研究只要能嚴謹的執行、不過度解讀結果,在呱牛看來都是可以參考的研究。有些人不喜歡結構計量的原因是推導出一個模型需要很多假設,然而經濟學界現在已有不少研究顯示,即便是不使用模型,單單假設這世界的運作機制長得不像貪食蛇,需要的假設也不會比推導所模型使用的更「貼近現實」。然而做研究總是離不開假設,回到〈數學經濟,豆漿油條〉裡牛頓運動定律的例子,這種國中理化的題目也需要假設均勻重力場。這個假設,有比「價格貴的時候我會少買一點」來得更接近事實嗎?顯然兩者都是錯的。衡量假設對研究的價值,不在於越少越好,或是越貼近事實越好,而是這些假設能不能幫助我們更認識我們想研究的現象。


結語

回到有沒有「以人為本」,那就是模型的好壞的差別了。這裡舉例的海豚和貪食蛇都是我胡謅的,沒有以任何東西為本。好的模型就是建立在對人的觀察上。經濟學最有力的模型大概就是價格的影響:給定其他因素不變(比如說沒有剛爆發食安風暴),「同樣」的東西價格越貴,你就會買少一點。要不要相信理論是每個人自己的決定,但你如果不相信地心引力,往上跳後終究還是會在幾秒內落地。不相信價格對人的影響呢?如果你明天去跟老闆要求加薪,不給加的話就辭職;給定相同的服務(你賣肝)漲價(加薪),你覺得老闆的反應會是什麼呢?如果要說用量化的方式去研究人沒有「以人為本」,另一個可能的解讀是「結果對人沒有助益」。後者的解讀每個人會有些差別,那就是個別經濟學家在選擇研究主題時自己的取捨了。

量化的社會科學是量化霸權下的統計遊戲嗎?這個問題由呱牛這樣的經濟學學徒來回答,答案當然會是斬釘截鐵的「不是」。這篇嘗試用持平的觀點(也許不是很成功),來告訴大家到底經濟學家算了老半天,背後認定「可以算」的依據是什麼。有些時後(比如這社會的機制長得像貪食蛇)怎麼算都是沒有用的,有些時後會得到模糊的答案(比如可能有兩種以上的解的不爽值),有些時後,則能給我們一些能加以檢驗、實際運用的答案。數字不是回答問題的唯一方式,但有些問題,用數字來回答會有一些更進一步的觀察。


本篇舉例感謝 Martin Browning,另經作者加以變化、延伸。

首圖照片取自 Irish Typepad (CC BY-NC-ND 2.0)


  1. 經濟學家的江湖行話稱這主題為 identification。平常有在做實證研究的人不一定看過這篇談的內容,但這是一種描述實證研究在做什麼的方法。

  2. 這種可能看起來有點荒謬的論點其實相當常見,各種「全部都是XXXX的錯」的宣言都可算在這種。XXXX 可以代入「階級複製」、「資本主義」、「民粹」、9.2 等等。這些有的可信,有的則否;當然這也有可能是事實,只是如果事實真的長這樣,那就很難檢驗這宣言的真偽。

  3. 一個技術性的關鍵是這件事情(俗稱 exclusion restrictions)無法透過統計檢驗是真是假,只能提供證據說明可能可以排除哪些干擾的狀況。偏偏這件事又是整個研究成立所需的必要條件。有些方法可以檢定「給定部分的 exclusion restrictions 成立,是否所有的 exclusion restrictions 皆成立」,但這仍不是直接的檢驗。

呱牛

呱牛

他撐著一根姑婆芋,走在龜裂的黑路,回到檜木林的家。撥開遮洞的蕨葉,嗅一嗅洞口,仍然只有自己的氣味。掛上包裹,勉強地排便、磨牙。呵了口氣,天亮中睡去。雨繼續在夢裏在森林裏落著。 - - " 小鼯鼠的看法 ",劉克襄