伊可納米的實驗室

實驗經濟學研究方法現場實驗

許多學經濟的人,都堅稱自己學的是「社會科學」。但一般我們對科學的印象,好像都要做些實驗,弄些理論的推導。經濟學家們倒是完全不缺各式各樣的理論,但是要怎麼證實這些理論呢?難不成要把真人當成白老鼠抓來做實驗? ……沒錯,就是真的有些邪惡經濟學家把人拿來做實驗。到底邪惡的經濟學家們為什麼需要做實驗呢?經濟學家們又是怎麼對人們上下其手做實驗的呢?在這篇文章中,將會非常簡單地介紹現代經濟學家們使用的實驗方法。


比薩斜塔與能力分班

說到做實驗,大部分人的印象應該都是:穿著實驗衣,手上拿著燒杯試管倒來倒去,然後不小心弄出個大爆炸。但我們還是應該要搞清楚,真正的「科學實驗」到底要做的是什麼?為了說明,我們就搬出傳說中的近代科學之父伽利略,傳說中曾經做過的自由落體實驗當作例子。

在古希臘時代,亞里斯多德在他的《物理學》當中,認為「重的東西,從高處落下的速度會比輕的快」。這樣的科學理論,在一千多年間一直被當成真理。但伽利略在他的書《關於兩門新科學的對話》中,提出了一個思考實驗質疑亞里斯多德的理論。(傳說中)他為了證實他的反駁是正確的,拿了兩個不同重量的球,到比薩斜塔的頂端,讓球自由落下。結果發現,兩顆球實際落下的時間,竟然是幾乎相同的!同時,他也利用數學工具,推導並證實了「物體從高處落下的速度,在阻力很小幾乎可以忽略的情況下,會與移動距離成正比」。1

在經濟學的世界裡面,我們有一些解釋人類行為的理論。從最根本的原則,例如:人會對誘因產生反應,到大家耳熟能詳的市場供需模型。高深一點的,有人會試著解釋總體經濟循環;或者是利用玩家之間的互動,建構出來的賽局模型。這些理論或是模型,都是希望刻畫出,影響人類行為,最關鍵的因素是什麼。

但是,我們要怎麼知道這些理論到底是不是真的正確呢?舉例來說,我們可能關心以下的問題:

能力分班和常態分班,究竟哪一個分班制度對學生的學習成效比較好?

等等,這為什麼算是經濟學問題?首先,這個問題背後可能真正要問的是「同儕對一個人學習行為與成效的影響」。你可以考慮看看:假如你今天跟旁邊坐的全部都是王聰明,或是旁邊都是葉大雄,不管是好是壞,你的學習表現很有可能都會受到一些影響。在這個例子當中,你願意花多少精神讀書,或是你的讀書效率如何,都會受到外在環境,也就是誘因的影響。

在我們把問題界定清楚之後,我們就可以開始來做一些可能的假設。常常聽到有些人宣稱,把程度好的學生和程度低的學生放在一起,不但不會拉高程度低學生的學習意願和成就,反而讓好學生跟著一起沉淪。我們試著把這個現象,拉進我們的問題框架,試著做出其中一個假設:

在混班以後,原先成就較好的同學,他們的學習成果與學習情形,會受到低學習成就的同學的負面影響,使得全體的學習成果平均下降。

當然,我們也會聽到以下這種假設:

在混班以後,原先成就較差的同學,他們的學習成果與學習情形,會受到高學習成就的同學的正面影響,使得全體的學習成果平均上升。

一時之間,好像還真的不太確定孰是孰非。到底這兩個假設之中,哪一個是對的呢?我們好像需要想一個方法來證實一下。


都是常態編班惹的禍?

這時候,有人可能就會舉手:

我知道,我們分別去找常態分班的學校,以及能力分班的學校,看看這兩間學校的學生,成績是不是真的有差別。

這個點子乍聽之下很不錯。且不論台灣現在到底是不是還有隱藏的能力分班,如果我們真的藉由這些資料,得出「能力分班比常態分班好」的結論,那麼想必應該是教育方法上的大革新。我們能從生活中聽說一些例子:

有一些私立學校,他們會設立一些特殊班級,讓程度比較好的學生進去就讀;而這些私立學校,在學生升大學的成績表現上,常常能夠超越許多同級的公立學校。

如果這個案例是真的,那我們完全就應該推動能力分班分校,最好放牛班跟資優班從此中間隔道牆老死不相往來,想必能將台灣的競爭力推向新高峰。但是等等,這個資料的不同,真的只是代表學校分班制度的差異嗎?

在我們的例子當中,這些被能力分班的學生,事實上也是私立學校的學生。這些學生之所以會被能力分班,背後反映的,其實是家長的教育選擇。一些非常關心教育的家長,把學生送去能力分班;和一些沒有選擇私校,把學生送去公立學校的家長,兩群人本來就有非常巨大的不同。另外,兩間學校的師資、環境等等,可能也有許多差異。在這麼多的變異之下,我們似乎很難輕易宣稱,到底「能力分班」,究竟跟學生的表現之間有沒有直接的因果關係。


穿上你的實驗室白袍,我們來玩電腦

回過頭來思考我們真正想回答的問題:「同儕對一個人學習行為與成效有沒有影響?」如果把它對應到我們想要的假設,其實也就是問:

給定其他條件都相同,不同的分班方式,會不會影響學生的學習行為與成效?

因此,要怎麼回答這個問題呢?這時候,我們應該要塑造一個情境,使得「所有條件都相同,不同的只有同儕是誰」。如此一來,假如學生的成就真的有改變,那麼改變必定是來自分班方式的不同,而不會是其他原因了!

為了回答這個問題,我們可以設計這種情境:

我們請一群人進到實驗室,並且在開始的時候指定他們有不同的能力指標。面對不同的能力指標,他每投入一單位的成本,可以反映出的工作成果也會因此不同。同時,我們也設定:每一個人可以透過付出另外一些成本,增加全部人的工作成果。每個人的報酬將會依據自己的工作成果而定。
在這個狀況下,我們使用不同的分組方式(初始狀態相同的在同一組;或是不同初始狀態的混成一組),讓大家開始互動。經過幾輪之後,看看每個人決定付出的成本,以及每一組的成果,哪一些是比較高的。

這一個情境設計,捕捉了幾個(設計者認為)影響同儕效果最關鍵的因素;同時,透過只改變分組方式,來確認分組方式與努力投入與成果之間,到底是不是真的有因果關係。現在這樣的實驗,通常會在電腦實驗室中進行,所以我們也會稱他為「實驗室實驗」(laboratory experiment)。當然,受試者和實驗者通常是不需要穿實驗衣的,電腦也不會突然爆炸。在這邊的實驗室,指的是一個高度控制的環境,不會有其他我們不希望出現的變因,影響我們想要找的因果關係。

但是你可以很輕易地質疑:「你這個實驗,到底跟我們的分班問題哪裡像RRRRR?」的確,這一個實驗設計,為了避免情境脈絡所產生的一些我們不希望出現的效果,特別把所有跟學習、分班之類的情境詞都拿掉了。比如說,學生可能只是因為討厭數學,所以不管我們怎麼設計分班形式,他的學習效果都會很差。如果有這種脈絡的影響,就有可能會使得我們的實驗沒辦法有效率地回答我們的問題(同儕效果對學習的影響)。問題是,這樣的實驗設計,真的還是在回答我們想問的問題嗎?

這一種抽象的實驗設計,通常是用來檢驗一些同樣「相對而言」比較抽象的經濟理論。但當我們要拿這些實驗結果,來解釋現實生活中可能發生的事件,確實解釋能力有時就沒辦法掛保證。

對於實驗室實驗來說,這個挑戰的確是有一些道理。就算我們加進了一些擬真元素(例如:真實的「學習」任務等),也不見得真的能夠捕捉實際教學現場上,可能出現的各種互動現象。因此,他可能不是很適合解決我們現在想回答的這個問題。(但如果想要回答[公共財捐獻的問題],實驗室實驗就很有可能告訴你一些有趣的答案。)2


整個城市,都是我的實驗室

在剛剛的實驗設計裡面,我們可能會質疑這不夠貼近現實,所以可能沒辦法回答我們的問題。那麼,我們就真的到最現實的環境:學校,來回答我們的問題就好了啊!所以,我們就可以設計以下的情境:

我們將一群學生,先按照初始能力區分出三組以後,再將各組隨機分成兩群。請這兩群學生,一群用按照能力分成高中低三班,另一群則是一班內同時有高中低三種學生。請這兩群學生,在一定的期間內,每天都在相同的時間,看相同的教學錄影帶,並且進行同樣的教學引導(例如分組討論)。同時,我們也在中間進行幾次測驗,來檢驗學生們的學習成果。

這看起來,似乎已經真的控制住所有我們希望控制的重要因素了!老師、時間、教材……唯一的差異,好像就只剩下抽籤決定的「能力分班」或「常態分班」了。

像這樣真正在經濟事件發生的現場,針對我們關心的議題,設計出經過隨機過程控制的情境,我們就會叫他「現場實驗」(field experiment)。透過現場實驗,我們可以在真實的環境下,看見真實的誘因,對人們行為產生的真實影響與後果。3

但是呢,我們回頭看看剛剛設計的實驗:又要請學生來上課,又要請他們看影片。花了這麼大的精神,但也不過是回答了一個小小的問題。如果我們今天要問的是「在工作場所中的同儕效果,對勞工的影響是什麼?」,那我們是不是又要另外做一組新的實驗?經濟學家到底要去哪裡生這麼多錢和資源,來做這些實驗呢?這的確是希望透過現場實驗回答問題的經濟學家們,會面臨的重大挑戰。


整個國家,都是我的實驗室(!?!?)

在這二三十年來,聯合國與許多國際組織,致力於找尋方法幫助所謂「發展中國家」,脫離經濟弱勢的貧窮循環。因此,在這些非洲或亞洲國家,有許多官方或非官方組織,投入了大量的資源,希望能夠協助當地人民改善生活條件,或是補強人力資本等等。

對於這些組織,他們雖然有許多經費或資源,但卻不見得知道:這些資源是不是妥善被運用到真正需要的刀口上,還是被任意扭轉到其他我們不想要的地方。這個時候,就是許多經濟學家們可以出手的時機。比如說:為了增加人口識字率,我們可以派遣志工到當地進行教學,也可以訓練當地的鄉民成為種子教師。這兩種方式,都有可能提升識字率,但是哪一種是有用的呢?4

最近剛剛出版中譯本的《窮人的經濟學》的兩位作者:巴奈吉 (Abhijit V. Banerjee) 和杜芙洛 (Esther Duflo) ,也是長期關注發展議題的實驗經濟學家。而他們所關注的主題,更是上天下地無所不包:從愛滋病、瘧疾的防治,到政府電子化的效能評估,或是學校經營效能以及微型信貸等,每一個主題都是非常貼近實際生活的重要發展議題。

這種經濟學家與國際組織的合作,除了順便幫助了發展中國家,同時也讓經濟學稍微脫離了抽象的概念推導,使我們能夠看見在實際的經濟世界中,經濟學理論是不是也還能順暢地運作。除此之外,現場實驗最有威力的地方,是在於他對具體政策的解釋能力。我們不必迂迴的抽象化一些東西,只要來隨機指定誰受到政策影響,並檢驗結果,就能知道政策的成效。白經濟曾經介紹過的一篇文章 洗滌黑心:名為抽籤的吐真劑 ,就是這種現場實驗的應用。


結語

經濟學的實驗方法,在研究因果關係上有巨大的優勢。但也正是因為實驗方法的高度控制,有一些經濟學家對實驗的研究成果,仍抱持著懷疑的態度。比如說,如果想要問「嚴刑峻法能不能有效減少犯罪?」,我們顯然就幾乎沒辦法設計相關的現場實驗:因為現實生活中(至少在台灣)根本就沒有能讓我們創造出「有嚴刑峻法」和「沒有嚴刑峻法」的不同世界!5 另外,除了嚴刑峻法之外,可能還有很多其他會影響犯罪數量的因素。難道為了檢討每一個因素,我們就要想辦法設計不同的差異嗎?即使我們真的設計出了這樣的實驗,這個實驗會不會因為控制了太多東西,反而跟現實生活差距非常遠(就算是現場實驗,也還是很有可能有這種問題!),讓我們沒有辦法把研究的結果實際運用到生活當中。

的確,每一種研究方法都有他的強項和缺陷。在我們面對不同的問題時,到底要用什麼樣的方法來解決我們的疑問,這就是研究者們需要腦力激盪的地方。當然,這篇文章裡面提到的實驗設計,大部分都是本文作者的憑空想像。如果你認為你有更好的實驗設計,或甚至其他的研究方法,可以幫助我們回答這些問題,也歡迎大家在回應區一起討論!


  1. 其實很多史學家懷疑這個比薩斜塔實驗的真實性;事實上,也有比伽利略更早的科學家真的做了這個實驗。但是關於伽利略的書,以及他用數學推導出了自由落體速度與距離成正比這件事倒是千真萬確。

  2. 現在經濟學術使用的實驗室,大部分都是設立在學校裡面的。所以,也有人會懷疑:你們的受試者跟普通的鄉民差那麼多,做出來的結果真的有意義嗎?首先,這個受試者群體的確不是普通人;但是如果我們想問的問題,是一些「就算是使用這些偏誤的群體,也不影響我們的結論」的問題,那這個挑戰勉強可以被解決。舉例來說,有一些跟複雜的賽局有關的實驗,如果連一些頭腦動得快的大學生都沒辦法回答出來,那就更不用問適用到其他人身上會有什麼結果了。
    不過,確實有一些問題,是需要用到特定的受試者群體來回答的。因此,有一些實驗會從研究者想要的目標人群裡面,招募受試者來參加。這樣的實驗,有些研究者會稱它操作實驗 (Artefactual Experiment)。
    另外,目前也有一些台灣的大學正在開始經營社會科學實驗室。目前在台灣最活躍的實驗室,是設立在台灣大學的 TASSEL 台灣社會科學實驗室 。作者也有一些念台大的強者朋友們,經常參加 TASSEL 的實驗來賺零用錢。順便推銷台大的讀者們,有興趣也可以當當受試者!

  3. 如果要更細地來分,現場實驗還可以簡略分為「限定的現場實驗」(framed field experiment) 和「自然的現場實驗」 (natural field experiment)。我們提出的分班實驗,比較接近前者;而杜芙洛等經濟學家在第三世界做的實驗,則通常是後者。限定的現場實驗,通常更重視控制各面向的變數;而自然的現場實驗,則是沒有(辦法)這麼細緻的控制。他們通常更著重在實驗的措施是不是真正隨機地施行了,或是有沒有其他的因素會影響控制變因的效果。

  4. 這一系列的實驗是由阿布杜爾‧拉提夫‧賈米爾貧窮實驗室 (Abdul Latif Jameel Poverty Action Lab (J-PAL))主持的。許多現在最知名的現場實驗經濟學家,都在這個實驗室中一起工作。

  5. 但其實是有可能做實驗室實驗的。在自私自利的經濟人 當中也有提到,提供處罰機制,可能會影響公共財提供實驗的結果。

RedHerrings

RedHerrings

從大西洋捕上來的新鮮鯡魚,以壯年的松木煙燻,再經高山岩礦醃漬,直到表面出現紅色花紋。獵戶們會利用燻鯡魚的陣陣香氣,將其散落在森林當中,訓練獵犬避開鯡魚的香氣,正確捕捉獵物的行蹤。